生命体的遗传稳定性在于基因组,功能多样性在于蛋白质组。蛋白质组是由若干蛋白质所构成的集合体,其构成原则即其丰度整体分布规律,属于重大理论问题。贺福初院士所领导的军事医学科学院放射与辐射医学研究所、北京蛋白质组研究中心、蛋白质组学国家重点实验室及复旦大学生物医学研究院科研团队近来在多物种间揭示了蛋白质丰度的整体分布与蛋白质的进化、结构和功能存在规律性的相关,其成果于2012年3月9日在线发表于PLoS ONE。
自然界的各类现象都有其制约规律,生命体的表征也不例外,蛋白质作为生命活动的关键执行者之一,其重要性不言而喻。蛋白质组学研究表明细胞内不仅表达数千至数万种蛋白质,而且丰度差异高达6个数量级。如此巨大的差异是随机产生的,还是存在本质的调节规律呢?贺福初院士率领的科研团队针对这一有趣的现象展开了探索。该团队选取了在整个生命进化史中具有代表性的6个物种(大肠杆菌、酵母、线虫、果蝇、小鼠、人)为研究对象,综合它们的定量蛋白质组数据,最终发现了存在于蛋白质丰度整体分布的三个普适性规律:
1)在进化上,蛋白质丰度与其起源时间和序列保守性呈正相关;2)从结构角度,蛋白质丰度与其结构域数目呈负相关,而与其结构域的覆盖度呈正相关;3)蛋白质的功能决定其丰度:参与基础物质流的蛋白质其丰度高于调控精细信息流的蛋白质。
蛋白质丰度分布规律的揭示对深入认识生命体的蛋白质构成原则具有重要的理论意义,同时也为从海量数据到知识归纳提供了有效的实践模式。
自然科学的重要目标是发现普遍规律与原理,其普遍的发展范式是:从数据的大量积累到经验性规律的不断发现,继而催生新的学说与理论。在生命科学领域,近年来的组学研究导致了海量数据的“大爆炸”式积累,如没有理性条件下的系统化梳理、归纳、综合(就像十九世纪的细胞论、进化论,二十世纪的基因论),将不可避免地形成“灾难性”野性开采。近20年前四条分子进化规律性的发现、5年前生物分子网络组织规律的发现,生命体20种氨基酸的选择对于细胞内蛋白质等电点分布一劳永逸的解决方案的报道,以及不久前“促成生物学复杂性的蛋白质结构域特征因素规律性利用模式”的发现,证明当前生命科学领域急需系统化的数据挖掘、并初步显示出此类尝试的有效性。此文就是荟萃分析(meta-analysis)和深度挖掘方法系统应用于蛋白组学数据的一个成功范例,为今后更加合理有效的利用组学数据进行理论生物学研究提供了方法和思路。(生物谷 bioon.com)
doi:10.1371/journal.pone.0032423
PMC:
PMID:
Regular Patterns for Proteome-Wide Distribution of Protein Abundance across Species
Fan Zhong, Dong Yang, Yunwei Hao, Chengzhao Lin, Ying Jiang, Wantao Ying, Songfeng Wu, Yunping Zhu1, Siqi Liu, Pengyuan Yang, Xiaohong Qian, Fuchu He
A proteome of the bio-entity, including cell, tissue, organ, and organism, consists of proteins of diverse abundance. The principle that determines the abundance of different proteins in a proteome is of fundamental significance for an understanding of the building blocks of the bio-entity. Here, we report three regular patterns in the proteome-wide distribution of protein abundance across species such as human, mouse, fly, worm, yeast, and bacteria: in most cases, protein abundance is positively correlated with the protein's origination time or sequence conservation during evolution; it is negatively correlated with the protein's domain number and positively correlated with domain coverage in protein structure, and the correlations became stronger during the course of evolution; protein abundance can be further stratified by the function of the protein, whereby proteins that act on material conversion and transportation (mass category) are more abundant than those that act on information modulation (information category). Thus, protein abundance is intrinsically related to the protein's inherent characters of evolution, structure, and function.