科学家们近日首次实现了对物种在整个表达谱范围内的蛋白表达噪声测量。该项成果是单分子技术与系统生物学交互融合的典范,预示了单细胞基因表达分析时代的来临。
在基因表达研究领域,传统的研究方法是在同等条件下磨碎大量细胞,然后测量基因产物的数量,例如mRNA和蛋白。然而最近的研究却发现,看起来完全相同的单个细胞实际上表达水平完全是随机的,存在着巨大的个体差异,科学家称之为“噪音”。科学家们在研究单细胞生物体的“噪音”时发现,即使是基因完全相同的细胞其行为也是完全不同的。测量不同生物体内的蛋白表达噪音可以帮助科学家们了解生命的演化和功能。
哈佛大学化学与生物化学系谢晓亮小组最新的研究成果将该领域带入了一个新的高度。 7月30日最新一期美国《科学》(Science)发表了题为《大肠杆菌蛋白组及转录物单分子水平测量》的论文,报道了大肠杆菌的1018个基因在单个细胞内的绝对表达数以及各个细胞间的差异,这些基因占了大肠杆菌全基因组的四分之一左右。他们还同时测量了其中137个大量表达的基因的mRNA分子数量。
尽管在同基因组细菌群的细胞中,蛋白和mRNA拷贝数差异巨大,不过通常数量较小,难以在单分子水平上检测。谢晓亮小组的研究人员利用自己搭建的一套全新的大肠杆菌黄色荧光蛋白融合库,成功地实现了单个细胞内在单分子水平对整个表达谱范围内的蛋白和mRNA的定量分析。
该项研究有两个惊人的发现。首先,20%的蛋白质表达水平很低,小于每个细胞一个分子。研究人员发现当表达水平较低的时候,几乎所有的蛋白分布均可用两个参数的伽玛分布来描述,也就是mRNA的转录速率和每个mRNA分子表达为蛋白质的数量。而当表达水平较高的时候,分布图被其他的外部噪音所充斥。
作者的另一重要发现是,单细胞中某基因在某一时刻的mRNA表达拷贝数与其蛋白表达拷贝数无关,由此可见,单个细胞中的蛋白组分析与转录物分析是没有关联的。由于细胞中某些功能基因的蛋白质和绝大多数mRNA的拷贝数都相当低,这项研究成果提供的方法将大大促进科学家对基因随机表达和调控的理解。
这种关联性缺失的一个原因是mRNA分子和蛋白质分子在细胞内的寿命长短不同。mRNA只存在几分钟,而蛋白质分子可以存在数个小时,大大超过细胞周期。此外,对很多细胞而言,一些蛋白的唯一来源来自于母细胞,而mRNA只是偶尔产生。这就导致了在细胞分裂过程中某些蛋白质分子分配不均衡,这种现象在哺乳动物细胞中同样存在。
同一期《科学》杂志还发表了美国新泽西医学与口腔学大学公共卫生研究所Sanjay Tyagi的评论文章,文章标题是“Genomics: E. coli, What a Noisy Bug”。评论认为,弄清楚大肠杆菌全基因组中相当一部分的mRNA和蛋白表达水平以及差异性后,下一步可以做的就是研究噪音是如何随着基因表达通道传递的,在这个传递过程中一个蛋白的数量可以影响到另一个蛋白的表达。另一个可能的研究方向是探索细胞是如何调节那些需要同步协作的蛋白质表达。科学家还可以通过研究其他相关生物体的全基因组表达,或者同一个生命体在不同条件下(例如在焦虑的时候或者衰老过程中)的表达谱,来确定噪音仅仅限制了基因表达,还是对进化选择具有重要意义。(生物谷Bioon.com)
生物谷推荐原文出处:
Science DOI: 10.1126/science.1188308
Quantifying E. coli Proteome and Transcriptome with Single-Molecule Sensitivity in Single Cells
Yuichi Taniguchi,1,* Paul J. Choi,1,* Gene-Wei Li,1,2,* Huiyi Chen,1,3,* Mohan Babu,4 Jeremy Hearn,1 Andrew Emili,4,5 X. Sunney Xie1,
Protein and messenger RNA (mRNA) copy numbers vary from cell to cell in isogenic bacterial populations. However, these molecules often exist in low copy numbers and are difficult to detect in single cells. We carried out quantitative system-wide analyses of protein and mRNA expression in individual cells with single-molecule sensitivity using a newly constructed yellow fluorescent protein fusion library for Escherichia coli. We found that almost all protein number distributions can be described by the gamma distribution with two fitting parameters which, at low expression levels, have clear physical interpretations as the transcription rate and protein burst size. At high expression levels, the distributions are dominated by extrinsic noise. We found that a single cell’s protein and mRNA copy numbers for any given gene are uncorrelated.
1 Department of Chemistry and Chemical Biology, Harvard University, Cambridge, MA 02138, USA.
2 Department of Physics, Harvard University, Cambridge, MA 02138, USA.
3 Department of Molecular and Cellular Biology, Harvard University, Cambridge, MA 02138, USA.
4 Banting and Best Department of Medical Research, Terrence Donnelly Centre for Cellular and Biomolecular Research, University of Toronto, Toronto M5S 3E1, Canada.
5 Department of Molecular Genetics, University of Toronto, Toronto M5S 1A8, Canada.