最新研究显示人类基因数量比原先估计少得多,这是人类与其他种类基因数量的比较
美国国家人类基因组研究所所长、最新人类基因数分析报告作者克林斯认为,人类的基因数实际仅有2万到2.5万。比国际人类基因组计划2001年公布的人类拥有3万到4万基因数要低。
科学家长期以来对人类有多少基因进行了估测,10年前,科学家还普遍认为人类大约有10万个基因,而“国际人类基因组排序联合体”最初的估计数字却明显低于上述数字。2001年,它估测的人类基因数为约6.6万个,以后又降到4万个。
科学家在研究报告中称,于2001年报告其所估测的基因数目时,还有很多工作未完成。基因数分析报告的另一个作者、麻州广阔研究所的兰德解释说:“人类基因组的一些区域中隐藏着很多基因片段的复本,最终完成的工作显示,最初认为是基因的,实际上是一些基因片段的复本,此前的估算曾将这些复本计算在内。”科学家说,新的估测值是确切的,人体极可能有2万个基因,因为另一家实验室的工作也已独立表明,存在19599个基因。
相比之下,小线虫Celegans大约有1.95万个基因,开花植物—阿拉伯芥约有2.7万个基因。伯克利加州大学基因专家鲁宾说:“我们必须习惯于人类拥有的基因数,不比蠕虫多的这样一个事实。并且这个新的估测值,将来不可能变化很多。”
专家们认为,人体的复杂性不仅仅来源于基因。兰德称:“人类的复杂性不仅仅涉及到基因的数目,而更在于自然界如何采用这些基因。”但人类如何拥有较少的基因,而又是如此复杂呢?克林斯说:“这在于人有多种蛋白质,即复杂的蛋白质做更多的工作。很多生物学上的复杂性,不是基于单个蛋白质,而是基于多个蛋白质的组合。”
从事人类基因研究的美国科学家们日前表示,与植物或小蠕虫相比,人类的基因数量并没有明显的优势。最新的估算认为,人类的基因数量只在2万到2.5万个之间,而一些植物或小蠕虫的基因数量也在这个范围,因此二者之间的差异并不是很大。
科学家们同时表示,虽然从数量上相比,人类的基因并不占优势,但人类的基因图谱却要复杂得多。另一名美国科学家埃里克·兰德尔(Eric Lander)对此表示:“基因的数量多少并不是关键问题,最重要的因素是不同物种如何利用了这些基因。”长期以来,科学家们一直在探究人类的基因数量究竟有多少。一些科学家甚至曾认为,人类的基因数量至少应在10万个左右或以上。后来这个估算数字被降低到了6.6万个,2001年以来,该数字又被降到4.4万个。
人类基因组序列测定的完成是一件具有历史意义的大事件。今天,国际人类基因组测序委员会对已经完成的人类基因组序列给出了科学的陈述,这个叙述将人类蛋白质编码基因的估计数目由35000个缩减到了20000至25000个。这篇文章出现在2004年10月21日的Nature上。
十年前,大多数研究人员认为人类有大约1000000个基因。但是三年前,在分析人类基因组工作草图前,研究人员估计的基因数目为30000到350000个。
在Nature上的文章中,研究人员叙述了人类基因组计划的最终结果。新的分析进一步减少了基因数目并且为我们提供了最为清晰的人类基因组图谱。这种高精确度的人类基因组序列使全世界的研究人员能够更精确地对遗传信息以及它们对健康和疾病的影响进行研究。
分析人类基因组的一个重要任务就是确定所有基因。据最新的研究结果,研究人员已经确定人类基因组中存在19599个蛋白质编码基因,并且还确定有另外的2188个DNA片断可能是蛋白质编码基因。
新分析发现,较早的一些基因模型是错误的,这是由于当时人类基因组图谱没有彻底完成的缘故。文章还叙述了图谱的完成过程和对完成图谱的质量评估。这个评估确定完成的序列包括了99%的人类基因组的常染色质部分,并且测序的精确度达99.999%。而且,序列的连续性也大幅提高。但是,“完成”并不代表人类基因组序列是完美的。在完成的人类基因组序列中仍然有341个缺口,而在2000年6月公布的工作草图中则有多达150000个缺口。
质量提高的人类基因组序列还提供了清楚的证据证明DNA片断的复制以及基因的形成和死亡等现象。
完成的人类基因组序列的精确性使研究人员对基因的产生和死亡有了一个初步的了解。另外,研究人员用完成的人类基因组确定了33个几乎完整的假基因,这些基因是在近期才发生了一个或更多的突变并使它们的功能丢失。
一项最新的研究结果显示,人类基因数量与微小的开花植物和小蠕虫的基因数量基本相同,这无疑是对人类虚荣心是一次打击。研究人员对人类基因数量的最新估计与三年前相比有大幅下降。
此项研究的两位作者之一的弗朗西斯.柯林斯博士表示:“我们人类在这场竞争并没有留下非常深刻的印象。”科学家最新估计,人类基因数量在2万至2. 5万个之间,而同一 批科学家在2001年公布的数字却是3万至4万个。相比而言,线虫的基因数量大约是1. 95万个。一种称为拟南芥的植物的基因数量在2.7万个左右。线虫和拟南芥都是科学家最喜欢的研究体。
这项研究的另一位作者、美国麻省剑桥博大研究院科学家的埃里克.兰德表示:“这不仅是基因数量问题,事实上是人类如何使用这些基因的问题。”科学家长期以来一直在推测人类拥有的基因数量。最初,一些科学家甚至估计人类基因数量达到10万个,甚至更多。目前,人类基因组计划对人类基因数量的估计比该计划最初公布的数字有大幅下降。
在国际人类基因定序联盟2001年做出人类基因数量的估计之前,科学家一般估计人类基因数量在6.6万个左右,甚至10万个以上。后来,这一数据又下降至4.4万个左右。国家人类基因研究所主任柯林斯最初也估计人类基因数量大概为4.8万个,这大约是目前数据的两倍。柯林斯表示:“当然,学无止境。”与此前科学家的估计一样,新的数据只涉及“告诉”细胞如何制造蛋白质的基因。这项研究将由国际人类基因定序联盟发表在10月21日出版的《Nature》杂志上。
国际人类基因排序联盟已确定了组成人类DNA代码的超过30亿个化学模组几乎全部的序列。这些模组的某种序列构成基因,就如同一定顺序排列的字母组成单词一样。在国际人类基因排序联盟2001年做出对人类基因数量的估计时,该组织在其确定的DNA序列方面仍旧存在许多差距。现在,科学家利用目前发达的科学技术已经尽可能地缩小了这些差距。兰德表示,许多最初被计算成基因的DNA序列事实上只是真正基因没有任何功能的“拷贝”,而有时同一个基因被计算成了两个基因。
该组织公布了对包含人类基因密码部分的基因序列所作的分析。这一基因序列草图是在2001年2月完成的。研究人员说:“人类的基因组似乎只包含2万到2.5万个蛋白质编码基因。”
而在4年前,据认为人类基因组包含大约10万个基因。在2001年公布的基因序列草图把这一估计降低到3万至4万个。
相比之下,老鼠有大约3万个基因,尽管这个数字也可能还会减少。根据最新的估计,另一种实验用动物————对线虫(一种比较低等的蚯蚓)————拥有大约1.9万个基因,果蝇则拥有大约1.3万个基因。
国际人类基因测序组织(IHGSC)和一家美国公司(塞莱拉基因组公司)率先完成了人类基因组测序。
在21日出版的英国《自然》杂志上公布的一项研究报告中,IHGSC说,对富含基因的那一段基因组序列进行的彻底认真的检查剔除了很多错误和前后不一致的东西。现在,基因组草图在28.5亿个碱基对的编码中只剩下341个缺口。
测序的失误率已经降至十万分之一。该组织说,这种精确度意味着这一处理过的序列将成为今后几十年的标准。他们希望这一序列将成为非常可靠的数据库,能用来研究引起疾病的基因根源和治疗这种疾病的药物。
下一步是给异染色质————不富含基因但充满“垃圾”或“不活动”DNA的那一段基因序列————测序。按照现在的想法,这一基因序列似乎是没有用处的。异染色质在人类基因组中占大约五分之一,给这一基因序列测序和处理可能需要花6年多时间。