最初,人们推测人类所拥有的基因大约有十万个这么多。当第一代的人类基因组测序结果公布后,研究人员发现人类基因组大约只含有3万到4万个蛋白质编码基因。
之后,由于测序技术方法的不断发展,对基因组分析的误差也在逐渐缩小。人类基因组数量也从3-4万,缩水到了25000左右。而一项发表在近日的《PNAS》上的研究表明,人类基因组中编码蛋白质的基因数量要比最新估计的24500这个数字要少。根据Broad研究所的这项研究显示,人类基因目录如Ensembl、RefSeq和Vega包括了许多开放阅读框,它们是任意出现的而不是蛋白质编码区域。这些发现将人类基因组中的蛋白质编码基因数目减少到了20500个。
研究人员也表示,随着研究的进一步深入,这个数目还可能会有变化。而人类基因组中蛋白质编码基因数量之少,也是令人惊讶的。
此外,定位基因组上的基因、基因功能的研究在人类基因组测序完成后都得到了快速的发展。近期,也有大量的新基因被鉴定出来,许多新基因与人类健康息息相关,相同它们的鉴定对深入了解相关疾病及其进行有效治疗具有深远意义。