通过破译横跨非洲、亚欧及美洲地区数国逾1000人的基因组图谱,科学家已成功汇编了目前最详尽的有关人类基因变异的研究目录。这是一笔巨大的资源,它将有助于医学研究人员从基因角度来追溯全人类罕见和常见疾病的根源。
200名来自圣路易斯华盛顿大学医学院及其他研究机构的科学家共同参与了这项“千人基因组计划”。研究的结果发布在世界权威的科学学术期刊《自然》上,详述了14个不同人类种群个体的基因变异研究报告。
华盛顿大学基因组研究所联执主任兼此次基因项目研究领导人伊莱恩·马尔蒂斯博士表示:“有了这样的资源,医学研究者们如获至宝,因为它们可以指引研究者寻找出全球人类种群中疾病的基因根源。同时,研究还指出,每个人都携带着几百个潜在致病的罕见基因变体。”
从基因层面上看,任何两个人都有超过99%的基因相似度。然而,尽管出现频率极低(可能变异频率仅为1%),但那些罕见的基因变异体仍被认为是引起罕见疾病乃至癌症、心脏病、糖尿病等常见疾病的罪魁祸首。药物治疗对某些病人不起效,或出现恶心、呕吐、失眠甚至一些心脏疾病或死亡等药物副作用,都有可能是基因发生罕见的变异在作祟。此次科研小组研究的主要目标就是鉴定遍及不同人类种群间的罕见基因变异体。通过试点阶段的研究发现,大多数罕见的基因变体在不同人类种群中的表现各不相同。这一点至关重要,它将促进科研人员对每个个体基因组的解读。
最新的研究结果来自对以下种族的DNA测序:尼日利亚的约鲁巴人、北京的中国汉人、东京的日本人、拥有北欧及西欧祖先血统的犹他人、肯尼亚的卢西亚人、拥有非洲祖先血统的美国人、意大利的托斯卡尼人、拥有墨西哥祖先血统的洛杉矶人、中国南方的汉族人、西班牙的伊比利亚人、英格兰及苏格兰地区的英国人、芬兰人、哥伦比亚人、波多黎各人。所有参与研究的人全部提交了匿名的DNA样本,并同意将他们自己的基因数据放入在线数据库。
为列出变异基因,研究员首先测序了所有实验研究对象在内的全部基因组,如此重复操作大约5次,得到的结果是,普通DNA发生了变异,却无法以此方法鉴定罕见基因变体。随后,为找到罕见基因变体和确保研究结果的准确性,研究人员反复测序了每个个体包含基因的部分基因组片段,测序每人每段基因组片段的次数都多达大约80次,同时他们还密切关注着DNA序列中核苷酸的变化情况。
科学家通过使用先进的特殊设备分析和整合测试数据,发现了总共3800万个SNP(单核苷酸)。其中包括试验对象DNA样本中超过99%且变异频率大于等于1%的变异核苷酸。研究结果还发现,大量的人类基因组存在不同长度的结构变异,包括140万基因组短片段序列的插入或缺失,14000个大段DNA缺失。
单核苷酸的多态性和基因组的结构变异提供了强有力的工具,用于解释个体在疾病易感性、药物反应和对于如空气污染、压力等环境因素上的问题。另有研究证明,某些疾病可能与基因组短片段序列的插入和缺失有关,自闭症和精神分裂症就是很好的例子。
人类基因组计划的科研成果,帮助人们了解到人类共同的基因特质和人类基因的地理多元化。最终,这笔巨大的资源财富将惠及更多相关领域的科学研究工作者和全世界的疾病患者。”(生物谷Bioon.com)
doi:10.1038/nature11632
PMC:
PMID:
An integrated map of genetic variation from 1,092 human genomes
The 1000 Genomes Project Consortium
By characterizing the geographic and functional spectrum of human genetic variation, the 1000 Genomes Project aims to build a resource to help to understand the genetic contribution to disease. Here we describe the genomes of 1,092 individuals from 14 populations, constructed using a combination of low-coverage whole-genome and exome sequencing. By developing methods to integrate information across several algorithms and diverse data sources, we provide a validated haplotype map of 38 million single nucleotide polymorphisms, 1.4 million short insertions and deletions, and more than 14,000 larger deletions. We show that individuals from different populations carry different profiles of rare and common variants, and that low-frequency variants show substantial geographic differentiation, which is further increased by the action of purifying selection. We show that evolutionary conservation and coding consequence are key determinants of the strength of purifying selection, that rare-variant load varies substantially across biological pathways, and that each individual contains hundreds of rare non-coding variants at conserved sites, such as motif-disrupting changes in transcription-factor-binding sites. This resource, which captures up to 98% of accessible single nucleotide polymorphisms at a frequency of 1% in related populations, enables analysis of common and low-frequency variants in individuals from diverse, including admixed, populations.