由美国、中国、日本等6个国家的200多位科学家参与的“国际人类基因组单体型图计划(HapMap)”日前取得了阶段性成果,科学家们于近日公布了第一阶段人类基因组单体型图。这份描述人类基因组中最常见差异的图谱,将大大促进疾病和人类进化的研究。对此,记者专访了该计划“中国卷”负责人、中国科学院北京基因组研究所曾长青博士。
HapMap计划是为了确定人类遗传的相似性和差异性
记者:“HapMap”计划最初是基于怎样的出发点而提出的?
曾长青:2002年,“国际人类基因组测序计划”完成,这是一套精准的人类基因组序列图谱,也就是描述DNA中的“字母”如何构成“单词”。它的一个重要成果就是发现了基因组中的大量变异。为了进一步弄清这些变异,2002年的10月28日,在美国华盛顿宣布正式启动了HapMap计划。
这个计划有美、英、日、加、中、尼日利亚6个国家参与,其中,美国完成31%,日本完成25%,英国完成24%,加拿大完成10%,中国大陆、香港和台湾合作完成10%。
记者:众所周知,对人类基因研究的前提是搜集大量人体基因样本,HapMap计划的样本从何而来?
曾长青:这个计划中,需要亚、非、欧裔各90份样本,亚裔样本由中国和日本各提供一半,非裔的由尼日利亚提供,欧裔则取自美国。
记者:取自美国的样本是否可以代表欧裔样本?
曾长青:计划中的美国部分,只是提取了祖籍为西欧和北欧的人群。还有一点要补充一下,就是所有的样品采集都得遵守伦理学的各项规定。
记者:整个计划分几个阶段?每个阶段有没有设定具体的研究目的?
曾长青:整个计划分为两个阶段,第一阶段是SNP分型测定,把30亿个碱基对以每5000个为一组进行测定。第二阶段就是在前一阶段的基础上进行更高密度的分型测定和后期数据的分析。
前面我们不是说到DNA上碱基对的排列有差异吗?那么这个项目主要就是要测出这些差异是怎样分布的,它的频率和密度是多少,从而划定共有的变异区域,确定人类遗传的相似性和差异性。
目前研究就像区别“单词”中的“字母”
记者:这个计划中出现的一个名词“单体”怎样理解?
曾长青:先要说明一下SNP。简单来说,人类基因组拥有大约30亿对碱基,不同人的基因组中碱基对排列顺序的99.9%都是一模一样的,只有不到千分之一左右的排序有所不同。这些不同处,就叫SNP,全称是“单核苷酸多态性”,即DNA链上单一碱基对差异。
记者:能否对此进行一下比喻?曾长青:我们人类的DNA由30亿个结构单元组成,这些结构单元排序后就形成了基因,就好像一个个字母组合成单词一样。对于两个毫无关系的人而言,他们的这些“字母”的排列顺序有99.9%都是相同的,而剩下的几百万个“字母”的排列则存在差异,这种差异就叫做SNP。
单体就是指单个染色体,可以理解为构成DNA链的基本“单词”,每个“单词”包含有5000至2万个“字母”,具有特定的SNP变异方式,不同的“单词”,就决定了基因组的不同变异态。
“HapMap”计划“中国卷”取自180个汉族样本
记者:我国既然是“HapMap”计划参与国之一,在实际执行中承担什么任务?
曾长青:中国承担10%的研究任务,具体就是3号、21号和8号染色体短臂单体型图的绘制,同时,还提供一半的亚裔样品。2003年3月,我们在北京成立了一个专门组织,叫作中国单体型图协作组,作为一个整体工作。科技部和香港地区分别给了5000万人民币和5000万港元,用于资助这个项目的实施。
记者:我国提供的一半的亚裔样品是在哪里采集的啊?
曾长青:我们用了1年,一共收集了180个样本,都是取自北京师范大学在校大学生。
记者:对于取样对象,有什么具体要求?
曾长青:没什么特殊要求,这些学生在入学时都体检过,所以我们没作任何检测。只要求是成年健康汉族,也就是四个祖父母中至少有三个是汉族的,没有患艾滋病、乙肝等明显传染病就行了。
记者:只取血液样本?
曾长青:是的,静脉取血5毫升。每个人取3份,其中2份上交,因为这中间要经过运输和细胞转换,一份我们自己留底。
记者:样本都满足计划要求吗?
曾长青:收集样本后,我们开始进行分型测定和分析。我们建立了一些国际领先的技术,像是成熟高通量基因分型平台、单碱基延伸荧光偏振检测系统、微珠芯片检测系统和飞行时间质谱监测系统等SNP分型体系,日通量可稳定达到30万个分型反应。同时国际方面的质量控制实验结果也表明我们上交数据的准确率超过99.95%。
“HapMap”就像数学用表,人类基因差异将被打上标签
记者:全世界这么多科学家花了这么多心血和时间进行这项计划,它究竟有什么样的实践意义呢?
曾长青:这个意义是很大的。原来有研究表明,像心脏病、癌症、哮喘、高血压这些病都跟变异的基因有关。“HapMap”项目的研究成果为科学家研究疾病与致病基因之间的关系打下了关键基础。我们可以借助“HapMap”的数据找到其中的变异基因序列。这里面不但有导致疾病发生的生物学诱因,也暗含着提高治疗技术的改进策略。对于常见疾病和涉及多个基因、与遗传和环境都有关系的复杂疾病,科学家可以根据“HapMap”排查出其可能存在差异的位点,总结出其中的遗传规律,达到预测、诊断、治疗的目的。
学过数学的人都知道,利用数学用表可以轻而易举地查出很多一般人难以计算的数值,比方说开方、正余切、正余弦值之类的。HapMap就像一张数学用表一样,任何人想用都可以查。通过SNP排列中已经注明的“标签”,将患者与健康人的SNP进行比较,就可以更高效地寻找到与疾病相关的基因变异。前一段时间印度海啸发生过后,有关方面就与我们联系过,因为有很多人在海啸过去之后的反应都不一样,他们想从基因遗传变异这方面来寻找原因。
-链接
国际人类基因组测序计划
人类基因组计划于1990年正式启动。其核心内容是构建DNA序列图,即分析人类基因组DNA分子的基本成分―――碱基的排列顺序,绘制成序列图。人的基因组由4种碱基构成,通常缩写为A、T、C和G,正是这些“字母”决定和影响着我们的肤色、身高,甚至生老病死。
这一计划与“曼哈顿原子弹研制计划”、“阿波罗登月计划”并称为人类科学史上的“三大计划”。