SNP(单核苷酸多态性)是在人类基因碱基序列上,单个位点的碱基(CGTA)变化。图片来源:甄二真供图
为什么有些人抽烟喝酒一辈子不得病,而有些人远离烟酒却被癌症找上门?这个问题虽然“老掉牙”了,但却总会被人提起。近些年,一个新词“SNP”被人们认识,却又让人有些摸不着头脑。它和基因检测疾病有关,也有可能会在未来某一天完整地回答上述那个“老掉牙”的问题。
目前,人们普遍认识的基因与疾病的关系,就是通过个人DNA的检测,观察是否存在染色体异常、对应基因有突变,或者基因表达程度有问题,从而判断疾病是否发生。
已知的比如地中海贫血、唐氏综合征、色盲、结肠癌、乳腺癌等都与一些易感基因有关。尤其是乳腺癌,一个女性如果发现携带BRCA1或者BRCA2这种基因,在70岁以前她有65%的几率患乳腺癌。因此,BRCA1和BRCA2基因检测在发达国家作为一项预防乳腺癌的手段早已进行。这两种基因就是因为基因序列上发生SNP,而使携带者易患乳腺癌。
大部分疾病和基因的关系尚不清楚,但与SNP有着密切的关系。
单个核苷酸的变化
中国科学院北京基因组研究所教授甄二真在接受《中国科学报》记者采访时,首先揭开了SNP的神秘面纱。
SNP是英文single-nucleotide polymorphism缩写,一般译为“单核苷酸多态性”。单核苷酸多态性是基因组中基因序列上单个核苷酸的变化。在我们的认识中,往往会把基因中的一些与疾病有关的变化解读为变异,但甄二真在采访中解释道,事实上,这种变化是保持生物多样性的正常现象,就好像人类血型的变化。
甄二真说:“血型是人类血红细胞所带抗原和血浆所含抗体的变化,包括A、B、O和AB四个常见血型。具体比较两个人,血型的不同,称为红血细胞携带抗原的‘多态性’。”
而SNP(单核苷酸多态性)是在人类基因碱基序列上,单个位点的碱基(CGTA)变化。这种基因序列的变化类似于血型的变化,例如最常见的是CG变化,可以变化为TA、GC和AT。“所以比较两个人的某一小段基因序列上每个核苷酸,也可以呈现单个核苷酸的变化,我们就称其为SNP”。
因此,“如同血型是指人类血液的一种血红细胞抗原的变化,是人类血液中存在的现象一样;单核苷酸多态性是指基因序列上单核苷酸的变化,是人类基因序列存在的现象。目前估算在人类的2万~3万个基因中有大约300万个SNP。”甄二真说。
这个微小而数量庞大的变化与疾病有着怎样的关系,是很多基因与疾病的研究者长期关心的问题。
某种联系
迄今为止,最大规模的关于SNPs与疾病的关系的研究是2007年报告的WTCCC(Wellcome Trust Case Control Consortium)项目,该项目对14000名患者和300名正常人做了研究,发现了一些SNPs与一些疾病有某种联系。甄二真告诉《中国科学报》记者,例如具有上皮生长因子受体基因的某些SNPs的人群,发生非小细胞型肺癌的机率高于普通人群。流行病学研究也发现了非小细胞型肺癌与吸烟和饮酒之间的相关性。
甄二真依然举了血型与疾病关系的例子。他说,流行病学研究发现胃癌在A型血人群中发病率最高,而在O型血人群中发病率最低;B型血人群中卵巢癌发病率高于其他血型的人群;还发现O型血人群中皮肤鳞状细胞癌的发病率比其他血型人群低14%,皮肤基底细胞癌发病率低4%。“这告诉我们,血型是正常人类血液抗体的变化,但是与疾病的发生机率存在某种关系。”
中国科学院北京基因组研究所副研究员聂凌虎给《中国科学报》记者举了一个例子,肿瘤抑制基因p53,这种基因是目前研究最为广泛和系统的抑癌基因之一。野生型p53参与了DNA损伤修复、细胞周期调控、细胞凋亡及抑制血管生成等过程。而p53基因的点突变、缺失及灭活在癌症的发生和进展过程中起着关键性的作用。
目前为止,在肝癌、大肠癌、肺癌、胃癌、宫颈癌等多种癌症患者血清中发现了p53抗体。也就是说,突变后的p53将展现其邪恶的一面。
“但这并不意味着,只有突变后的p53才与个体患癌机率有关。”聂凌虎指出。
事实上,即便是野生型的p53,p53基因密码子72由于具有SNP,导致了所编码氨基酸的不同,既可编码精氨酸(Arg),又可编码脯氨酸(Pro)。也正因此,正常人携带的基因型可分为Arg/Arg 纯合子、Pro/Pro纯合子与Pro/Arg杂合子的三种。
“目前,学界无法确定,带有精氨酸等位基因纯合子的个体与带有脯氨酸等位基因的个体谁更容易患癌。只能说,p53基因密码子72的多态性与某些癌症的发生存在相关性。”聂凌虎说,这一定程度上可以用来解释,为什么有的人吸烟喝酒却依然长寿。
不过,聂凌虎强调,在国内和国外对p53基因密码子72单核苷酸多态性和癌症易感性的相关性研究有许多不同的结论。
内因、外因的共同作用
虽然目前学界还无法清楚地了解SNP与癌症或者其他疾病之间的具体联系,但是通常,如果得知了自己携带有某种相关的SNP,对于疾病的预防有很大的帮助。
甄二真说:“有些人会得某种疾病,而有些人却不会。我们知道A型血并不直接引起胃癌;同样,上皮生长因子受体SNPs也不直接引起肺癌。”这与“外因”有着很大的关系。
如果说血型或者SNPs所反映的是人的遗传因素,是“容易”或“不容易”患某种疾病的内因,那么环境因素则是与内因共同作用的外因。
甄二真举例,人类除了遗传病,其它常见的疾病,例如癌症,冠心病或糖尿病等,是在内因和外因共同作用下发病的。比如,A型血的人和O型血的都爱吃腌制食品(环境因素),则A型血的人的胃癌的机会远远高于O型血的人。同样,遗传了上皮生长因子受体基因某些SNPs的人吸烟(环境因素)的话,患肺癌的机会远远高于没有遗传这些SNPs的人。
不过,甄二真强调,目前绝大多数这些内因、外因与疾病之间关系的具体病理生理过程还不清楚,但大至可以用血管素(AGT)基因与高血压的例子来帮助理解。
高血压与高盐饮食有关系。遗传了AGT基因中某个位点CG-AT单核苷酸变化(SNP)的人,食用与其他人一样含盐量的饮食即可引起高血压。因为具有这种SNP的人(内因),对食物中的盐含量很敏感(外因),使用对其他人群来说正常的盐量,就可以增加血液中血管紧张素的含量,引起血管紧张度增加。由于饮食习惯有家庭聚集性,加之遗传因素,高血压也常常表现为家族性。
“在这个研究已经比较清楚的个例中,可以看出,如果这个家族降低食盐量,就去掉了环境因素,就可以预防高血压的发生。SNPs、吸烟和肺癌的关系也是同样的道理。”甄二真说。因此,尽管大多数SNPs与疾病发生的确切病理生理过程还不清楚,“但凡是流行病学上已经证明与某种疾病有关系的环境因素要尽量避免,有关系的生活习惯必须改正,去掉了外因,就可以基本预防这些疾病。”
检测还不靠谱
如今,人类基因基本测序已经完成,学界更多的将注意力转向对变异的评价上。在人类基因组中大概每1000个碱基就有一个SNP。一份完整的人体SNP图谱如果与人类基因组序列、物理和遗传图谱结合起来,可以在序列变异、疾病关联基因、种族遗传和基因组扫描等方面作出进一步研究,将会对疾病的深入了解、诊断方法和新型有效的治疗方法的发展产生深远的影响。
甄二真表示,目前对于SNP 的研究,学界确实希望未来能够找到正常人中某个变异与疾病的确切关系,包括环境因素到底如何起到共同作用,未来是否能够在诊断与治疗疾病上发挥作用。
但是,利用SNP 寻找致病基因并没有想象的简单。聂凌虎在接受《中国科学报》记者采访时表示,SNP数量巨大,而且,人们并不清楚它的每一种变异到底是好是坏。
因此,他指出,SNP与疾病的关联分析并不是它唯一的应用领域。 SNP导致了人体许多表型差异,它还可以用于群体遗传学及法医学等领域。
因为,SNP被认为是一种能稳定遗传的早期突变,尤其是Y染色体非重组区的单核苷酸多态(Y-SNP)遗传稳定。Y-SNP呈父系遗传,具有种族地理特异性,是研究人类父系迁移、进化的理想遗传标记。而且,其种族和地区特异性特征,还能在法医学领域用于推测生物学检材的人种或地理来源,从而为法庭科学的案件调查提供帮助。
“不过,即便如此,SNP并不是唯一的个体化差异的来源。”聂凌虎坦言。