环境基因组计划(EGP, Environmental Genome Project)
朱联辉 军事医学科学院情报所
美国国立环境卫生科学研究所(NIEHS, National Institute of Environmental Health Sciences)现在正在投资支持一项有关遗传和环境反应影响的研究。其研究的内容为环境基因组计划(EGP, Environmental Genome Project)。实际上,早在1997年10月在Betaesda举行的EGP学术会议上就提出基因组的方法能用于促进人类的健康,因为环境因素与遗传因素间的相互作用对人类健康十分重要。1998年4月4日,环境基因组计划由美国国会顾问环境卫生科学委员会正式投资专项基金进行研究,先期投入6千万美元,计划2004年完成。参加的机构主要有美国国立环境卫生科学研究所、美国国立卫生院(NIH)的几个研究所、美国能源部(DOE, Department Of Energy)以及联邦研究机构。
一、概述
突变的本质即DNA(见下图)的改变。要了解基因型(突变)和表型(疾病)之间的确切关系,就必须彻底了解相关的基因及其功能,而这正是人类基因组计划的目标。基因组计划能为突变研究提供信息资源、技术方法和相关的仪器设备,突变研究则可利用这些资源来了解基因及其功能,了解突变是如何积累演化成疾病的。
人类健康状况受多种因素影响,如遗传易感性、环境的暴露和衰老等。快速发展的分子遗传学使人们认识到对环境暴露的易感性存在不同个体遗传背景的差异。NIEHS启动的环境基因组计划即是专门研究与环境相关疾病的遗传易感性,寻找对化学损伤易感的基因。此计划在美国人群中选择具有不同年龄、性别和种族背景的10个群体中1000个个体,并应用人类基因组计划所使用的方法,鉴定与环境相关疾病易感基因的等位片段多态性(allelic polymorphism),建立这些基因多态性的中心数据库,并服务于疾病流行病学中基因与环境相互作用的人群研究。通过鉴定影响个体对环境成分反应的基因和等位片段多样性,科学家们将能准确地预测出影响人类健康的危险度和帮助政府制定出环境保护策略。
鉴定对环境发生反应基因中有重要功能的多态性,并确定它们在环境暴露引起疾病的危险度方面的差异;在疾病流行病学中研究基因与环境的相互作用,从而改善遗传分析技术,优化研究设计,建立样品资源库,把公用的多态性应用于社会、法律和伦理学。就环境卫生总体研究总体而言,将在如下4个方面进行努力,即环境基因组图谱的建立,包含足够的血样数和20个基因多态性;大规模从具有代表性的美国人群中检测主要的化学物质;恢复这些因素的真实相互作用;用转基因鼠和其他改进模式建立快速和更好的检测系统。
二、环境基因组计划的研究项目及进展
环境基因组计划中设立了六个研究项目,具体如下:
1、生命统计学,研究分析环境和基因之间的关系,建立用于分析大分子物质(DNA、RNA、蛋白质)的计算机分析数据库以及基于Web的资源的开发和利用。
2、DNA测序,该研究项目包括进行DNA测序或序列分析,人群中遗传学变异的测定,同源性测定,侧翼序列和内含子/外显子分析、增强子和其他一些调节域的分析等。
3、社会、法律和伦理学的应用,环境基因组的研究有助于提高人们对于环境相关疾病的认识,同时可帮助卫生人员制定相应的疾病预防政策,但是它在社会学和伦理学上也存在一些问题。首先就是如何保护那些参与研究的个体。其他的一些问题有研究结果的利用以及研究发现如何为社会上的大多数人服务。目前这些问题没有得到足够的重视。
4、功能分析,包括结构功能研究、酶学研究、细胞定位、蛋白质折叠、组织-器官特异基因表达模式、功能基因分析、转基因或其他其他实验动物模型、体外或细胞系培养方法等。目前在这方面,科学家已经在酵母的氧化DNA修复的生化遗传学研究、人类乳腺细胞色素P450和有机氯化合物研究、遗传和毒理研究、细胞色素P450E1方面取得了一些进展。
5、人群方面的研究,包括环境和分子流行病学研究、生物标记、基因易感性、环境和基因之间的相互作用等。目前在这方面,科学家已经在乳腺癌的环境和遗传的发病、毒理学的临床和基础联合研究、前列腺癌的分子流行病学研究、乳腺对环境致癌物的易感性、职业性苯暴露中的分子生物标记等方面取得了一些进展。
6、技术的发展,该研究项目主要发展一些用于基因或蛋白质功能研究的技术,包括DNA微点阵技术、质谱、毛细管电泳、高效液相色谱、全细胞蛋白质内容分析等。目前在遗传和物理图谱方面有了一些新进展。
对具有遗传易感性的人群(或亚群)研究能更精确地鉴定出引起疾病的环境成分和暴露的真实危险度。然而,由于复杂的和多方面因素的相互作用,已鉴定的个体多态性并不能准确地预测出个体对暴露的危险度。每个个体的完整暴露危险度取决于外加暴露史、营养状况、年龄和发育过程、性别及其它因素。环境基因组计划所构建的资料库将使我们在流行病学研究中充分认识到环境与疾病的相互关系。对易感的人群或亚人群进行鉴定后,可从人群中区分出来那些易感人群。环境基因组计划将为未来的易感性基因产物和对环境暴露的遗传学反应的分子机理研究提供信息,同时在流行病学中,有针对性地进行环境暴露的分子遗传学研究以及建立一套全新的技术方法。
分子遗传学方法提供了系统分析和比较分析的有力手段。遗传学认为遗传变异的易感性是人类多数常见病的特征,多数疾病的遗传易感性与一个或若干个基因的相应等位基因有关。而遗传流行病学已表明特异基因的特定等位基因是某些疾病的易感原因。现在有两种不同而互补的基因组方法。一是“基因型(genotype)”法:研究基因型变异如何产生表型的变异,这取决于物理图,遗传图及DNA多态已有的产物。二是“表达(expression)”法:这取决于部分序列的cDNA克隆和基因组编码的更多的蛋白,进行整套基因表达方式的比较和这些产物功能特性的研究。目前我们未能识别所有重要序列,未能获得大群体中足够的信息,要在人类10万个基因中只靠几百个基因的信息是难以鉴定大部分基因对有害环境因素的易感性。
环境基因组研究有助于寻找环境因素易感基因,遗传和物理图谱的建立以及测序工作的进展促使了大批基因的发现和分离。随着基因组上各种作用坐标的密集和已测序基因的增多,克隆特定基因日趋容易和精确。比如“候选基因”克隆法已发展成为“定位候选基因”克隆法。这些进展使得寻找基因组中负责对辐射和化学物易感型的基因变得切实可行了(见表1)。现已证明一些基因在环境暴露的易感性中起重要作用,但这些基因多态性还未被系统地分析、鉴定和报道。目前已列入环境基因组研究计划目录的候选基因,如异源生物体代谢和解毒基因、激素代谢基因、受体基因、DNA修复基因、细胞周期相关基因、细胞死亡的控制基因、参与免疫和感染反应的基因、参与营养的基因、参与氧化过程的基因以及与信号传导有关的基因等。多态性中心数据库的建立,可支持等位片段的功能研究和疾病危害度的群体研究。群体流行病学的研究将基于鉴定引起疾病的等位片段和环境暴露。当然,除了上述基因,环境基因组计划还感兴趣于新的易感性基因。
表1 疾病相关易感性基因的一些例子
多态性 分类 环境暴露 相关联疾病
CYP1A1 激活 吸烟 肺癌
NAT2 解毒 吸烟 膀胱、乳腺癌
GSTT1 解毒 氯化消毒溶剂 癌症、毒性
对氧磷酶 解毒 神经性杀虫剂 神经系统损伤
HLA-H 营养因子 饮食中的铁 血色沉着病
TCG-α 生长因子 母亲吸烟 唇裂、腭裂
小鼠17号染色体位点 免疫/炎症反应 新鲜空气 肺部感染
HLA-DP标记 免疫反应 铍 慢性铍的肺病
ALAD 生物合成 铅 铅中毒
目前环境基因组计划要研究的部分环境相关疾病和缺陷有:
癌症:肺癌、膀胱癌、乳腺癌及前列腺癌
呼吸系统疾病:哮喘和纤维囊性肿
退行性神经系统疾病:早老性痴呆、帕金森氏综合征和肌萎缩内侧硬化症
发育障碍:智力低下和注意力缺陷-多动症
生殖系统疾病:绝育、子宫肌瘤、子宫内膜异位、青春期早熟
自身免疫病:全身性红斑狼疮多发性硬化
三、我国开展环境基因组研究的研究意义
研究基因与环境暴露在中国有很大的前途。虽然在人类基因组计划实施过程中越来越多的基因被发现,但引起人类复杂疾病的相互作用基因和环境因素还有待进一步研究。中国有众多人口,具有研究复杂疾病的很多优点。如13亿的人口资源,包含有大量罕见或常见疾病的个体;在很多地区保留下来的相对异质性人群;分层相差较远;城市/乡村和地理上环境因素和疾病发生的情况相差很大;家系成员趋于聚集性;流行病学调查较西方国家的费用低得多。在中国,环境和健康的问题一直得到很高的重视,1999年11月,中国环境诱变剂学会在汕头大学召开第九届全国学术会议,讨论了环境因素与疾病的关系。
因此,有选择地研究环境对特种人群的影响,对于提高公众的健康,具有非常现实的社会效益。