核心提示
世界多个国家的科学家们正在合力完成一项庞大的人类寻根计划,希望通过研究人类基因的变异来绘制出一幅“人类迁移图”。
中国科学家的研究表明,中国人的祖先源于东非,经过南亚进入中国。这支南亚先民经过多次迁徙及体内基因突变,逐渐分化成为各个民族。
按科学家的观点,通过个人的DNA样本分析,每一个中国人都能了解自己的故事,寻找到自己的一脉渊源。
我们是谁?我们从哪里来?
“这些历史信息隐藏在我们体内的DNA分子结构里。”李辉说。这位复旦大学生命科学学院博士生热衷收集各个民族分支的DNA样本,并着重研究中国南方的各个民族群体间的关系。
李辉生长在上海郊区奉贤,通过检测自己的Y染色体和线粒体,发现它们来自广东福建一带。而在2万多年前,这些DNA类型在东南亚的北部湾活动。李辉从小说“飞”的时候是念“bóng”,和侗语“ben”很像。
很长一段时间,他一直以为这就是奉贤话。通过DNA检测,李辉才知道,他所说的一些话来自一种古老的澳泰语。这个语系祖先的形成是在2万多年前南方的北部湾。
科学家们一直在尝试着用DNA分析和电脑技术研究人类历史,从而确定人类种族及人类社会的形成过程。这项工作从未间断过。目前,一项庞大的人类寻根计划在全球展开。新华社4月18日的一则电文说,为了全面了解人类的起源与迁移过程,以及人类数千种语言的形成,在未来几年内,我国科学家将和美国等国的科学家一起,通过研究基因的变异以绘制出一幅“人类迁移图”,从而填补人类历史认识的空白。
这项为期5年的项目被称为“人类迁徙遗传地理图谱计划”。这一项目将通过分布在中国、俄罗斯、印度、巴西等地的10个实验室和大学的专家来共同完成。科学家们将在世界各地采集不同人种的10万份DNA样本进行分析。
复旦大学现代人类生物学研究中心主任金力教授和他的团队负责东亚和东南亚地区的人群研究,内容包括东亚和东南亚的人群迁移、民族和语言的产生和分化、人群间的基因交流等。
“这次我们调研的重点将是绘制一幅中国人祖先迁移的地图,用来探究我们民族和语言等诸多进化环节当中的未知问题。”金力教授说,此次要采集大约2万个DNA样本。每一个中国人将能了解自己的故事。
北京猿人不是我们祖先
“我们的祖先究竟是谁?”初中教科书的权威教育是,分布在中国的现代人是由生活在40万年前的北京猿人进化而来。这个说法的理论依据是人类的多地区起源说,认为在欧、亚、非的现代人都是由当地的猿人进化而来。
金力教授的实验室助理钱吉说,现代人是单一的物种,而各地的猿人差异却很大,属于不同的物种,并没有都进化成为现代人。只有东非的猿人走上了向现代人进化的道路。所以,北京古猿人不可能成为我们的祖先。
中科院昆明动物研究所研究员宿兵在查阅中国现有化石的年代以后,发现了一个不容忽视的断层。这个断层从大约10万年前至4万年前,没有任何人类化石出土。经推测,生活于东亚的直立人和早期智人(HomoSapiens)在最近一次的冰川时期,由于恶劣的气候而绝灭。取而代之的是从非洲不远万里迁徙而来的现代人种。
但仍有科学家支持“多地区起源说”。中科院古脊椎古人类所的吴新智院士细心比较北京猿人、山顶洞人和现代人的骨骼特征,发现70%的中国人在头骨上有3个特征和北京猿人是一致的。所以他依旧觉得北京猿人可能是中国人的祖先。但他的学生刘武去非洲考察时,却发现有30%的东非人在这3个头骨特征上也和北京猿人相一致。
1998年,中国科学家意识到DNA遗传密码的重要性。在那些双螺旋的DNA链条上交织着红、黄、蓝、绿4种颜色的小球,A、T、C、G.它们掌管着整个人类的迁徙和发展史。
按科学上的解释,每一个小球就是一个核苷酸单位。所谓基因就是这些小球按照一定秩序连在一起,并具有相应的遗传信息。它有很强的功能性,控制着人类的肤色、形态和健康。比如人类的高血压就有几百个基因在控制。它们的序列不能随便更换。变换了,就要影响身体状况。
而还有些小球的序列不具有功能性,性质如同DNA分子里的填充物。它们的排列是自由的。它们过了几千几百年会自由地发生一次变化,例如原本A的地方出现C.这种变化不受任何外界因素影响,不承担自然选择的压力。它们的改变不会影响身体健康。就是这些遗传突变记载了人类迁徙的历史信息。
中科院昆明动物研究所研究员褚嘉祐着重研究的是DNA排列中的一种被称为微卫星的特殊排列顺序,这是一种公认的遗传标记。DNA排列中有一种简短的重复,比如TGTGT鄄GTG,其重复的字母和次数都可以遗传,当延续到后代身上时,原先那一个G的位置可能会变成A,或者原先重复9次而到了后代忽然变成重复10次。根据这个原理,褚嘉祐分析了28个东亚人群,推算出在中国的现代人起源时间不会早于5万年。
有人认为褚嘉祐的取样数量太小,没有说服力。2001年,金力的学生柯越海和他的研究小组对主要以华人为主的东亚人群进行了大规模的遗传分析。他进入的是Y染色体的世界。它们一代代地由父子相传,而且“性格”稳定,一般在几十代之后才会有一到两个基因位点发生变化。这些遗传突变位点的结构如同一棵树,也正是这棵基因树记录了人类在不同时间向地球不同地点散布的路径。
柯越海共分析12127个男性个体,发现那些Y染色体的YAP、M130和M89上都会有其中一个位点发生突变。它们是基因树中的三根树枝。它们汇拢到一根叫M168的树根上。这个M168就是非洲人体内的突变位点。也就是说中国人与生活在东非的非洲人有关。
柯越海说,中国人Y染色体的有效群体本来就不大,所存在的种类不多,这1万2千多个样本几乎囊括了绝大部分中国人染色体的类型。这可以充分证明,华人占大多数的东亚人群起源于非洲。
真正的亚当夏娃
领导“人类迁徙遗传地理图谱计划”的人类基因组科学家斯宾赛-威尔斯说,“我们都曾属于同一个祖先,仅仅是随着时间的流逝而被分离开来。”他认为,世界上所有的现代人,无论是亚洲人、美洲人、欧洲人,都是由东非直立人进化而来。他们在5万-10万年前,开始向世界各地扩散。
从DNA开始,关于人类的研究渐渐超出了文化的层面,人们学习着从自己体内寻找丢失的历史。上世纪80年代末,人类学中诞生出一支怪异的分支,分子人类学。它自诞生起就显示出惊世骇俗的力量。它不仅让“非洲起源说”的面目变得清晰可信,分子人类学家甚至凭借它找到了非洲的亚当和夏娃。
1987年,美国夏威夷大学的瑞贝卡·坎恩破译了来自世界各地的妇女的线粒体DNA,发现现代女性的线粒体DNA都来自一位妇女,她大约生活在15万年前的非洲。
线粒体存在于细胞质里,是细胞的“能量工厂”,它们包含少量遗传物质—————DNA.每个人的线粒体都来自母亲,因此线粒体是从母系遗传的角度研究人类进化的重要工具,就像Y染色体是研究父系遗传的工具。
随后,分子人类学家再次成功破译了男性遗传密码的Y染色体。通过研究,他们得出结论,现代男性都有一个共同的父亲,他生活的年代也应该在大约15万年前的东部非洲。
“DNA中的遗传密码让亚当、夏娃离开了神话世界,变成了有血有肉的非洲人。
他们成了包括中国人在内的所有人的祖先”。复旦大学生命科学学院博士生李辉说。
李辉解释说。大约15万年前,在东非分化出了很多人种与部落,其中就已经包含了现在的黑、棕、黄、白四个人种的祖先。Y染色体上的M168是目前发现的一个很古老的突变位点,这是人类在要离开非洲时产生的突变,大约发生在10万年之前。那些棕色人、黄种人就是带着这个古老的突变开始向世界扩散。除了非洲以外的现代人都具有这个位点的突变。
10万年前,地球处于冰川期,大部分陆地被冰川覆盖。整个海平面比现在低120米左右,许多海床裸露在地面。在东非,各个部落拥挤在这块炙热的土地上,抢夺着有限的食物。或许是频繁发生类似于现在的卢旺达种族清洗事件,一部分人开始走出非洲。
“又过了几千几万年,现代人在Y染色体基因突变M168基础上又出现了2个突变类型,M130和M89.前者发生在8万年前,后者发生在4万5千年前,人类已通过北非进入了欧亚大陆。”李辉说,最早出来的是棕色人。他们主要是在海边捕鱼为生,并捡食滩涂上的高蛋白食物。他们拿着旧石器和尖木叉,在印度洋岸边走着。公元5万年前,他们已占领了南亚和东南亚的陆地和岛屿。在之后的几万年里,散漫的捕捞捡食生活让他们沿着无边的海岸线,一路走到东亚,之后可能穿过白令海峡到达北美和南美洲。
黄种人走出非洲的时间要比棕色人晚了近5万年。
但他们的扩散速度很快。他们只用了棕色人1/5的时间就到达东南亚。柯越海取样的1万2千个中国人的样本中有11311个样本在M89的位点上发生突变。而这个突变标记在黄种人到达东南亚时就已形成,并且一直在这里做了很长久的活动,之后他们将要进入中国,分化出现在的汉族。
汉藏同源
无论是从外貌到文化,都很难让人相信汉人和藏人本出同源,但分子人类学家对此深信不疑。
最早提出汉藏同源的是中国的一些语言学家。原本在语言学界认为南方的侗傣语和汉语最接近,后来发现与汉语最接近的是藏语。
藏语中大多数字的发音在中国东南部的方言中都能找到,而且字义相同。
藏语和汉语之间存在的不是一般意义的对应关系,而是系统性的一一对应。在语言上,汉族和藏族表露出非同一般的关系。
中科院昆明动物研究所研究员宿兵于1996年在DNA中找到了汉藏同源的证据。他发现汉人和藏人在M122以及在其分支M134上都有相同的突变。宿兵通过对Y染色体主成分分析,发现藏族的突变频率与汉人最接近,这意味着在藏缅语系的诸多民族中,藏族和汉族最接近。他们分化的年代约在5000年前。
金力教授的实验室助理钱吉说,其实中国利用DNA分析自己祖先的迁徙路线已经相对比较成熟了,中科院云南动物研究所的张亚萍、褚嘉祐,哈尔滨医科大学的傅颂滨、李璞,中科院细胞遗传学的徐久瑾等都在进行这方面的研究,只要把各自分散的路线拼合起来就是一条完整的中国人迁徙路线。就目前的研究成果来看,华夏56个民族和东亚、东南亚各民族都是由南亚语系的先民分化出来的,因为他们身上都带有M122的突变。
M122突变大约发生在三万年前,那时中国陆地上的许多山脉被积雪常年覆盖。除了有少数棕色人在黄河、长江流域活动,更多的地方显得空茫一片。这时候,在东南亚的缅甸一带,黄种人的部落已经取得一定势力,棕色人不断向南退缩。
“当中国陆地上的冰川不断地消融时,一支带有M122突变的南亚语人群开始进入了中国。”李辉说,目前发现关于南亚语先民进入中国后的分化路线有3条,共有2个入口,一个是在云南,一个是珠江流域。
其中一支沿着云贵高原西侧向北跋涉,他们最终在距今1万年前的时候到达了河套地区,黄河中上游的盆地。这批汉藏语系的祖先也被后人称之为先羌,他们也就是汉族与藏族人的共同祖先。
这一支南亚先民在出发时的头颅还很圆,又因为地中海贫血基因的关系,出现了大鼻子、厚嘴唇等特征。但他们顺着江,走着河谷,从云南来到甘肃,人体形态也发生变化。而到了高原之后,不再受疟疾影响,加上缺氧,地中海贫血基因的人不容易存活。于是存活下来的人,脸都变得很长,线条、棱角变得刚硬、如同刀削。
在漫长的行进中,他们使用的语言也发生变化。有一种理论认为,这是口耳相传所带来的变化。听的人觉得你在讲另一个字,复述的时候就变成另外一个音了。
李辉说,更重要的是,经过这1万多年的迁徙,在他们的体内M122的基础上又诞生了一个新的突变,M134.这样一直到5000到6000年前,人体内部的DNA又开始“不安分”了,那时,由于粟谷农业的出现,新石器文化开始在这个地区发展。人口的增长使群体必须扩增新的居住地。汉藏语系的两个语族开始分野。
其中一个亚群在M134的基础上又发生了M117的突变。他们带着这个突变向东行走,一直到渭河流域才停留下来。他们掌握了农业文明,开始以农耕为生。这个群体就是华人,也就是后来所称的汉人。“M117是汉人身上很古老的一个遗传突变。”李辉说。
另一个亚群被称为藏缅语族群体。他们离开黄河流域,向西向南迁移,最后在喜马拉雅山脉南北居住下来。
在迁徙的过程中,这个群体就像细胞在不断裂变,分化出了藏、羌、彝、景颇、土家。
华人在渭河流域磨砺出一支骁勇善战的秦人,他们盘踞在关中,积聚着统一中国的实力。还有一部分华人则出了潼关,受到夷人龙山文化和苗瑶文化的影响,分别形成了齐语支和楚语支人群。
秦汉时期,四分五裂的中国被统一,从语言、文字到货币、计量单位等文化层面上,汉族的整体意识真正形成。加上强有力的中央集权统治,之后汉族就没有再出现分化。而文化上的强势让汉族像是一滴浓酽的墨水滴在了中国的版图上,他们带着M117突变迅速地向四周渗透。
模糊的南方民族身份
经过研究,李辉发现,南亚先民沿云贵高原西侧北上形成汉藏语系的同时,从中分离出一支南亚先民朝东南方向迁徙,绕过老挝的崇山峻岭,距今1万多年前,南方的北部湾形成了澳泰语系祖先。这一支黄种人带着M119突变从越南、广西方向进入中国,沿着海岸线往东北走,形成了百越民族。
李辉自己就属于澳泰语系人群,而这是他在研究各民族分支的DNA样本时偶然发现的。
这位博士生在大学二年级前并不知道自己的确切族群。在注册登记时,他会在民族栏里填写汉族,但从小时候起,他就发现自己虽然居住在上海奉贤,但和周围的汉族人在文化习惯上有很大差异。他太爷爷太奶奶有自己深青色的民族服装。他们有自己的节日,农历4月18日,他们会洒水过新年;农历9月18日,他们会把鱼塘里养的鱼都捉起来,斩成段,分成堆,每家每户平均分配。他们有种与生俱来的优越感,不和旁族人通婚。
当时,长辈们给李辉的说法是,他们就是上海的原住民。
直到李辉到云南傣族去采样时才恍然发现,傣族的语言他几乎都能听懂;而与水族人交流,李辉更为惊讶,连那儿的悄悄话、私房话,他都能听懂。回到上海后,他就给自己抽血分析,发现傣族、水族和他自己身上都带有M119突变。
具有M119突变的族群在民族学上又称为百越民族系统,他们历史上的覆盖范围是从越南北部的交趾分布到江浙一带。在千百年的分化中,诞生了黎族、侗族、水族、仫佬族、仡佬族、高山族、壮族、傣族。这些民族在语言上、文化上有很强的一致性,所以也统称越人。“你看我的眉骨向下弯曲的弧度很大,这就是澳泰语系人群的显著特征。”李辉说。
去年,李辉带着他的研究小组,在上海调查吴人和越人究竟是一个民族还是完全分属两个民族。之前在语言学界有观点认为他们同属一个民族,因为他们之间的语言能相互沟通。
经研究发现,他们完全是两个不同的民族。越人在七八千年前就在上海的松江发展。吴人要到3000年前才进入上海。“越人各民族的身上有大量的M119突变。吴人则很少有,他们更多的是M7突变,那是从苗瑶语系分化出来的。”当初南亚先民从云贵高贵西侧进入中国后,还有一支人群与汉藏民族分开了,他们沿着长江往下走,这个时候,他们DNA链上位点在M134的基础上发生了M7的突变。
这个人群在洞庭一带形成了苗瑶语系。“吴人就是苗瑶人东进和南下的汉人同化后形成的,所以他们遗传结构的变化多而复杂。”
东南亚是一个民族分化中心
金力教授的实验室助理钱吉说,从目前来看,在此次“人类迁徙遗传地理图谱计划”中涉及关于中国人迁徙路径的研究已相当清楚,现在只需要做些收尾和补充工作。
比如如今有研究发现,在2万多年前,澳泰语系形成的时候,就有一支部落沿着海岸线往上跑。几乎就没有留下沿途停滞的痕迹。他们一直跑到西辽河流域再停留下来。他们是阿尔泰语系的核心。后来夷人上去了,华人也上去了,在那里进行了一次大融合。形成兴隆j文化。这是目前发现的中国最早进入新石器文化的地方。
之后那些阿尔泰语系的先民又朝周边迁徙,往西分化成蒙古、突厥,往东进入朝鲜、日本,向北穿过白令海峡踏上美洲。“这个地区的DNA采样相对做得薄弱些。在这一次的遗传地理图谱计划中,这些都会加以完善。更多的重点将放在对东南亚的研究上。”李辉正在联系国内的一些著名民族学家,商讨如何制定采样地点和路径,“东南亚是个民族交汇领地,共有近2000个民族,世界上四分之一民族都在东南亚。由于非洲人很早就抵达了东南亚,在这里分化的时间也长,所以东南亚是一个民族分化中心。在那儿几乎一个岛就是一个民族,翻过一座山又是一个民族。”按李辉的想法,研究应该先从老挝、缅甸入手,因为那里还有很古老的人群部落。
李辉说,“从非洲迁徙来的黄种人先抵达缅甸,在那儿形成南亚语系。而目前关于南亚语系的采样很少,这方面的研究工作进行得很缓慢。这次人类迁徙遗传地理图谱计划的工作重点将会落在老挝、缅甸身上,毕竟,南亚先民是东亚人共同的祖先。这部分人群的遗传结构搞清楚了,将会对整个人类迁徙历史提供很大的贡献。”