东亚是亚洲的一部分,面积广阔、风光旖旎。东亚有着占世界22%的人口,主要分为四种体质类型:新石器时代东亚人,即蒙古人种;旧石器时代大洋洲人,即澳大利亚人种;旧石器时代东南亚人,即尼格利陀人种;还有欧洲人即高加索人种。东亚有阿尔泰、南亚、南岛、侗傣、苗瑶、汉藏和印欧等七个语系的200多种语言。这使得东亚成为世界上研究人类进化、遗传多样性和基因与文化相互作用的最重要区域之一。
在过去数年中,分子人类学的研究者们通过使用常染色和X染色体、父系Y染色体、母系线粒体等等各类遗传标记体系来解析东亚人群的遗传多样性。常染色体和X染色体遗传自父母双方,会被重组所打乱,而Y染色体上主干的非重组区呈严格父系遗传,并且Y染色体的“有效群体大小”理论上至多为常染色体的四分之一,X染色体的三分之一,对漂变非常敏感,容易形成群体特异性多态标记,从而包含更多的关于群体历史的信息。Y染色体的这些特点使其成为研究人类进化和迁徙最强有力的工具之一。
Y染色体进入人们的视野,开始于其在追溯现代人起源上的应用。自上世纪90年代以来,人类学界争论最激烈的话题,是东亚地区现代人的起源问题。由于东亚出土了大量的古人类化石,一些人类学家认为东亚地区的人类是本土连续进化的,支持全球现代人的多地区起源。然而,1999年宿兵等人采用Y染色体非重组区的19个SNP来研究东亚人群,得出东亚地区现代人起源于非洲,并由南方进入东亚,而后向北方迁。随后,2000年柯越海等人的对东亚地区12127份男性随机样本的Y染色体进行SNP分型研究。Y染色体突变M168被认为约是7.4万年前现代人走出非洲时所产生的突变,其原始型仅出现在东非人群中,除非洲以外的人群都是突变型。柯越海等人的研究虽然没有直接检测M168这个突变,但他们检测了M89、M130和YAP这三个M168下游的突变。结果显示这一万多份样品无一例外都带有M89、M130和YAP三种突变之一,也就是说都是M168突变型。尽管现在来看,东亚现代人或也与一些古人种有基因交流,但从父系角度看,现存的东亚人群都是走出非洲的后裔,这是支持现代人非洲单一起源的强有力的遗传学证据。下一问题就要回答早期现代人是如何迁徙来到东亚的。
人群的迁徙和分布与气候的变迁有着密切的关系,为便于从不同角度探索和认识人群演变规律,我们这里介绍一些近10万年来的气象学的材料。在距今约11万-1万之间,也就是考古学上的旧石器时代到中石器时代,地球处于末次冰期,那段时间,海平面远低于现在,许多现在的岛屿与大陆相连,成为了人类迁徙的重要通道。距今2.65万年到1.9-2万年是末次冰盛期,是末次冰期中气候最寒冷、冰川规模最大的时期,亚洲的绝大部分、北欧和北美都被冰雪覆盖,人类的生存空间也随冰川蔓延而逐渐缩小。大约1.5万年前,气温开始转暖,冰川也开始退却,现代人才迎来了迁徙的黄金时期。
本文中,我们主要应用Y染色体的数据来分析东亚人群的迁徙历史,并探讨现代人最初定居东亚及其后的迁徙和扩张模式、微进化历程等。
北方路线还是南方路线?
现阶段比较一致的看法是东亚的欧洲人种类型来自西北、澳大利亚人和尼格利陀人来自东南[4,10],最具争议的还是蒙古利亚人来自哪里。有三种可能的模式:1)蒙古利亚人由北向南迁徙,与东南亚和中国南方的尼格利陀和澳大利亚人种混合;2)蒙古利亚人来自南方;3)北方人群来自北方,南方人群来自南方,自1万多年前的晚更新世以来,蒙古利亚人在南北方共同进化。Y染色体是解决这一争议的有力工具。
Y染色体可以分为20种主干单倍群,编号从A到T(P可能不存在),其中O-M175,C-M130,D-M174和N-M231是东亚四个主要单倍群,约占到东亚全部男性的93%(图1)。其他单倍群,例如E-SRY4064,G-M201,H-M69,I-M170,J-P209,L-M20,Q-M242,R-M207和T-M70仅占到东亚男性的7%。
图1.Y染色体总单倍群C、D、N和O在东亚的地理分布
O-M175是东亚最大的单倍群,约75%的中国人以及超过50%的日本人都可归到这一类型下,因此有理由认为它代表着蒙古利亚人。O-M175分出三个主要的下游单倍群O1a-M119、O2-M268以及O3-M122,这三个单倍群约占到东亚男性的60%。O1a-M119在中国东南沿海、侗傣族群、台湾原住民中集中分布。O2-M268约在汉族中占5%以上,O2a1-M95是O2下的主要支系,在华南、南方少数民族、中南半岛及印度门哒人群中分布较多。O2b-M176是O2下的另一支系,最主要集中于朝鲜半岛、朝鲜族和日本弥生人,越南人和汉族中也有少量分布。O3-M122是中国最常见的单倍群,遍及整个东亚和东南亚,占汉族50-60%左右。O3a1c-002611、O3a2c1-M134和O3a2c1a-M117是O3下的三个主要支系,各占到汉族的12-17%左右。O3a2c1a-M117在藏缅族群中也有较多分布。O3下的另一支系O3a2b-M7在苗瑶和孟高棉人群中高频出现,但在汉族中却不足5%。
宿兵等在亚洲大范围群体样本中对包括M119、M95和M122在内的19个Y染色体SNP位点以及三个STR位点进行了检测。在随后的主成分分析中,北方人群紧密聚在一起,且都被包含在南方人群的聚类簇之内,南方人群比北方人群多样性更高。他们认为北方人群来自于旧石器时代定居南方的南方人群。他们还使用STR位点的一步突变模式和0.18%突变率估算O3-M122这一单倍群的时间为1.8-6.0万年,这一时间可能反映的是最初定居东亚的瓶颈时期。2005年,石宏等东亚多个群体的2000多个O3样本进行了更系统的研究,他们的研究也发现南方群体中的O3-M122的多样性高于北方,支持O3-M122的南方起源。他们进一步使用均方差(ASD)方法和STR的进化突变率(0.00069每位点每25年)估算O3支系北迁的时间为2.5-3.0万年。最近,蔡晓云等对东南亚的孟高棉和苗瑶族群中的O3a2b-M7和O3a2c1a-M117进行了系统研究,揭示其在1.9万年前末次盛冰期时候经由东南亚进入东亚的单向瓶颈扩散。O3下的另一主要支系O3a1c-002611的STR位点多样性也与其他兄弟支系一样有着大体上的自南向北递减的趋势。总体来看,绝大多数证据都支持Y染色体单倍群O3-M122经由南方路线进入东亚并逐渐向北扩散(图2)。
图2.Y染色体单倍群C、D、N和O在东亚的迁徙。虚线表示另外可能的迁徙路线