一、达斡尔族简介
达斡尔族原居黑龙江北岸,清初由于沙俄的入侵,不断内迁,现今主要分布在内蒙古呼伦贝尔市、黑龙江省齐齐哈尔市、新疆塔城市等地。达斡尔族的族源问题,尤其是达斡尔族与古代契丹之间的亲缘关系,一直是学术界和社会各界关注的焦点。学术界从历史、语言、遗传特征等多角度对其族源进行了很多研究,目前主要以“契丹后裔说”“蒙古分支说“蒙古同源说”三种观点为主。
第一种观点“契丹后裔说”是国内有关达斡尔族族源讨论的主流观点。这种说法源自清代官方文件《辽金元三史语解》及部分调查报告,经过民国时期郭克兴(达斡尔族)、陈洪漠及一批地方志编写者的积累口图,中华人民共和国成立后,出现了更为详尽的论证。20世纪50年代,陈述先生从达斡尔族本族历史传说、语言材料、地理故迹、生产技术、组织制度等12个角度论证了达斡尔族来源于契丹的合理性。进入20世纪80年代,沈汇、刘风翁、孟志东(达斡尔族)等人从解读契丹小字音义的角度出发进一步发展了契丹后裔说。
世纪之交,中国协和医科大学的吴东颖等人与吉林大学的许月等人分别采用线粒体遗传标记,从母系遗传角度证实了达斡尔族与古契丹存在一定程度的亲缘关系,进一步引发了学术界和社会各界经久不息的讨论。第二种观点“蒙古分支说”始自20世纪30年代,代表作为阿勒坦噶塔先生(达斡尔族)所著《达斡尔蒙古考》闻,然而此书中的论证多为后世学者所否定闻,且成书之时,正值中华民国推行“五族共和”的民族政策,因此著书过程中存在一定程度的主观构建历史的动因。达斡尔族长期和蒙古族共同生活,风俗习惯较为接近,特别地,达斡尔族的语言与蒙古语同属于阿尔泰语系蒙古语族,故“蒙古分支说”也很流行。第三种观点“蒙古同源说”是达斡尔族族源讨论中的一种微弱的声音。阿勇(达斡尔族)、巴达荣嘎(达斡尔族)都曾撰文论证达斡尔族与蒙古族的同源关系,但他们的观点被部分学者视为异说,认同者较少。
尽管目前民族史学界倾向于认为达斡尔族是契丹后裔,但相关的遗传学证据却十分薄弱。回顾吴东颖与许月等人的研究,发现他们均采用线粒体遗传证据、从母系遗传角度来论证达斡尔族与古契丹之间可能存在一定程度的亲缘关系。吴东颖等人的文章选取了云南本人、达斡尔族、蒙古族、鄂温克族等四个群体与契丹遗骨的线粒体序列比较,发现在这四个群体中,达斡尔族样本与契丹遗骨遗传关系最为接近。许月等人的研究发现,在他们选取的外蒙古人群、鄂伦春族、鄂温克族、达斡尔族、内蒙古人群和北方汉族六个群体中,达斡尔族样本与契丹遗骨遗传关系相对较近,但与契丹遗骨遗传关系最为接近的是外蒙古人群。需要特别指出的是,吴东颖等人曾提出的“契丹与达斡尔族有最近的亲缘关系”这一结论只是相对于其所选四个对比人群而言,而许月等人的研究所选取的数据集与之不同,因此二者的结论有所差别。
行文至此,不得不指出线粒体遗传标记的不足。线粒体遗传标记,男女都有,但是只能通过母亲传给自己的孩子,因此线粒体遗传标记只能说明母系遗传历史。而达斡尔族与当今世界上大多数群体一样属于父系社会,孩子继承的是父亲的姓氏,男孩成年后继续延续家业,女孩则外嫁。因此,随母系遗传的线粒体遗传标记在研究达斡尔族族源上存在先天的不足。另外,线粒体基因长度约为1.6万个碱基,早期的研究者更没有条件开展精细的单倍群和全序列的遗传分析,只是选取了若干高变区上的突变热点进行研究,用于比较的人群数量也十分有限。因此,相关研究的结论可能存在偏差,值得进一步深入探讨。
总之,目前已有的遗传学证据能够说明现代达斡尔族与古代契丹人、现代蒙古语族人群和通古斯语族人群共享一定的母系遗传成分。而这种共享成分,是源自现代达斡尔族对古代契丹人的直接继承关系,还是源自更古老时期的共同始祖人群的母系遗传成分,还有待进一步研究。根据已有的母系线粒体遗传证据,还不足以完全证明达斡尔族就是契丹后裔。
国外也有一些民族史研究者倾向于支持契丹后裔说,但分子人类学家们通常将达斡尔族划归到阿尔泰语系蒙古语族人群下开展研究。涉及东亚群体的多项研究多少涉及了达斡尔族,却未见以达斡尔族族源为核心学术问题的科技论文发表,且研究涉及的达斡尔族样本数量都没有超过60个,样本容量较小,采样地点亦多有局限。
在一项基于Y染色体高通量测序数据的研究中,复旦大学的研究者意外地在达斡尔族中发现了与清代皇族爱新觉罗家族最近的父系遗传类型。结合历史学研究成果,研究者认为达斡尔族的早期历史与清朝皇族爱新觉罗家族的远古起源有很深的渊源。基于已发表文章数据推测,研究者认为爱新觉罗家族的父系Y染色体类型C3b1a3a2-F8951可能源自黑龙江中游一个与达斡尔族的始祖有亲缘关系的古代人群。至此,达斡尔族的起源又和满族的爱新觉罗家族联系了起来。总之,达斡尔族的族源研究是民族史乃至民族遗传学领域的长期热点课题,但前期的研究普遍存在研究方法陈旧、样本数量较少等问题。
二、基因方式研究达斡尔族起源
分子人类学是一门以Y染色体检测技术为核心的分子人类学分支学科,它通过Y染色体上记录的遗传信息追溯家族和群体的源流问题。Y染色体的传承遵循严格的父子传递法则,换言之,任何一名男性只能从自己生物学上的父亲继承Y染色体。Y染色体上存在丰富的遗传标记,包含近6000万个个碱基对20。主流的遗传标记是Y染色体单核苷酸多态性(Y-SNP) 和Y染色体短串联重复序列(Y-STR) ,将Y-SNP与Y-STR信息结合, 亦为分子人类学研究中的常规方法。分子人类学的研究方法已多次运用在历史名人所属的基因类型鉴定上,如美国总统杰斐逊逊四、法国国王路易十六、俄国末代沙皇罗曼诺夫、英国国王理查三世、曹操家族、爱新觉罗家族等。蒙古语族人群特征基因C3-星簇,汉语族人群三大超级祖父基因Oα、Oβ、Oγ等的发现,也是此学科的重要研究成果。
(一)达斡尔族整体族源情况
达斡尔族样本共有29种Y-SNP单倍群类型, 显示了较高的遗传多样性。这些基因类型按其高频出现的群体和地域可以划归到如下几个大类。
首先, 以往在蒙古语族人群发现的四个频率较高的父系类型(C2b1a3a1-F3796、C2alalal-M407、C2b1a1a1-F1756和C2b1a2-M48) 在达斡尔族中均有发现, 共占达斡尔族样本总数的29.47%。这大类遗传类型居于达斡尔族样本总数的首位,反映了达斡尔族与其他蒙古语族人群有着极为亲近的亲缘关系。具体来说, 单倍群C2b1a3a-F3796(原称C3*-星簇) 是现今蒙古语族人群最重要的父系遗传类型,在所有蒙古语族人群均较为高频,在研究中共检出了30例(14.49%)。单倍群C2a1a1a1-M407是布里亚特人和卡尔梅克人的一种主要父系类型, 在研究中仅检出2例(0.97%) 。单倍群C2b1a1a1-F1756(原称C3*-448del) , 广泛分布于蒙古语诸族之中, 但比例都很低, 是蒙古语诸族的一种原始成分,在研究中检出5例(2.41%) 。单倍群C2b1a2-M48(原称C3c-M48)是通古斯语族人群的最主要核心父系类型,这个支系的一部分在某一个历史时期融入以西蒙古一卫拉特人群为中心的蒙古语族人群中,在研究中检出22例(10.63%)。
此前的分子人类学调查中, 单倍群C2b1a3a2-F8951主要出现在爱新觉罗家族中,在研究中检出12例(5.80%) 。其基因谱系位置十分特殊, 首先,单倍群C2b1a3a2-F8951为蒙古语族人群最重要的父系类型C2b1a3a-F3796的兄弟支系,二者具有最近的亲缘关系。这两大父系类型大约在3500年前发生分化,这段遗传历史代表了全体蒙古语族人群最古老阶段的起源和形成历史。其次,在单倍群C2b1a3a2-F8951内部发生了明显的分化, 一支主要出现在爱新觉罗家族,另一支则主要出现在达斡尔族中,这种明显的分化代表了达斡尔人的祖先与爱新觉罗家族的祖先的分化历史。
汉族中高频分布的单倍群O2a2b1a2-F444、O2a2b1a1-M117、O2alc-002611、Q1a1a-M120、O1b*-M268在研究中共检出37例(17.87%),这可能是晚近时期基因交流的结果。其中单倍群O2a2b1a2-F444、O2a2b1a1-M117、O2a1c-002611分别约占中国汉族男性人口的16%、11%、14%, 在研究中分别检出7例(3.38%) 、11例(5.31%) 、16例(7.73%) 。单倍群Q1a1a-M120的分布集中在中国北方地区 ,在研究中检测出1例(0.48%)。单倍群O1b*-M268在长江中下游地区的汉族人群中占有较高的比例,在本次研究中检出2例(0.97%)。
单倍群N1c-M178在研究中检出20例(9.66%),该支系在欧亚大陆北部的分布极为辽阔,下游支系极为庞杂
东北亚群体中较为常见的单倍群O1b2-M176、O1b2-F1942、N1a2a-M128在研究中共检出10例(4.83%)。
四个主要分布在中国南方及东南亚地区的单倍群O1blal-M95、C2a1b-F845、O2a2a1a2-M7、O1a-M119, 共检出30例(14.49%) 。达斡尔族虽经历过数次迁徙, 但从未踏出亚洲北部地区,这部分南方特征单倍群融入达斡尔族的历史值得进一步研究。
其他东亚常见的单倍群O2b-F742、O2-M122+,M134-,KL1-、O2a1-KL1+、002611-、C2c1-CTS948、N1d-F2930、N1*-CTS5221在本次研究中亦有发现, 共检测到33例(15.94%) 。
主要分布于欧亚大陆西部的单倍群J2-M172、G2a-P15、R1a1-M459、R1b-M343在研究中亦有少量发现,共检出6例(2.90%)。这大类单倍群在达斡尔族中频率很低,不占主流成分。
综上所述,达斡尔族父系遗传结构中不同类型的起源深刻反映了达斡尔族本身的起源和发展历史。首先, 以单倍群C2b1a3a1-F3796等为代表的蒙古语族人群特征父系遗传类型的大量存在显示达斡尔族与其他蒙古语族人群有极为亲近的亲缘关系。其次, 以单倍群O2a2b1a2-F444等为代表的一类父系类型表明达斡尔族人中存在很多晚近时期从其他族群融入的成分。最后,大比例的单倍群C2b1a3a2-F8951的发现和测定, 将达斡尔族的族源推向了比古代契丹(公元10~12世纪)、古代蒙古帝国(公元13世纪)活跃时期更为古老的历史深度,进一步说,达斡尔族是全体蒙古语族人群中最古老的分支。
(二)达斡尔族部分主要姓氏的基因族源
研究者基于志愿者的姓氏, 部落起源和Y-STR、Y-SNP信息, 发现8个达斡尔族的主要父系基因类型均与特定姓氏有明显的关联。
敖姓、单姓、多姓多为敖拉哈拉的后人,因敖拉哈拉17世纪中叶以前分布在黑龙江北岸历史名城雅克萨以北、以东山区而名为“敖拉哈拉”,达斡尔语称呼山为“敖拉”的。根据民族学的调查,敖拉哈拉不仅是达斡尔族中最古老的哈拉之一,也是达斡尔族中人口繁衍最多的哈拉。来自敖拉哈拉的样本构成了单倍群C2a1b-F845、C2bla3a1-F3796的主要来源之一, 同时也是单倍群C2b1a2-M48和单倍群C2b1a3a2-F8951的所有样本之中除爱新觉罗家族之外的最核心组成部分。正如前文所述, 单倍群C2bla3a1-F3796、C2b1a2-M48在达斡尔族中的高频存在显示达斡尔族与其他蒙古语族人群有着极为亲近的亲缘关系, 而单倍群C2b1a3a2-F8951的存在更将达斡尔族的起源历史追溯到全体蒙古语族人群的始祖人群开始分化的最古老阶段。对敖拉哈拉的起源进行更深入的研究,不仅可以揭示达斡尔族本身的早期起源历史,更能揭示爱新觉罗家族乃至全体蒙古语族人群早期起源的历史进程。遗憾的是,目前关于敖拉哈拉家族早期历史的研究还十分欠缺。
鄂姓多为鄂嫩哈拉后人(鄂嫩哈拉得名于黑龙江上游的鄂嫩河),鄂姓样本集中出现在单倍群C2a1b-F845和C2b1a3a1-F3796中。安姓多为阿尔丹哈拉的后人(阿尔丹哈拉得名于今俄罗斯境内的勒拿河上游支流阿尔丹河) , 安姓样本亦为单倍群C2b1a3a1-F3796主要来源之一。陶姓和乔姓多为托莫哈拉的后人(陶姓取托莫谐音,又因托莫本义“巧手、灵巧”,部分托莫哈拉后人取汉字谐音“乔”得姓) , 托莫哈拉的样本亦集中出现在单倍群C2b1a3a1-F3796中。孟姓多为莫日登哈拉后人(莫日登哈拉得名自黑龙江中游北岸的莫日登河可),孟姓样本集中出现在单倍群N1a1a-M178中。苏姓多为苏都尔哈拉后人(苏都尔哈拉得名于黑龙江左岸支流苏都尔河),苏姓样本集中出现在单倍群N1a2a-M128中。郭姓多为郭布勒哈拉后人(“末代皇后”婉容即为郭布勒哈拉之后,郭布勒哈拉源于地名“郭布勒阿彦”),郭姓样本集中出现在单倍群O1b1a1-M95中, 但正如前文所述, 单倍群O1b1a1-M95主要分布在中国长江流域以南、中南半岛、印度东北部和东南亚岛屿地区。因此,郭布勒哈拉的族源历史着实引人深思。何姓多为何斯尔哈拉之后(何斯尔哈拉得名于今黑龙江北岸支流何斯尔河),何斯尔哈拉样本集中出现在单倍群O2a1c-002611中。另有金姓(精奇里哈拉) 、吴姓(乌力斯哈拉) 、沃姓(沃热哈拉) 等亦为达斡尔族大姓,但这些姓氏的样本较少且散见于各单倍群中,未见集中出现在特定单倍群的情况。
综上所述,达斡尔族中的主要父系基因类型与姓氏呈现较为明显的关联现象。在达斡尔族的传说中,同一哈拉或穆昆的族人往往拥有一个共同的父系祖先。研究结果也认为这种氏族起源的传说存在一定的可信性。莫日登哈拉的第一代始祖萨吉哈拉、鄂嫩哈拉的第一代始祖额穆盖等人可能并非传说中的人物,而是确有其人,这些传说中始祖的父系基因类型极有可能就是现今各自哈拉主流基因类型之一。反观汉族的大姓内部却很少有同源性,相关Y染色体研究只能在族源明确的小宗族内部开展。这进一步说明,达斡尔姓氏(对应哈拉或穆昆)在传承过程中经历的时间较短,受到非父替换的干扰较少(如改姓、收养外姓或过继等)。
尤为值得注意的是,单倍群C2b1a3a1-F3796和单倍群C2b1a3a2-F8951所揭示的达斡尔族内部的“哈拉”历史。首先,单倍群C2b1a3a1-F3796内部集中出现了来自阿尔丹、敖拉哈拉、鄂嫩哈拉和托莫哈拉的后人,也有部分来自乌力斯哈拉、郭布勒哈拉和沃热哈拉等其他哈拉的后人,该单倍群所包括的氏族最为多样。而单倍群C2b1a3a1-F3796本身是包括达斡尔族在内的所有蒙古语族人群最重要的父系基因类型,因此阿尔丹哈拉、敖拉哈拉、鄂嫩哈拉、托莫哈拉这四个哈拉本身不仅极为亲近, 也与其他蒙古语族人群具有共同的起源关系。其次,单倍群C2b1a3a2-F8951除了在爱新觉罗家族中发现外,还集中出现在敖拉哈拉后人中,亦有鄂嫩哈拉和精奇里哈拉后人各1例。在前文, 已经多次强调单倍群C2b1a3a2-F8951在追溯全体蒙古语族人群起源最古老阶段的意义。此单倍群在敖拉哈拉中的大量发现,进一步说明在达斡尔族的起源和演化历史中,敖拉哈拉占据了最重要、最核心的地位。对单倍群C2b1a3a2-F8951内部结构和分化历史进行进一步解析,将进一步阐明爱新觉罗家族、敖拉哈拉以及达斡尔族的早期起源和分化历史。
父系Y染色体谱系树以及各单倍群在达斡尔族的频率分布
三、结语
正如前文所述,关于达斡尔族的族源问题,主要涉及契丹和蒙古两大族群。在分子人类学领域,蒙古语族群体的族源问题已经研究得较为透彻。此前的研究在蒙古语族人群中发现了四个频率较高、分布较为广泛的父系类型(C2bla3a1-F3796、C2a1a1a1-M407、C2b1a1a1-F1756、C2b1a2-M48) ,不仅在达斡尔族中发现了属于这四类父系基因类型的大量样本,亦发现了属于全体蒙古语族人群最重要的父系基因类型C2bla3a1-F3796的兄弟支系C2b1a3a2-F8951的大量样本。基于遗传学证据,现代达斡尔族的形成是以单倍群C2b1a3a2-F8951和C2b1a3a1-F3796等为凝聚核心, 并在不同历史时期融合了其他来自东亚地区的父系遗传类型。分子人类学角度倾向于支持“蒙古同源说”,即达斡尔族不仅与其他蒙古语族人群具有共同起源关系,而且是全体蒙古语族始祖人群的最古老分支的直系后裔。
另外,与蒙古族不同的是,契丹作为一个民族实体已经消亡。达斡尔族是否与古代契丹人有直接的继承关系, 还需要与契丹古人样本的父系遗传类型进行直接的比对。随着Y染色体古DNA 检测的技术与发展,相信达斡尔族与契丹的遗传关系能得到更为科学的解释。
在达斡尔族内部的家族史方面,发现了主要父系基因类型与姓氏相关联的现象,初步阐明了部分姓氏的遗传起源历史以及这些姓氏人群之间的亲缘关系,并且从遗传上支持了敖拉哈拉处于达斡尔族最为古老和核心的奠基者哈拉的地位。
需要特别指出的是,基于遗传学证据,指出达斡尔族与其他蒙古语族人群具有同源关系,并不意味着达斡尔族与古代契丹人就毫无遗传继承关系。从分子人类学角度分析,达斡尔族起源于契丹或蒙古这两种观点并非完全对立,非此即彼。由于契丹早于蒙古兴盛于草原,因此蒙古之于契丹,极有可能也存在一定程度的遗传上的继承关系,进一步说,达斡尔族也可能继承了一部分契丹的遗传成分。总之,达斡尔族与蒙古语族人群的同源关系已十分明晰,但达斡尔族与古代契丹人的亲缘关系,还有待于更多科学证据的支持。