姚大力：谁来决定我们是谁——关于中国民族史研究的三把钥匙

我们今天比较容易习惯于把民族看成是一个固定的基本事实，好像它自开天辟地以来便自然、自动地存在着，实际上不是这样的。一直到商代末年，我们大概都还没有充分理由说，华夏这样一个人群已经完全存在了。

谁来决定我们是谁？凭着一个最直接的感觉，似乎就能很轻易地回答这个问题：是我们的爸爸妈妈决定我们是谁，甚至我们的名字也大都是父母起的。那么又是谁决定了我们的父母是谁呢？是他们的父母。由此看来，好像是这样一串血缘的链环在决定我们究竟是谁。

但如果把对人群进行界定和分类的范畴从一个家族、宗族扩大到某种更大型的人群，扩大到迄于今日为止每个中国人都必须归属于其中的那五十六个经过官方正式认定的“民族”——我们现在填表还经常需要填写本人是属于哪一个民族的——那么这样一种被称为民族的集体身份范畴，又是由谁来决定的呢？它还是由以上讲到过的爸爸妈妈的血缘链环来决定的吗？也许有人会赞同这样的回答。但在实际上，当我们要去追溯对一个大型人群集体身份的意识之形成及其发育过程时，问题就变得复杂得多了，变得与我们在界定某个个人的族群身份问题时大不一样了。

所以在中国民族史的领域内，有一个非常重要的问题，也可以说是在我们从事中国民族史的研究时始终在激发我们的想象、兴趣和动力的一个相当根本的问题。那就是今天在中国这块土地上的各个民族的祖先，他们究竟是怎样起源、又怎么样互相分化和融合，以致形成今天这样的分布格局的？最近十多年以来，由于历史学之外几个相关学科的进展，已使我们有可能把对上面提到的这个问题的认识大大地向前推进一步。所以，作为研究中国民族史的从业人员，我给自己提的一个问题是：我怎么面对民族史以外的学科给予民族史的这种促进，甚至可以说是刺激？怎么去面对它们所能提供的很多概念、方法和具体知识内容，并且把它们跟中国民族史的专业研究结合起来？在这样的结合中，我们又会获得怎样一些有意思的成果与结论？

在这里，需要密切予以关注的历史学以外的相关学科，主要有三种。我觉得可以称它们为揭开存在于民族史研究中诸多重要谜团的三把钥匙。这三把钥匙，或者说三个学术领域，第一个是分子人类学。第二个是比较历史语言学，属于语言学领域内的一个分支。第三个属于社会学领域，即其中的民族社会学。谁来决定我们是谁？且让我们分别看看，这三个学科领域怎么样回答与此相关的诸问题。也就是说，在回答有关“我们是谁”的问题时，这三个不同的学科领域会各自给予我们一些什么样的启发或者帮助？了解这些以后，对究竟是谁在决定我们是谁的问题，理解起来大概也就会更容易一些了。

先说第一把钥匙。分子人类学在考察史前人类的起源、分化及其分布状态的时候，采取的是什么样的分类范畴，换言之，它以什么样的人群作为它考察分辨的对象呢？这个对象显然不可能是个人或家庭。在处理与此相关的课题时，分子人类学对其研究对象的分类范畴，往往与语言的分类联系在一起，即根据人们所使用的语言的不同而将他们划分为不同人群来进行分辨与考察。那么这是为什么呢？

在我们从自己的文化母体所承继的全部遗产要素中，语言大概是最难被放弃与改换替代的。要一个颇具规模的人群整体地、自动地遗弃自己的母语而以另一种外来语替换之，虽然不能说完全不可能、并且从未发生过，至少也是不太常见的。正如某个文化人类学家所说的那样，人们总是“倾向于非常勉强和无限缓慢地做这件事”。正因为如此，语言是我们可以寻找到的能在极大程度上反映出人群内部原始联系的一个最合适的指征。尽管语言的边界未必一定就是种群的边界，并且任何一个操同一语言的人群事实上都早已变成了所谓混合人群，但语言依然可以作为考察原始人群起源、分化，不同原始人群的分布状况及其相互关系，乃至他们各自与现当代诸人群之间相互关系时的基本所指，或曰基本范畴。

比如我们会说，大约六千年前，活动于今日西北中国、创造了前期“仰韶文化”的群体，分化为向西扩展的原始藏缅语族共同语人群和向东扩展的原始汉语人群；我们甚至可以把分化发生之前的那个创造了前期仰韶文化的人类共同体称为操原始汉藏语系共同语的人群。研究汉藏语系语言史的学者很早就发现，汉语与属于藏缅语族的诸语言具有发生学意义上的共同起源。但是光采取比较历史语言学的研究方法，大概永远无法回答：汉语与藏缅语族的分化，究竟发生在何时、何地？正是分子人类学，向我们提供了寻找这类答案的最关键的帮助。

我们知道，分子人类学研究所追踪的一个非常重要的对象，是人体内的遗传物质DNA。就我们现在正在讨论的主题而言，其中尤其重要的是经由父系遗传的Y染色体DNA和母系遗传的线粒体DNA，或者更准确地说，是储存于上述种类DNA中的遗传信息。可以毫不夸张地说，通过从群体水平上考查和分辨各种不同语言的混合人群所具有的特殊遗传结构，分子人类学在最近的二十年里面，给予我们了解古代人群起源、发育、分化和融合以极大的提示。

下面就让我们依据分子人类学的新近研究成果，对今天中国版图内各民族的起源、分化与融合过程作一个尽可能简单易懂的介绍。我想此前的讲座一定已经提到过，今日中国绝大多数人口的祖先，是在大约两三万年前到达今缅甸西部后分成不多几支，从中南半岛先后进入今中国境内的。其中横穿老挝进入北越和广西，并沿中国东南海岸线不断北上的一支，逐渐形成为说原始南岛-壮侗共同语的人群；大约六千年前，他们又分化为说原始壮侗共同语，以及说原始南岛共同语的两个人群。约三万年前与后来说原始南岛-壮侗共同语的人群各自分叉、经今缅甸-云南交界地区入滇的另一支人群内部，在两万年前左右又发生进一步的分化，由此产生说原始孟-高棉语族共同语，以及说原始汉藏-苗瑶共同语的两个人群。后者又在约一万两千年前取道云贵高原北上入川，而后又在那里分化为说原始苗瑶语族共同语和说原始汉-藏缅语共同语的两支。然后正如上面已经提到过的，又经过六千年，说原始汉-藏缅语共同语的人群在其迁徙所至之西北中国再分化为两支，即说原始汉语和说原始藏缅语族共同语的这样两个人群（图一）。

不过到此为止，我们的故事还没有说完。实际上，比原始壮侗共同语人群沿东南海岸线的北上更早，早已有另一支人群到达了今日的北部中国。他们大概在六万至四万年前就已经在藏缅走廊或其邻近地区，从先前走出非洲后沿阿拉伯海岸东行、又横跨印度次大陆的原始人群中分化出来，并且经由与其后的原始壮侗语人群大致相同的迁徙路线抵达渤海湾西部各地。从这支人群中，后来又分化出说原始蒙古共同语和说原始通古斯共同语的两个人群，但这次分化的时间目前还不克确知。

突厥语人群的起源比较复杂，这里暂且不去说它。但很值得在这里顺便说一说对所谓“阿尔泰语系”的新认识。很久以来，对是否应该把蒙古语族、通古斯-满语族和突厥语族的诸语言纳入同一个“阿尔泰语系”，也就是这三个语族是否在语言发生学的意义上具有共同起源的问题，在比较历史语言学家之间一直没有取得完全一致的看法。对于操这三个语族的诸多族群所进行的分子人类学考察如今告诉我们，说蒙古语族和通古斯-满语族诸种语言的人群之间，存在较近的共同起源关系，而他们与突厥语诸人群之间的亲缘关系就要疏远得多了。

毫无疑问，随着研究工作的进一步深入和实验方法的进一步改进，对上面提到的这些结论，有些可能需要进行程度不等的调整，有些甚至要作很大的更动。但是对本学科发展所可能赋予东亚或中国民族史研究的巨大推动意义，无论如何是不应该被我们忽略或低估的。

现在再回过头来看仰韶文化。刚才说到，创造前期仰韶文化的人群，面临着一个东西的分化，于是就产生出说汉语的以及它西面说藏缅语族诸语言的各人群。为什么在这中间会发生断裂呢？我们不难了解，离开关中平原再往西面走，虽然还有一些零零碎碎的可以用于农业耕作的土地，但像这样可以耕作的地方已很难连成一片。也就是说，在那里已没有办法建立一个大规模、大面积的农业社会。而如果从关中再向东走，情况就大不一样。在那里，从事原始的灌溉农业，条件一点也不比关中差。主要靠风力搬运堆积起来的黄土高原和主要由河水夹带的黄土泥沙冲积而成的黄土平原，为从事原始的灌溉农业的人们提供了非常相近的生存环境。

因此，如拉铁摩尔早已指出过的那样，汉族的祖先向西拓展生存空间的活动，在某一个阶段被迫突然停顿，因为再往西走便无法进行他们所擅长的大规模的原始灌溉农业。从这次突然的停顿，到东部的人类聚集了足够能力，需要回头去进一步地开发、利用那些小片土地的时代之间，这中间还得等很长一段空隙时间。时间的空隙导致空间的空隙。原先同一个人群就此分离为互相隔离的两个群落。西半部的那个人群在越来越向西、并从那儿不断向南寻找生活和生产资源的过程中，逐渐放弃大面积原始灌溉农业，而发展出适合于当地环境的半农半牧或流动畜牧的生产方式，并且将比他们更早就已到达藏缅走廊的带有Y染色体遗传标记D的古人群（目前还不清楚他们究竟操何种语言）融合在自己的群体之中。长时期的相互隔离，最终导致他们的语言与其昔日东部伙伴们所使用的语言相比也发生了显著变化。

在其西部突然收缩的那个人群的分布区以东，本来有另外一个原始农业文化，就所谓大汶口文化或者说后来的龙山文化（图二）。结果，向东发展的仰韶文化与由东向西扩展的龙山文化，在充分的交流中间产生逐渐融合的趋势。在公元前2000年之后，从华北的原始文化中间，终于产生了由原始的史前文化跨越早期文明门槛的突破，中国早期国家就这样从成百上千的一大群酋邦社会中诞生了。但这里所谓“跨越”，并不像我们在实际生活中跨越一个门槛那样简单快捷。我们甚至还无从了解，究竟是在什么样的一个时间节段，华北史前文化算是完成了向早期文明的这次跨越。总之它大约发生在公元前第二千纪的上半叶（前2000年至前1500年之间）。而整个的公元前第二千纪，正可以被包括在一般人都熟知所谓“三代”，也就是夏、商、西周的时期内（直到这个千纪的末尾，西周还开始不久；此后它还将有二百三十年的寿命）。可以确定的是，至少在晚商之前，从史前向早期文明的跨越，肯定已经在华北社会内实现了。

所谓夏、商与西周，往往被今天的人们理解为是三个互相接续的“王朝”。这本不全错。但那时的“王朝”还根本没有秦汉、隋唐、明清这样的专制君主官僚制的国家机器。当时所谓“王”或者“天子”，与秦以后中央政府的皇帝也大不一样；他们无非都是高踞于华北数百成千个“方国”（其中既有早期国家、也当有不少还是酋邦组织）统治者之上的众王之王。另一点需要加以强调是，我们很容易想当然地以为，所谓三代，乃是此前早已经形成的具有共同文化的同一大型人群所相继经历的三个统治王朝。但实际情况并不是这样。这三个“王朝”各自的基本力量，其实是分布在华北三地的三个不同人群（图三）。西周在关中，夏在河南及山西南部，商人的本据地则分布得更靠东面一些。而所谓华夏，就是夏人、商人和周人以及不同程度地受他们支配控制的华北各“方国”人群，经过公元前第二千纪的漫长融合，而逐渐被形塑而成的一个具有共同文化的人们共同体。由于他们属于数量很大的一批不同国家，所以又有“诸夏”之称，即“华夏”复数的意思。“华夏”从一个带有复数性格的专名，变成纯粹单数形式，是在秦始皇统一六国后发生的。

“华夏”或“诸夏”，可以说就是今日汉族可以追溯的最早的祖先人群。在将近一千年的漫长时间段里，这个人们共同体在越来越多的交流、沟通与相互融合的过程里，形成了若干重要的共同文化因素。其中包括块范浇铸的青铜冶炼技术，以晚商甲骨文和铭刻在周代青铜器上的“金文”为代表的汉语及其书写系统，传说中由周公创设集成的西周礼仪制度，以及至今称为“夏历”的太阴历与太阳历相结合的中国农历，等等。晚商青铜器的精致华丽（有人说它们体现的是“狞厉的美”）是众所周知的。西周延续着这种青铜铸造技术，发展到西周中后期形成中国青铜铸造技术的又一个高峰，但它的艺术风格已经与商朝大不一样了。最原初的夏人、商人和周人究竟是否全都说古代形式的汉语，这个问题现在无从确知。但甲骨文和金文记录的无疑是汉语的书面语。至少自晚商以后，上古汉语已变成华夏人群的共同语言是没有问题的。今日汉族的前身，就这样在公元前第二千纪的后期始而现身于华北。

我们今天比较习惯于把民族看成是一个固定的基本事实，好像它自开天辟地以来便自然、自动地存在着，好像它可以完全离开人的主观意识而独立地存在着。实际上不是这样的。一直到商代末年，我们大概都还没有充分理由说，华夏这样一个人群已经完全存在了。华夏的成形，恐怕要晚至西周的时代。这样一个人群的分布范围，因而也必须直到此时才大体上可以被画出来（图四）。

制作这幅地图的基本依据，是一部叫《诗经》的经典。我们都知道《诗经》对古人来说是一部“经”，对我们今天来说是一部很重要的文学作品，同时也是重要的史料。但《诗经》为什么还会把有关民族史的信息告诉我们？为什么还会告诉我们“华夏”在那个时代的分布范围？

《诗经》分“颂”、“雅”和“风”三部分。“颂”和“雅”大都是宫廷或贵族世家举行礼仪时所用音乐的歌词，也有一些则属于贵族们的创作之类。“风”有些不一样。直到现在，我们还把采集民间风俗资料的活动叫作“采风”。“风”在当日，主要是各地的民歌。因为当时周天子要考察评判各个诸侯国的治绩，需要收集各地区的民间风俗习气的资料，而民风就反映在民歌里。所以民歌变成了官方收集资料时的对象之一。这些“风”当然都是用汉语传唱的；它们的形成基础，就是分布在这些地区之内、由说古汉语的人群所组织起来的地方性社会。

我们可以根据《诗经》所记录的来自各地的“风”，比如齐风、豳风、秦风、郑风、卫风等等，把华夏人口分布的各地理区域逐一复原出来。再加上《诗经》无记录（如古人早就讨论过的“鲁、宋无风”）、但可以确知属于华夏的那些地域，就能够把当日华夏人口的外部边界勾画出来。《诗经》的写作年代是公元前十一世纪到公元前六世纪。《诗经》中的“风”就这样曲折地把处于上述时段中的古汉语人群分布的大体范围告诉了我们。这个区域，大致上包括华北的黄土高原和黄河中下游平原这两大灌溉农业区，其南部边界则在汉水和淮水流域的南沿。而有了华夏人群分布的一个基本地理指标，处在它之外的那些“蛮夷”、“戎狄”等人群的分布地带也就被显现出来了。

必须强调的是，在《诗经》写作的几乎整个时代，华北的核心地区事实上还远远没有被汉语人群的祖先集团所铺满。这个地区内并非只分布着“华夏”诸人群。在它们之间，还存在大片的空隙；其间也活动着很多非汉语的人群，就是所谓“戎狄”或“蛮夷”。在公元前六世纪之前极长的一个时期中，“戎狄”或“蛮夷”实际上是与“华夏”交错地分享华北这片土地的。大概也就在公元前六世纪，即《诗经》时代临近结束的时候，“华夏”刚刚做到基本上铺满在这一区域，从而将华北的核心地段整个地变成了“华夏”据有的地方，并先后把其他的那些不讲汉语的人群排挤到这个地区的边缘。这个排挤过程不一定就是把被排挤者赶走，也有很多人被华夏所同化。比如在春秋早期，人们很清楚地知道，中山国不是华夏，而是白狄建立的国家。但到战国后期被赵灭国时，它就几乎完全华夏化了。很多拒绝同化的人群则被驱逐到华夏边缘。

恰好是在公元前500年，《左传》在本年度的记事里载录了孔子的一句话，叫“裔不谋夏，夷不乱华”。古代文字讲究对仗，华、夏互对，“裔”则与“夷”相为对仗。“裔”最原始的意思是衣服的边缘，引申为空间的边缘。孔子在这句话里以“夷”为“裔”，就非常明确地告诉我们，在他的年代，非汉语的人群已经在空间分布上被边缘化了。早已存在的内“夏”外“夷”观念，于是从一种文化观念或文化的态度，进而转换为一种空间分布的格局。如果“华夏”占据的只是华北的两大核心地区，那么我们就必须进一步回答这样一个有趣的问题：在华夏诸人群的周围，又分布着一些什么样的人群呢？

关于汉语流行区在南方的边界，宋朝人有一项发现十分值得今人重视：“南方之人，谓水皆曰江。北方之人，谓水皆曰河”（见宋祁：《宋景文日记》上）。此人虽然很敏锐地发现了这一事实，但他的解释却依然受到当日知识范围的局限。他只能说，这是“随方言之便”。中国的南方和北方是以什么来分的呢？在东部以淮水分，淮水以北是华北，皆称“河”、称“水”；淮水以南属于南部中国，在那里才有“江”的称呼。再往西的分界，是汉水和秦岭。所以到明朝又有人发现：“秦岭以南之水皆谓之江，秦岭以北之水皆谓之河”（见王樵：《尚书日记》）。结合刚刚讲到的华夏分布地域，不难发现，它恰好与谓水为“河”的地区重叠。可见 “河”与“水”应该是汉语里固有的词汇。“江”字则并非如此；宋人说它是一种“方言”，但它其实不属于汉语方言的词汇。

现在大部分的比较历史语言学家都同意，“江”这个词实际上是当时居住在南部中国的人群对河流的称呼，最初是长江的专名，就像“河”是黄河的专名一样。逐渐地它又从专名变成一个泛指河流的普通名词。凡大一点的河流，只要不是小水小溪，就都叫做“江”。那么它究竟出于什么语言呢？这就需要借助于解开民族史上许多谜团的第二把钥匙，即比较历史语言学，以及多语种文献对读中的审音勘同方法来帮忙了。

“江”字最初作为长江的专名，本来是居住在这条江边的土著人群对它的称呼。从华北南下的汉语移民入乡问俗，向当地土人问得它的名称，遂创制出“江”字来记录这个异族语音的音读。所以该词用作水名，在传统时代仅只流行于南方。当然，这里有一个例外，即中国东北从宋辽金时期以往即有以“江”作为水名的。但那还是通过朝鲜半岛上与南北朝时代的南朝诸政权结盟交通的百济国介绍，仍从江南经由朝鲜半岛北传的结果。这样说来，用“江”字来记音的那个词汇，究竟源出于什么语言呢？比较历史语言学家们几乎一致同意，它的原字是一个孟-高棉语词汇krong，译言“河流”。汉语人群从他们徙居处的当地土人嘴里听得krong的名称，于是造出“江”字来记录它的读音。该字古音或读作kang，恰与krong之音相近。我在介绍分子人类学这把钥匙时已经提到过，中国境内的早期居民中，确有说孟-高棉语的人群存在。从两种完全不同的途径所推衍出来的考察结果互相支持，足见这个结论是基本可以置信的。

当我们说，“江”在上古汉语中发音kang，所以才会被用来记录krong这一外来词的语音时，乃是以上古汉语中不存在复辅音声母作为其前提的。自从1970年代起，在对上古汉语音韵学的研究领域内引入与藏语语音的比较研究方法之被越来越多的学者接受之后，将“江”、krong两字作对勘的解释甚至变得更加引人入胜了。因为从比较汉-藏同源字的语音可以发现，上古汉语音系中存在带-l-的复辅音声母，其可能性是很大的。例如从藏语“加”的语音bkral-ba，可以知道它与汉字“加”实为同源字，是则汉语“加”字的读音经历了由kla到ka的演化，而后再演变为普通话里的jia。藏语“盾甲”、“鱼鳞”读作khrab，是知它与汉语“甲”字同源，则后者的读音曾经过klap＞kap＞ka＞jia的变化。藏语“冷”字作grang-pa，与汉语“凉”同源，则后者读音作gljang＞ljiang＞liang。再举一个例子：藏语房子、村庄作grong，它与汉语的“巷”同源，后者的读音变化是ghlan＞ghan＞xiang。

如果我们同意上古汉语中存在带-l-的复辅音声母是一个事实，那问题就来了：当日“江”字的声母是否属于带-l-的复辅音呢？这个问题有点麻烦。在以“工”表示形声的汉字里，可以找到藏语同源词的有“空”、“恐”（又写作■）二字，它们的藏语读音分别作khung（意为“孔”、“坑”）和khjwong（意为“害怕”）。由此判断，它的声母似乎不带有舌音-l-。上古既然存在带-l-的复辅音，古人为什么不挑选一个可以更真确地反映原词读音的汉字，而偏要选用不带-l-的“江”字来记录krong这样一个外来语词的语音呢？可见我们虽然相信“江”字源于krong的译音，但这个说法中还留有一些疑难未决之处，至少还不能令人完全信服。

因为史料不足，类似的例证并不太充裕，但这方面也绝非仅有孤证而已。另举一个著名的例子，汉代有人说，“越人谓死为札”（郑玄：《周礼注》）。这同样只能源出于一个孟-高棉语的词汇chad，译言“死”。“札”字古音读为入声，原本带有-t的收声；而汉语里的zh、ch、sh等辅音出现颇晚，“札”字的声母在从上古音演变到中古音之后属于“照”母，直到那时候，它的发声仍颇与ch-相近。所以汉人采用“札”字来记录chad的语音，是十分恰当的。有人以为，古代记载里的“濮人”，其所操或即孟-高棉语族里的某种或某几种语言。“濮人”在上古曾深入江汉以南之地，后来逐步向西南退却，南北朝时尚居住于今云南腹地。时至今日，他们已仅只出没于云南边境的高山区，分别被称为布朗族、德昂族和佤族。

南部中国的古代居民，远不止说孟-高棉语的人群一种。司马迁在记载长江下游流域及其以南的东南部中国土著人时，把他们统称为“越”人。对司马迁来说，最要紧的区别在于他自身所属的讲汉语的人群和不讲汉语的人们之间的区别，也就是自我与他者之间的区别。至于他者之中还可能包括着很多不一样的人，这就不如前一个区别那么重要了。不过司马迁对这一点依然有明确的意识，他知道被统称为“越人”的，其实不止少数一两种人而已，所以他又把这个地区命名为“百越”之地。“百越”里有说孟-高棉语的人群，但不止如此。在比较早先的时期，他们很可能曾是“百越”中最发达的人群，但后来这样的地位却被其他一些人群占据了。至少在春秋战国时代及其以后，孟-高棉语或许已不是“百越”中最居支配地位的一种语言。

然则在“百越”这个人群里面流行的最主要语言又是什么样的呢？现在选一个最有趣的例证来说说。西汉末的刘向在他的《说苑》一书里，记录了一首叫做《越人拥楫歌》的歌词。据他说，楚国的一个王室近亲某日泛舟于江河。替他划舟的船夫深感荣幸，于是用越语为主人唱歌。那个王室近亲说：“吾不知越歌，子试为我楚说之。”乃“招越译而楚说之”。

所谓“楚说之”，是指用楚地流行的汉语方言（“古楚方言”）来对越语进行翻译。《说苑》于是也用两种方式载录了这首歌词。一种是以汉字记越语语音的译写文本，一则是前者之“楚说”，也就是对越语歌词的汉译文本。现代研究壮侗语的学者，可以根据壮语或者侗语去解读《越人歌》的写音文本，把它翻译成汉语，再跟刘向记录的汉译版本作对照，意思大致相类。不过刘向记录的汉译，意思要更曲折复杂一些。大概这是因为那个翻译者受到楚辞风格的影响，于是把它弄得“词采声调，宛然楚辞”。朱熹因此还把这篇译文收进了《楚辞后语》。

凭这条证据，我们能大概知道，所谓“越语”，很接近今天的壮语、侗语或水语等等。当然此外也还有其他资料可以证实这一认识。最大的问题在于，可惜我们不知道这名楚国贵族是在哪里听到这首歌的。根据一般理解，“越”应指长江下游，而长江中游则属于楚地。因此我们脑子里总有一个固定的印象，把“越”和“楚”看成两个不同地方的地名。但是有没有另外一种可能，即实际上楚地的土著居民至少有相当一部分也是越人？因为刚刚已经说了，“楚说”并不是指某种不同于汉语的楚地土著用语，而是指汉语的楚方言。因此也许我们可以作下面这样的假设：即楚国统治者，不论由于他们已经相当程度地华夏化或者本来就是南迁的华夏族人，他们说的已是汉语的古楚方言，其中有些人甚至已听不懂当地流行的土语了；而越语就是当地老百姓的母语。也就是说，“越”和“楚”可以指两个不同的地方，但也完全有可能是指身处于一个地域之内的两种不同身份的人群。

为什么我要强调这一点呢？因为想知道楚文化——比如屈原写的那些楚辞，为什么会那么特别。你们去看看《诗经》，大多四个字、四个字一句，规矩得很。《诗经》中很多篇目，都好像是板着脸写出来的。它有时当然也很有感情，但好像就是不肯忘记把脸板起来。所以叫“乐而不淫、哀而不伤”。快乐你也不要过分，悲哀你也不能因此便伤害了自己的身体。总之它太讲究中和，另外也很有纪律，像我们游行队伍里的方阵一样。《楚辞》就大不一样，句子长长短短、参差不齐，语气词特别多，还出现了那么多妖怪，和一心想勾引天上诸神的美丽的女巫。你在《诗经》里哪能看得到这些？看不到的，完全不一样。

所以当《楚辞》传入华北社会，这么一种来自蛮夷之邦的文学形式，竟让北方汉人非常吃惊、非常喜欢。这就带来一个问题：楚文化究竟是什么？研究文学史的人，如果只把屈原的作品，甚至把庄子、老子那些充满了浪漫、辩证气息的文本，仅仅看作是北方的汉文化在楚地的一种形态，那是远远不够到位的。如果从另一个角度提问，为什么一个板着脸的北方文化，到了南面的楚地竟会变得那样的妖艳浪漫？问题于是也就转变为：楚文化的底层是什么？是什么东西在影响迁播到那里的汉文化，使它变成了另一种样子？

在我看来，这才是一个有意思的问题。那么楚文化的底层到底是什么呢？它是越文化吗，还是别的一种文化，比如说苗瑶文化？那个地方还有没有藏缅语人群留下的影响？你们看，问题就变得极其复杂了！因为我们知道，楚文化所在的地区，即两湖——洞庭湖和鄱阳湖及其以北地区，是一个可以从四面八方涌进不同人群来的地方。汉文史料对上古南方中国的记录太不充分、太过零碎。由于这些困难，想对上述问题给出某种最起码的回答，目前还只能寄希望于今后开展的各学科通力合作基础之上的更深入研究。

中国西北，自河西走廊西至今日新疆，又是另一种情况。新疆，尤其是南疆一系列小绿洲，是在人类发明游牧文化之前联系东亚和中亚所必经的所谓“瓶颈”地区。东亚人由此西行，中亚，甚至更西面的人往东迁徙，都要驻足于此。“沉淀”在该地区的史前人口中，似以由西方东来的说印欧语的“高加索人”为多。楼兰出土的四千年前的美女黄头发、高鼻深目。她的黄头发肯定不是染的，不然老早就褪色了。

进入南疆的印欧语人群不止一支而已。要从语言上去加以区别的话，有两大类。一类人说的是塞语等，都属于印度-伊朗语范围。另一类人说著名的吐火罗语，它具有今西欧语言的某些特点，而与流行于直接贴近吐火罗语区域之西的印度-伊朗语族的诸语言却反而不相类。这个说吐火罗语的人群，包括唐中叶之前的库车人、焉耆人、楼兰人。后者虽以当日中亚商道上的一种族际共同语文，即称作“犍陀罗语”的用佉卢字母来书写的西北印度俗语作为官方书面语，但从他们留下的佉卢文献中透露的“底层语”信息判断，该人群的实际口语亦具有吐火罗语的特征。在被匈奴驱逐前活动在河西走廊的大夏人，极有可能也是说吐火罗语的。

南疆居民的主体成分向着说突厥语的回鹘（今译维吾尔）人转换，那要发生在公元九世纪之后。当然，东亚的人群中也有人很早就沿河西走廊西行，进入新疆。他们在新疆的混合人群中同样留下了自己的印迹。甚至在著名的楼兰美女遗骨内，也发现了东亚人的遗传基因物质。结合分子人类学和历史比较语言学的资料，希望在未来能够更充分地揭示出古代新疆人类的不同起源及其融合过程与程度等方面的历史面貌。

谁都可以任情想象，但难道任何人的想象都可以在一个大型人群中激发出为大众所认可的集体意识来吗？答案自然是否定的。

在我们已经介绍过的那两把钥匙中，分子人类学是一门纯粹自然科学，历史比较语言学（其中包括审音勘同的方法）则是基本移用自然科学方式来研究人类语言现象的学科，也具有很强的自然科学性质。那么，它们能够为民族、族裔集团的界定划分提供某种纯粹自然科学性质的、完全客观的，因而也最权威的标准或依据吗？我的答案是：不能够。所以，在观察究竟是谁在决定我们是谁的问题时，还需要第三把钥匙，就是民族社会学。为什么？我想先很简单地讲三点。

第一点，对民族或者族裔集团的界定，其实含有被界定主体强烈的主观意识成分在内。该人群之外的任何人，无论多有办法和技巧，也不能做到完全脱离被界定者的主观身份意识，根据这样那样的其他“客观”尺度，包括该人群的集体遗传信息或其语言特征，纯粹外在地去决定、并且标示出他们是谁。换言之，我们自己认为我们是谁，对我们这个人群的界定具有非常重要、无可替代的意义，是催发其本身生长发育的最关键酵素。民族或者族裔群体本身在很大程度上是带有主观界定性质的人群划分范畴，它原本就不是以分子人类学的隐性特征来区划的。事实上，当人们开始划分这样的人群时，他们根本还不知道有什么分子人类学，他们从没想到过要通过检验其群体成员的DNA来确定其能否被该群体接纳。而刚刚说到的那些科学尺度，则可以完全不管被考察者本身的主观意志如何，全凭从外部进行的实验所获得的结果，事实是什么样就做出什么样的结论来。像这样历史地形成的人们共同体既然靠着该人群主观上的集体意识团聚而成，我们还怎么可能将这种主观意识“还原”或转换成别的什么更“客观”、更“科学”的界定尺度？

其实，很多人之所以认为也许可以如此行事，往往与他们把民族或族裔共同体自身有关其出自共同血统这样的观念，当作一种客观可证的事实来看待的误解有关。这就是我想讲的第二点。

民族或者族裔群体经常被他们自己以及群体之外的人们看作是具有共同血统的人群。宣称我们属于同一民族，通常意味着我们拥有共同的祖先，并且一代接着一代地传承着某种共同的血脉。在这里，对作为一种观念的共同血统与事实上的共同血统之间作出区分是十分重要的。存在于民族或族裔群体内的共同血统观念，具有隐喻的性质，它好像不证自明，事实上却不可能予以证明。人们经常在做的，不过是把某些人群所拥有的某些可以区别于其他人群的显著的共同文化特征，当作就是他们源出于共同血统的“证据”而已。但我们知道，文化是可以改变、也可以被转移传播的。越来越多的现代学者都同意，民族或族群是“想象的共同体”。共同血统观念，就是构成这种“想象”的核心成分。像这样具有“想象”性质的共同血统观念，与人们希望通过DNA来求证的事实上的共同血统，当然是两回事！

它们之所以是两回事，恰恰因为在诸多的“想象共同体”之间，从最初开始就发生着无数错综复杂的血统上的交流，因而早就你中有我、我中有你了。由纯粹共同血统构成的人群，即使不是从来就未曾存在过，也早已在历史的尘埃之中消失得无踪无影了。所有的民族都是所谓混合人群，都已变成“杂种”。哪有一个纯种的民族呢？没有。据统计可知，在汉族人口里，携带着三个显示汉族特异性的单倍型（O3-M122、O3-M134、O3-002611）的人口比例，约占到全部汉族人口的54%。这就是说，在每一百个汉族个体之中，有四十六个人事实上并不携带具有汉族特异性的单倍型；亦即作为人类个体，由Y染色体DNA的证据，根本无法确认他们究竟是否属于某一个特定的民族。

第三点，分子人类学不但事实上以既定的人群界定作为划分其考察对象时的前提范畴，通过采样、检测和分析去追寻它们在群体遗传结构上的某些特殊性，而且也只有当它以历史地存在着的那些人群分类范畴作为前提，去展现这些人群实体在各自兴亡存灭的转换过程中如何分化、合并、中断、存续的复杂面貌时，它才拥有足以说明问题的解释效力。举例来说，匈奴民族在历史上的消失，当然不是这个人群的全部个体都已被斩尽杀绝、不再存活于世的结果。其实他们不过是不再作为“匈奴”这样一个人群共同体而存在，人们因而便也取消了“匈奴人”这样一个曾经流行数百年之久的分类范畴而已。匈奴的后裔们继续生活在后来的许多被标识为其他名称的人群里，变成这些不同人群之内的新成员。分子人类学的任务，是在对不同人们共同体的分类范畴发生转换的过程里，去追踪这些匈奴后裔们各自的去向；由此，它可以告诉我们匈奴与匈奴之后的鲜卑、柔然、突厥等人群具有何种形式、何等程度的承继关系。但它不应该、也绝不会自作聪明地想把早已分散到后世不同人群之内的匈奴后裔们都寻找出来，重新凑集一个早已消失的“匈奴”民族，把它强加给后匈奴时代的历史。

正是在此种意义上，我们可以说，分子人类学的证据和结论，并不指向如何按纯粹血统（真实意义的血统）属性来划分人类，而恰恰可以用来帮助我们更深入地认识民族作为一种“想象的共同体”，其真实的遗传结构所具有的复杂多样性。

从民族社会学的角度对民族和族群进行界定的最早一部划时代著作，或许应数人类学家李奇（E. R. Leach）发表于1954年的《上缅甸政治体系：对克钦人社会结构的研究》一书。经过长时期的当地调查，李奇发现，所谓克钦人其实不是一个“宛若存在于自然界之中的实体”，不是“生而固有的”、“大自然赋予的一项事实”。

在一个仍还普遍地将民族视作“宛若存在于自然界中的实体”的时代，李奇的这一看法是极具原创力的。他指出，在被自我标识为克钦人的那个族裔群体里，实际上流行着好几种不一样的语言，其社会结构也在两种不同类型的形态之间持续摆动，而其政治组织的整合，则主要是由于应对另外一个完全不同的人群即掸人的集体需要而逐渐获得实现的。从李奇对克钦人的研究中，可以归结出非常重要的两点：一、在政治上和经济上聚合为一个共同体的人群，未必要有共同的文化和语言；二、尽管如此，它的成员却会感觉到他们享有一种共同的世系，具有共同的历史和共同的文化，至于外来的观测者们是否同意该群体内部成员们的感受，对后者而言丝毫不重要。族裔集团所具有的主观构建性质，主观的归属意识在族群形成过程里的核心作用，就这样被李奇很明确清晰地揭示出来。

沿着上述思路，人们对事物真实性的理解也变得不再那么绝对了，于是就有必要在客观的真实性与“社会真实性”之间做出区别。正如某个著名人类学家说过的：“影响着人们态度与行为的，并不是事实为何，而是人们意象中的事实为何。”所谓“想象的共同体”之提出，显然也来源于对“社会真实性”的这种新认识。

“想象共同体”被形塑的过程，关键在于对共同血统的想象。因为只有当产生在群体成员间的集体身份意识以共同血统观念的形式表现出来时，我们大概才有充分理由确认，这种集体身份意识已经被提升为“族群认同”的形态了。共享的集体身份意识可以有很多形式。比如说左撇子可以形成一种共同的集体身份意识，在现代的政党中也会形成一种集体身份意识，但两者都不会演变为民族或族群的意识，因为它们都没有共同血统观念这样一个核心。那么共同血统观念又是怎样产成和发育起来的呢？

这里有必要提到斯大林关于民族界定的著名论断，一般被概括为四要素说，即共同语言、共同地域、共同经济生活，以及表现在共同文化上的共同心理素质。这个定义对中国民族史研究的巨大影响至今不可小视。我不清楚该段文字的通行汉译文本究竟是译自俄文原文，抑或是从英译本转译过来的。因为按俄文本的表述，所谓四要素应当分别被译为语言、地域、经济生活的共同性，以及“显现在文化共同性之中的心理结构的共同性”。从今天的认识看，这个定义有明显的不足之处。

最有问题的是他枚举的最后一项“共同性”。无论所谓心理素质或心理结构，其意义都颇有含糊不清之嫌。同样重要的是，心理结构的共同性是需要反映在文化（其中当然也包括语言）共同性之中的，这一项类如何可以与前面列举的其他三项被并列于同一分类层次之中？

不过我们也应承认，斯大林所谓心理结构共同性，其实已不太自觉地触及被界定对象主体意识层面的因素。他甚至也已略约提及，这种主体意识是从该人群对其语言、生存地域、经济生活、社会生活习俗、宗教礼仪、集体经验及历史记忆等方面共同性的长期反复的感受之中萌蘖和发育起来的。沿着这样的思路再作进一步推论，似乎可以把共同血统观念的形成分解成这样两个阶段来叙述：从共同语言、地域、经济生活、宗教礼仪、社会习俗、集体经验及历史记忆等（A）中间产生一种比较宽泛模糊的共同集体身份意识（B）；再从这种共同集体身份意识（B）里发育出该群体出自于共同血统的观念（C）。前面已经讲过，正是这种共同血统观念，构成了民族或族群的集体身份意识，也就是所谓民族或族群认同的核心部分。

关于上面所讲的族群认同形成过程，此外还有两点需要加以补充说明。

关于从A到B的过程，也就是族群内集体身份意识的萌发,并不需要在A项所列举的所有那一大堆“共同”样样具备的条件下才能实现。它当然不可能从完全的虚无之中就得以被成功地“想象”出来。总需要有某些现实的“共同”要素，才可能促使一种对集体身份的朦胧感知从这个人群的草根意识中间逐渐滋长起来。但是对各民族、各族群的发育史所进行的历史考察告诉我们，要想为那样一种集体身份意识的自发滋长开列出一张放之四海而皆准的充要条件清单，是一件不可能的事情。

另一方面，关于从B到C的演变，则不可能也像由A到B那样，是一个完全自发的行为。共同血统观念不会从大众对其集体身份的朦胧意识中自动地、必然地生发出来，而只能是有人自觉地对后者予以加工和提升的结果。承担此一加工提升工作的人，大都是该人群内的精英或准精英分子。经过他们对自身群体的历史记忆和其他文化资源进行有意识的选择、强调、放大或“发明”，以及有意识地沙汰、“失忆”、掩盖与修正，该族群或民族获得了有关自己是谁、从哪里来、本群体与周围其他人群有什么不同、为什么会有这些不同等等一套相对固定的言说。而具有想象性格的共同血统观念则是这一套言说得以构建的最不可或缺的内核。

共同血统观念为什么会成为研究者从人们如何“想象”自己的层面去考察民族或族群形成历史时的一个最重要的聚焦点？我以为自己已经把其中的道理讲清楚了；虽然因为时间的限制，我说得可能还太简单了一点。请注意：我没有在这里宣扬说，所谓民族，彻头彻尾就是一种主观想象出来的东西。不要以为，今天坐在这个教室里的人们，也能凭空“想象”出一个民族来。谁都可以任情想象，但难道任何人的想象都可以在一个大型人群中激发出为大众所认可的集体意识来吗？答案自然是否定的。这样的“发明”如果能成功，它必定以该群体内带有草根性质的对自身的认知与情感作为基础，所以才能又反过来滋养、培育和形塑属于大众的集体身份意识。所以，强调族体主观认同意识的重要性，并不是想要、事实上也完全没有颠覆中国民族史领域内经过长期积累所形成的诸多根本观点和基本知识。它只不过力图揭示出过去的研究中曾一向被忽略的那个层面，即被称为民族或族群的大型人群，在利用其历史资源来构建一个特定“想象共同体”时所经历的心路历程。

现在让我们回到讨论的起点上去。究竟是谁在决定我们是谁？是民族社会学家吗？看来也不是。刚刚介绍过的民族社会学家的工作，只是在解释某个人群认为自己是谁的观念是如何在历史的过程中形成的。不过光有民族社会学家这样的解释仍然不够，我们还需要比较历史语言学家、分子人类学家来帮忙。他们有能力揭示出，这个或那个特定的共同体中的不同成员，实际上是从什么样的不同途径、不同来源而团聚成为同一个人群的。总之，没有一个人，民族社会学家也好、分子人类学家也好、比较历史语言学家也好，包括民族史的专家在内，有权力代表某个人群宣布他们是谁。他们是谁，要由他们自己来说。各不同学科的合作，则可能更有效地回答下述问题：即他们是为何及如何达成关于他们是谁的这样一个共识的？类似的历史问题，只有在不同学科的合作下，才会显现得更加清楚。

姚大力：谁来决定我们是谁——关于中国民族史研究的三把钥匙

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏