我认为只有对社会科学研究的方法有深刻的理解,我们才能具体地运用统计的方法。如果没有这种基础知识支持的话,统计方法是没有太大用途的。很多人认为社会科学方法就是怎么样搞统计。懂统计固然重要,因为我们如果不懂统计、不会使用电脑的话就很难有成果,但是搞电脑、搞统计必须基于你对社会科学方法有很好的理解。今天的讲座中很重要的一个内容就是社会科学研究的三个基本原理。
我认为在社会学一百多年的历史中,最重要、最伟大的人物就是Otis Dudley Duncan。Duncan以前是我们学校的一位社会学家。我和他的想法很接近,所以说在很大程度上我的“三个基本原理”是在他的基础上发展出来的。他说:“社会学不像物理学。世上惟有物理学像物理学,因为对世界上的任何物理学的理解都已成了物理学的一部分。”把社会学当作物理学的一个延伸是完全错误的。社会学不像物理学,也不能像物理学。如果社会学是像物理学的东西,那么,既然已经有物理学了,还要社会学做什么?喜欢物理学的人可能不赞同这个观点,但是假如你理解社会学和物理学的差异,就会知道其中的道理。
我先介绍一下术语的定义。我讲的“社会科学研究”是指定量的社会科学研究;“基本原理”是指可以普遍适用于实际研究的方法,而不是由实际研究(即使是经典的研究)提供的结果。
我以前是研究科学史的。这一领域被自然科学史所主宰,大概80%-90%的科学史都是关于自然科学史的研究。你要是读自然科学史,就能体会到柏拉图对西方科学和哲学有极大的影响。Alfred Whitehead,一位哲学家、数学家曾这样说:“欧洲哲学传统最可靠的特征是,它是由关于柏拉图的一系列注释所组成的。”所有欧洲传统的东西甚至包括牛顿的东西,都是对柏拉图的注解,他就把柏拉图上升到一个这么重要的位置。
为什么柏拉图在西方科学史上有如此重要的地位呢?柏拉图的一个很重要的贡献就是区分了本质的世界(world of being)和形成的世界(world of becoming)。这两个世界对柏拉图来说是很重要的。柏拉图为什么要做这样的区分呢?柏拉图说,你想做一个好的哲学家(也就是科学家),就要有很好的理解能力。你必须超越你能够观察到的世界,即当前面对的这个形成的世界,这样你才能对本质的世界有很好的理解。你不能看表面而要看实质,实质就是你看不到的东西,也是永恒的东西。对柏拉图来讲,真实的知识存在于普遍而且永恒的法则之中。对柏拉图来说,这就是真理。真理是普遍的、永恒的。真理不是存在于一个具体的事物之中。他把本质的世界分出来,就是说看世界不能看具体的东西,研究具体的东西你就不能看到实质。我们中学时候都学过几何,研究过圆。圆是什么?在欧氏几何里,圆是一个平面上离一个点距离相同的点的集合。谁见过圆?比如说我们看见那个钟是圆的。但是对于柏拉图来说那不是圆,因为它不可能是理想的圆,它不是由到定点等距离的点组成的。圆是抽象的,对柏拉图来讲,要研究圆的特性,你就不能研究那个圆(钟),即不能研究任何一个能够看得到的东西。圆的特征是永恒的、不变的、稳定的。这个特征只有在哲学家的脑袋里才有,具有这个特征的只能是抽象出来的东西。所以说,柏拉图让我们做的是透过现象看本质,要把形成的世界忽略,而把本质的世界看透。
它不可能是理想的圆,而只是一个封闭曲线
为什么这样好?因为你一旦看透了本质的东西,就可以把它应用到生活中的任何方面。比如说,圆的特性你已经知道了,那么尽管有无穷无尽的具体的圆,但它们都遵循着同样的规律,就是你已经知道的圆的特性。这就是科学的一个很大的用途。为什么科学那么神圣?为什么大家都在讲科学这个、科学那个?历史上,科学在中国文化里面并不是占据很高的地位。在西方的哲学里,从柏拉图开始,科学就从哲学中分离出来,这是因为科学是永恒的,它的永恒性和普遍性是放之四海而皆准的东西。柏拉图认为法则是存在的,它有一个创造者。他这里的创造者不是宗教意义上的创造者。因为有了这些法则的存在,我们才可以发现。大家可以理解“科学发现”这个词实际上有需要推敲的地方。什么叫发现?发现意味着本来就有东西存在于那里。假如没有东西在那里,就应该叫做发明。发现是指以前就有一个人很聪明、很伟大,很早就把东西藏在那里,然后等我们去发现、去整理。那些被藏起来的东西是很好的、很有规律的东西,也就是普遍的、永恒的真理,是关于圆、关于三角形、关于世界的所有的科学的东西。牛顿也好,爱因斯坦也好,把原有的美满、永恒的真理发现出来,这就是科学的发现。
在柏拉图的哲学思想中,真理是永恒的而不是变异(variation)的。但是在实际生活中,就是柏拉图自己也知道变异是存在的。所有的圆都是不一样的,所有的东西都是不一样的。任何事情要是做比较的话,你都会发现变异和差异。柏拉图对变异的理解是什么呢?变异是对本质的世界的拙劣复制。比如说我们有个蓝图,要做一个零件,你不可能每个都做得一模一样。虽然蓝图上说是5公分,但是做出来的零件不可能刚好是5公分。根据柏拉图的观点,这就是形成的世界和本质的世界的关系。本质的世界是一个真理,它排除了差异,但是你复制的时候总会出现变异。比如说你做这个钟,圆的直径是多少,你按照这个把它做出来。一旦你先做出一个模子,这个模子必然不是标准的,这就发生了变异。模子造出来之后再去造具体的钟的时候,还是会发生变异,最终导致现实的差异,也就是每个钟的直径都不一样,每个钟的快慢也不一样。
在柏拉图看来,这些变异都不好,也都是不重要的。在他看来,世界的本质是不连续的、抽象的、单一形式的,而具体的东西总是连续的,也就是说,各个具体的东西之间总有各种差异相衔接。物理学中的伟大成就就是遵循柏拉图的类型逻辑思维的结果。类型逻辑思维(typological thinking)就是说类型是最重要的,真理存在于物与物之间类型的差别上,而不是存在于量化的差别上,也不是存在于具体的物的差异上。柏拉图的哲学也同样解决了科学和宗教的潜在矛盾。举个例子来简单地说明一下。有人说哥白尼的天文学是对宗教提出的一个很大的挑战。实际上,哥白尼的天文学是受到宗教影响的。哥白尼为什么要提出日心说?因为日心说比地心说更加简化、更加理性化、更加漂亮。漂亮的世界一定是上帝创造的。而地心说的数学模型非常复杂,哥白尼认为这不可能是上帝创造出来的。他对科学的解释不像我们以前所说的“实践是检验真理的唯一标准”那么简单。科学的可信性在于简化。科学的东西、美妙的东西一定是简化的。伽利略、牛顿对科学的解释与哥白尼是很相似的。
偏差(deviation)是什么?按照类型逻辑思维,偏差是不好的东西,是我们不希望得到的结果。通过抽象思维把这些偏差忽略掉之后才能得到真正的知识。比如说你研究具体的圆,因为它不是标准的圆,所以得不到真理,但是如果把偏差忽略了,就可以得到真正的知识。你想想,中学的时候,老师画的每一个圆其实都是不圆的,但是我们把那些不圆的表象都忽略了。
在统计学方面,有两个很伟大的统计学家:一个是Jacob Bernoulli,他最大的贡献是大数定律(Law of Large Numbers);另一个是Pierre-Simon Laplace,他的最大贡献是中心极限定理(Central Limit Theorem)。他们提供了测量不确定性的数学方法。比如说刚才那个做零件的例子,现在假设有一个零件实际上是5公分,让20个学生用很精确的仪器来测量。每个人测出来的一定不是5公分,有的多一点而有的少一点。这就奇怪了:为什么对同一个东西会测量出不同的常数呢?这里就存在一个误差(error),这个误差是人为的。怎么办呢?把所有的误差加起来平均一下,平均数的基数越大,平均数就越可靠,与真实值也就越接近。这就是大数定律的内容。现在假设每次都随机地找n个人来测量,从而每次都能得到一个基数为n的平均数。如果n比较大,但是相对于总数来说又很小(这个例子中总数是无穷大,因为你可以让无穷多的人来测量),那么做了无数次的平均数之后,就会形成正态分布,它们的平均值就是真实值。这就是中心极限定理的意义。实际上这个例子中的误差是真实的误差。为什么这样说呢?真实的常数只有一个,因为很多人在不同时候、不同温度下测量,所以结果不一样,这种误差可以通过统计补偿(statistical compensation)来抵消。
Quetelet说,我们知道社会数据存在很大的不确定性,但是我们可以通过测量理论来解决。任何一个现象的量数都有差异。比如人的高度,每个人的高矮是不一样的。但我们把所有人的高度放在一起,就会形成一个分布,而且是一个正态分布。可能在今天和明天做的抽样中,你和他的身高不一样,但是所有人身高的平均值始终是一样的。于是他提出一个普通人(average man)的理论。柏拉图说真理是永恒的、不变的,那么社会科学里什么是永恒的、不变的东西呢?Quetelet的办法就是取平均值(mean/average),他认为平均值就是社会科学追求的那个不变的、永恒的真理。为什么可以这么讲?这是因为测量理论可以应用到社会现象。任何一个社会现象的量数都是有差异的,但是这些量数的平均数是永恒的,这些量数都遵守正态分布。Quetelet说:“偶然原因法则是可以应用到个体和群体的一般法则,它支配着我们的道德、智力素质,正如它支配我们的身体素质一样。”他关注的内容包括不同国家、不同地区、不同组织、不同年龄间平均数值的差异。平均数是不变的,那是因为存在一个法则,它是不变的原因。他甚至把这个普通人上升到伦理学的角度,普通人应该具有善良、崇高、美好的品质,最好的人是普通人。我们一般都讲最好的人是在金字塔最高处的人,先是最高领导人,然后慢慢下来,是院长、所长、组长。对Quetelet来讲,最好的就是平均的,既不高也不矮,既不胖也不瘦,既不富也不穷。
从柏拉图的类型逻辑思维到Quetelet的普通人理论,在很长一段时间里它们是西方科学的主流,但是这个主流思想受到达尔文的总体逻辑思维(population thinking)的挑战和修正。我现在要讲的就是达尔文的总体逻辑思维。大家都知道达尔文提出的自然选择对生物学做出了很大的贡献。实际上,达尔文的贡献对社会科学也非常重要。对达尔文来讲,变异是真实的,不是令人不悦的失误部分。达尔文的《物种起源》第一章里就写《家养状况下的变异》(Variation under Domestication),第二章就是《自然状况下的变异》(Variation under Nature)。达尔文的思想中最重要的一个观念就是变异。虽然父母都一样,环境也一样,但是每个个体的后代都是不一样的。假如他们都一样的话,就不可能有变异,更不可能有自然选择。为什么有自然选择?比如说鱼,生下来的时候有成千上万条,这些鱼都是不一样的,如果这些鱼都长得一样就不可能有选择,也不可能选择出与自然环境更匹配的。变异特征还可以从上一代传到下一代。比如说在寒冷的海域,抗寒的鱼活下来了,接着通过繁殖,它们下一代中有一部分就更抗寒。也就是说,下一代可能是很不一样的,要不然的话就没有自然选择了。这个很重要,因为它说明了自然选择的基础——每个个体之间的差异性。而个体的差异来自每一代的繁殖过程中产生的丰富的变异。每一代的变异很多,但是只有少部分的变异能够存活下来并通过繁殖复制自身。这就是总体逻辑思维,它和统计有什么关系呢?在类型逻辑中平均数是主要的内容。在总体逻辑中重要的是差异,平均数只是总体的一个特征值,是探讨真实原因的手段,而不是原因本身。这是两者之间很重要的一个区别。总体逻辑认为平均数只是总体的一个特征值,而在类型逻辑看来平均数代表着真理。William Jevons说其实mean和average是不一样的。比如说长度,同一个人的身高测量50次得到的数据是不一样的,50个人的身高分别测量一次得到的数据也是不一样的。前者是mean,后者是average。做这种区分是因为这两组数据出现差异的原因不同。前者实际上是一个测量的误差,它真实的东西只有一个;而后者则是50个人之间的真正的差别,这个差别并不是误差,而是实际上的差异。社会科学的重要性在于研究为什么个体和个体有差异,而不只是比较平均数。当然,平均数也是很重要的,比如说男性的平均工资比女性高,但是谁都知道有的女人的工资比男人高。我们也知道女性的平均寿命比较长,但也有女性早死。所以说平均的差异不能代表所有的个体和个体之间的差异,这是个很重要的概念。Francis Edgeworth也做过类似的区分。
达尔文是生物学家,他没有做过具体的社会科学的研究,那么社会科学的研究是谁开拓的呢?是他的表弟Galton,也是英国人。他把总体逻辑思维引入社会科学。对他来讲,平均数的价值是有限的,他认为个体差异是真正重要的东西,所以Quetelet的社会物理学看上去很漂亮,但是在社会科学中几乎没有什么用途。对社会科学不了解的人就会和Quetelet想的一样,重视平均数,他不知道平均数后面掩盖了多少重要的东西。平均数并不代表一切。Quetelet在社会科学里的影响相对来讲是很小的。那么社会科学的侧重点在哪里呢?应该看差异在哪里,应该把重点集中在变异(variation)和共变(covariation)上。Galton是现代统计学的始祖,我们先讲他的共变。假如不注意个体和个体之间的关系,你不可能讨论这些东西。正因为考虑到了个体和个体之间的差异,他才提出了对变异和共变的测量。有这样一个比较有名的例子,是关于父亲高矮与儿子高矮关系的。如果父亲高,儿子的身高也偏高。但是父亲高有可能是因为运气的原因,儿子可能没有父亲运气那么好,只是偏高,但是没有父亲高,这就是回归(regression)。假如父亲很矮,有矮的基因,那么儿子就会偏矮,但是不一定比父亲还矮。在每一个阶段都存在重新再分布。也就是说,你的身高取决于你父亲的身高,但你究竟有多高是不能决定的,只能是随机的。
现在讲社会科学中变异性的独特之处。我认为社会科学的变异性比生物学的变异性更复杂,也更重要。这可能是一个新的观点。许多变异,特别是达尔文说的变异实际上是指当个体生下来的时候就已经完成了的变异。就拿刚才说的鱼来讲,一条鱼是否通过变异产生了抗寒的性质是在出生之前通过遗传和环境的相互作用就决定了的。而我们所说的变异,不仅是指个体间的变异,也包括同一个体在成长过程中的变异。我们说的这个变异是指你不但和你的父母不一样,而且你今天和明天也会不一样。比如说你今天听了我的课,虽然明天你人没有变,你的基因没有变,环境也没有变,但是你的行为变化了。我们说的变异性除了指个体与生俱来的变异性外,还有个体在发展中产生的变异性。后面这种变异是受不确定因素影响的。人类行为的变异性不一定是可以遗传的,而达尔文讲的变异性是指可以从上一代遗传下来的变异性。实际上我们说的变异性不一定是可以遗传的,也不一定是有物质性载体的。比如说你到这里来听我的课,你学到的东西是遗传不下去的,除非你教给你的子女,但这并不能说你可以通过基因的形式遗传下去。还有一个很重要的,就是马克思主义理论强调的一点,即人类能够改变影响他们自身的环境,这就是我们讲的社会运动和政治、经济制度的改造等等。下面一条,经济学家很重视,就是说人的行为是理性的,人能以可以预期的结果作为行动的基础。比如说上学,你认为上学对你有利,你才来上学。1992年诺贝尔经济学奖得主Gary Becker,就是以理性行为的理论获奖的。他说婚姻就是理性的,结婚会有好处,如果不好的话,比如男性没有钱、没有经济依靠等就不会结婚。结婚不结婚就以理性因素做基础,上不上大学,来不来听课,你和领导的关系,请客一吃饭等等,都有理性基础。也就是说,所有的行为不是随机的而是经过理性计算的。还有一个就是我们所说的历史性路径依赖(historical path dependence),也就是说以前发生的事对现在还有影响。我们不可能把以前的东西取消重来。以前发生的事情影响将来,这是社会科学中变异性的一个独特之处,即使是偶然发生的事情对将来也可能会有很重要的作用。结过婚的人可能知道,你当时认识你的爱人可能是通过非常偶然的机会,认识之后就发生了很多事情,以后就是你想改变也改变不了。发生了就是发生了,以后的事都是以发生了的事为基础,这是不可能改变的事实。你听了这门课,或者做错了什么事,也是不可能去掉重来的。这就是一个路径依赖的问题。路径依赖是很重要的,等一下我要讲它会造成怎样的影响。
以上讲的是社会科学研究中与哲学、与历史有关的部分,下面我开始讲社会科学研究的三个基本原理。
第一个原理叫变异性原理(Variability Principle)。变异性是社会科学研究的真正本质。我们不是研究类型的,而是研究变异和差异的。当然,差异也有可能是组与组之间的差异。比如说我刚才讲了,男女之间的收入不一样,假如说男女收入是一样的话,那么我们就不会认为性别在研究收入这个现象中是一个有趣的、重要的东西。我们之所以要研究性别收入差,就是因为有差别的存在。虽然这是一个组间差别,但是我们的重点还是在差异上,比如说种族之间的差异、家庭背景之间的差异、教育的差异、家庭婚姻的差异等等。你仔细想一想,我们研究的东西是差异,而不是共性。类型之间的差异也是差异,只不过是一个特例而已。下面我就会讲到,类型之间的、组与组之间的差异是随着研究对象的变化而变化的。
下面讲第二个原理:社会分组原理(Social Grouping Principle)。为什么要分组?因为社会分组可减少组内差异。个体之间是很不一样的,但是个体可以分成组,比如分成年龄组、性别组、家庭背景境况组等等。分组显示了组与组之间的差异,这意味着每个组里面有相对组外来说更高的共同性。如果一个组当中没有共同性的话,那么组和组之间就没有差异性。如果女人没有共同性的话,那么就不可能有男和女的差异。同样的道理,每一个组当中有相对来说比较相似的特点。我们分组是基于组员之间有一定的共同性,分组以后组与组之间就有差异性。
什么是社会分组(social grouping)?我并不想在分组是唯名的还是唯实的之间有所选择。组有可能是实在的,也有可能是唯名的。这和马克思主义的阶级观念不一样,马克思主义认为社会关系建立在所有权上。我认为到底用名称还是真正的物质基础来划分不是很重要,社会分组只有根据社会结果(social outcomes)来分才会是有意义的。我不是看你分组的原则是什么,是真的还是假的,是符合这个理论还是那个理论。从统计的观点来讲,分组的意义在于它有利于研究社会结果的差异。我刚才讲的收入,假如男女之间没有收入差异的话,那么对于收入而言,根据性别分组就不重要。我是研究人口的,比如我们要研究人的死亡率,这就要考虑性别,因为不同性别之间的死亡率差很多。反过来说,假如性别之间没有死亡率的差异,那我们就不要考虑以性别来分组。分组的意义在于它是否能解释差异,所以社会分组应用于不同的社会结果或许会有不同的意义。比如说种族、民族、社会阶层、家庭背景、党派、政治面貌等很多分组,这些分组在不同的社会结果下的意义是不一样的。比如说你的政治态度和你的死亡没有关系,有关系的可能是政治态度与社会经济地位的关系,政治态度对你行为的影响。比如说,政治运动来了,你到底是参与还是不参与?这时你的政治倾向就和分组很有关系。而政治倾向和死亡率根本没有关系,至少没有直接的关系,而只是伪相关(spurious correlation)。假如说我要研究你的政治行为,那么你的政治态度和分组就很重要。
社会分组能减少社会结果的差异性,减少得越多,社会分组就越有意义。下面我会讲为什么会这样。我刚才说了,社会科学所要理解和解释的就是差异性。实际上社会科学最想做到的和柏拉图提出的并没有什么两样,我们想提供的也是很简单的、永恒不变的东西。我们能做到的话,很好,但是我们却做不到。那做不到怎么办呢?我们只能做一个妥协,也就是说,我们不可能把所有的信息都告诉人们,那么就告诉人们大量信息中很少的一部分。比如说有10亿个人,有10亿个信息,这么多信息我根本不能告诉你,连我自己都不能够消化。我只能把很大的总体中的一部分信息告诉你,用的参数越少,信息就越简单,就越容易理解和讨论。比如说平均数,它也是大的总体里面的一个信息,这个信息可以理解,可以在相互之间传播。当然,平均数是一个比较粗的信息,也可以不用平均数。我只用两三个数值就可以告诉你男女之间有什么不一样,如受教育程度不一样,死亡率不一样,收入也不一样。或者我就告诉你教育的增加和收入的增加有什么关系,这只是一个参数。我想概括的总体的参数越少越好,与柏拉图讲的科学是一样的。也就是说,告诉你的信息里参数数据越少越好,越精越好,这和自然科学是一样的。但是你应该知道,这只是一种妥协而已。我们没有办法把大批量的、整体的信息告诉他人,就只好作妥协告诉他一部分。当然,告诉他的这一部分是有意义的一部分。在这种条件下,既想刻画整个总体,又要用简化的方法告诉对方很少的信息,在这两个要求下作妥协,也就是说,我虽然只告诉你一部分信息,但是这一部分概括了总体。比如说平均值和方差,这两个参数不能告诉你整个群体的情况,但是已经告诉你很多的情况。比如说性别社会分组能够解释的东西越多,它的分组就越好。如果世界上只有10种人,所有的人之间的差异都归于10组中组与组之间的差异,而每组内部没有差异,那么我告诉你每个组的平均值,就能代表所有的人。可惜这是不可能的。社会分组能够解释的社会变异越多越好,但是组内差异永远是存在的,你永远不能把组内差异解释穷尽,这是社会分组所不能解释的差异性。
社会科学的复杂性就在这里。我们想刻画总体,但是我们不能把所有的总体的东西都刻画出来,只能告诉你一部分参数。告诉你一部分参数就能告诉你很多关于总体的东西,但是还是有很多东西没有解释,这就是我们遇到的矛盾。分组以后,你知道组之间的差异,但组当中还有差别,怎么处理?这就是下面我要讲到的,由于没有控制其他的变量,这样做可能是粗糙的甚至是错误的。比如说,死亡率和政治倾向在表面上好像有关系,但是结果你会发现你解释的也许并不是政治倾向,而是经济地位,因为经济地位与死亡率有关系,与政治倾向也有关系。这里,简化(parsimony)是一个很重要的词。中世纪有一个神学家,他认为上帝是理性的,他创造的世界一定是简化的,假如搞不清的话,你就用一把剃刀把多余的部分从知识中剔除出去。我们社会分组的原则也是简化。我刚才说了,一个总体有千千万万的信息,而我要告诉你的是一些简化的东西。简化会有代价,在社会科学当中就体现为误差。这种误差并不是自然科学中测量的误差,不可以忽略不计。社会科学中的这个误差是一个真实性的、理解性的误差,是知识上的一个缺陷,是真实的而不是可以忽略不计的。这就是和自然科学或者说物理学不一样的地方。比如说,物理学的误差经过测量许多次取平均数就可以忽略掉,而在社会科学中误差就是知识上的缺陷。
第三个原理是社会情境原理(Social Context Principle)。群体变异性的模式会随着社会情境(social context)的变化而变化,这种社会情境常常是由时间和空间来界定的。也就是说,社会情境不一样,变异性就不一样。比如说,教育对收入的影响是每个社会都有的,教育高,收入高,但是并不是所有的人教育高收入一定就高。大街上,有些小学、中学没有毕业的人也有可能比你还有钱,这就是差异,但教育对收入的影响可能随着社会的变化而不一样。比如说社会制度,改革之前和改革之后就不一样,中国和英国不一样,美国和日本也不一样,中世纪的英国和现在的英国也不一样。比如说有的经济学家认为,经济发展快的话,教育的回报率高,为什么?因为机会多。教育高,知识多,容易接受新的事物。而社会经济停滞不前,就会有饱和的现象,回报率就会降低。我想讲的是,随着社会情境的变化,变异性的规律和模式也会变化,我下面讲的一些统计模型会用到这些。
社会情境不同于社会分组。因为社会情境是有边界的,是一个独立的社会系统,比如说社会主义制度、资本主义制度、美国和英国,以前的中世纪和现在,而社会分组是没有边界的。男女生活在同一个家庭,在一起工作,是没有界限的,只是因为社会研究的统计和调查的需要把他们分次来。那么,社会情境的边界是怎么来的呢?边界有两个:一个是时间,一个是空间。社会科学经常要用到时空的概念。时空很重要,达尔文讲进化论的时候也用到了时空。他不可能找到物种以前的状态,也就是说,历史已经发生了,他可能找到一些诸如化石的东西,但是他不能证明。他不能找到时间的差异,那还有一种办法就是找到空间的差异。南美可能有些东西还没有进化,与欧洲、非洲的不一样。再比如,想看看以前经济不发达的中国是怎么样的,可是在中国的发达地区已经找不到这样的地方了,那就到落后的地方去找。这就是说时和空有很重要的意义。因为你要知道社会情境对社会关系的影响可能是不一样的,就是因为时和空是不一样的。我会讲一些具体的、实际的方法,但是今天只是给你们一个关于时和空的杠杆,使你们得到一些你们本来不能得到的东西。比如,你们只有中国计划经济时期的总体数据,不知道成熟的市场经济制度对收入的影响,怎么办?那就去找一些不同的点、不同的地区。如果你认为深圳更市场化一些,有些地方保留更多的计划经济特征,你不可能接触到将来,但是假设其他地区以后会像深圳这样,那你就做一下地区之间的差异的比较。这个差异可能会帮助你预测将来其他地区会怎么样,当然,这样做你还必须做很多假设。
个体变异的模式可以被个体之间的关系所支配,这也是社会分组无法解释的。社会分组只是讲把一部分人摆在一起,把另外一部分人摆在一起。而社会关系可能随环境而变,有些关系不是个人的,而是一个系统的属性,比如说社会制度,这是社会这个系统的属性而不是个人的属性。人们居住在一起可能采用不同的制度、不同的法律,拥有不同的文化,这都是环境的属性而不是个人的属性。所以,个体变异的模式也可以被宏观的条件所支配,比如社会结构、政治结构和文化结构。这些条件也许是间断的,即在某段时期内是确定的,但在时期之间是跳跃的。比如通过一项关于婚姻的或是关于社会制度的法律,再比如中华人民共和国1949年成立,都是一下子发生的条件变化。而这些条件作用的结果是连续的、不断变异的。说结果是连续的有两层意思:第一,任何一个确定的条件下的结果都是一个连续体,也就是说结果是各种各样的,不可能是单一的;第二,在条件突然发生变化时,结果的变化并不都是一下子显现的,而是可能和条件变化在时间上相分离的。有一些社会条件是突然变化的,不是确定会发生的。人的行为可以导致宏观条件的变化和人们关系间的变化,这就是社会变迁的主要来源。这是生物学没有的。我们是理性的,我们在一起可能会做一些或者理性或者看起来是不理性的事情。我们生活在一个社会系统之中,有统治阶层和被统治阶层,人们之间总是会有矛盾的,在这个时候,人们的行为会引发法律、政治和文化的变化,这些变化会造成社会变迁。
*节选自谢宇《社会学方法与定量研究》,社会科学文献出版社2006年版。注释和参考文献略。