生物经济学(Biological economics)已经有了30多年历史,以“自私的基因”为出发点,它把个体生命的适存度当作经济学家所论的“效用”(Utility)或“回报” (Payoff,博弈论教科书译作“支付”,此处不甚自然,遂以义译)。这样,它就与演化博弈论的研究有了对话的界面。
合作行为怎样发生而且怎样演变成稳定的行为模式?对于这样一个重要的问题,博弈理论家们喜欢用“囚徒困境的多次博弈”来解答。所谓“囚徒困境”,说白了是由这样三项条件构成的:(1)通力合作所得的回报将使博弈的每一参与者都得到多于大家都不合作时所得的回报;(2)当大家通力合作时,背叛合作所得的回报将多于通力合作所得的回报;(3)当大家通力合作时,被背叛的合作者所得的回报将少于大家都不合作时所得的回报。
这样,但凡有“工具理性”的博弈参与者就都可以计算出来:与其合作而被人家背叛,不如干脆不合作,尽管大家都知道合作比不合作好。这一结论称为“悖论”,因为现实世界处处存在着合作,否则人类社会早就瓦解了。悖论者,理论与现实相悖。
为解释现实世界的合作,博弈理论家们假设了囚徒困境的“多次重复博弈”,即参与者们以完全相同的支付方式重复进行满足上述三个条件的博弈。例如,当重复无穷多次并且参与者们未来回报的贴现率都足够低的时候,确实存在均衡策略可以导致全体博弈者的合作。所谓“均衡”,即一旦处于这一策略所导致的格局内,就没有谁再有动机偏离这一格局。
我要警告读者,在这种无穷多次重复的博弈里,均衡策略的数量几乎是无穷多的,在如此多的可能的均衡策略当中,导致了全体合作的策略的数量,相当少。其中,与下文相关的一种策略是这样的,先假设博弈参与人数是2,双方宣布自己的策略:合作,直到对方背叛合作,然后永远不与对方合作。这样,一切自利的理性个体都会计算出来,不论在哪一时刻背叛对方,因对方“以后永远不合作”所导致的损失——即合作超过不合作的那部分收益的贴现值,当博弈次数无穷时,肯定超过一次性背叛合作所得的收益。
可惜,对人类社会普遍存在的合作现象的如上所述的博弈论解释,当博弈参与者人数是任意的N时,那些能够导致合作的均衡策略,在几乎无穷多的导致不合作的均衡策略的集合当中,迅速地随着N的增加而被淹没了。
所以,博弈论的解释不能令人信服。20世纪90年代以来,桑塔费学派的两位经济学家Gintis和Bowles努力建构一种新的解释。基于计算机仿真技术、认知科学与脑科学、人类学和演化心理学的晚近发现,他们在2003年3月18日美国科学院通讯刊物《PNAS》上与两位著名的文化学家Boyd和 Richerson联合发表了一篇研究报告,题目为《利他性惩罚行为的演化》。
略去细节,这份报告指出,今天人类合作的深层心理结构,一方面是由1万年~10万年以前的新石器时代社会结构和生存问题所塑造的,另一方面是由600万年前甚至数亿年前人类在哺乳动物演化阶段所形成的“中脑系统”(Limbic system)所决定的。这两方面的因素——不妨叫做“演化行为学因素”,绝非我们的理性头脑可以控制的,它们的联合作用,可以在很大程度上解释今天人类行为的合作倾向。
于是,他们的计算机仿真,从石器时代人类社会的基本结构——洞穴社群出发,假设每一群体的人数不超过20人但不低于6人(否则就会解体),并且,假设在群体(洞穴)之间存在着比例很小的“移民”——通过文化融合与婚姻。这样,或许合作的知识就通过懂得合作的原始人的移民“侵入”到不懂得合作从而即将消亡的群体中,实现了合作的文化基因的繁衍。
作者们这一模型仿真的主要结论,对主要初始条件的改变具有“鲁棒性”(不敏感依赖于初始数值),故而是令人信服的。例如,他们假设原始人口的100%都是自私的——相当于在囚徒困境博弈中,大家都要抓住第一机会背叛合作。然后,只假设1%的基因突变概率——相当于母代人口的1%养育出了“不完全自私”的子代。这些不完全自私的人又分作两类:(1)单纯合作者,他们不论遇到合作者还是遇到背叛合作者,都选择合作策略;(2)强对等主义者,这也是作者们在过去几年发表的一系列论文中详加论证的主题。所谓“对等”(英文是Reciprocity),通常译作“互惠”,于是遮蔽了这一语词所包含的惩罚背叛者的意思。这里译作“对等”,试图去蔽。强对等主义行为的定义是:以降低自己的适存度为代价惩罚一切背叛合作者的行为。
仿真结果:经过500代遗传之后,初始人口的大约1/3是单纯合作者,1/3是强对等主义者,1/3是自私的人。在以后的2500代遗传过程中,这一行为结构大致维持不变,故而,可以认为,今天我们每一个人的深层心理结构,是三张面孔构成的:我们有1/3的自私的冲动,有1/3的单纯合作的天真,还有 1/3的强对等主义的正义感。
仅以此文纪念一位多年前在中关村大街上下班高峰时因拦截一辆在自行车道内逆行的小汽车而被汽车司机打死的《科技日报》记者。