摘要: 有两种关于辛普森悖论的解释,逻辑-基础的解释和因果的解释。前一个解释为哲学家普拉桑塔·班德亚帕德耶(Prasanta S. Bandyopadhyay)所坚持,后一种解释为计算机科学家朱迪亚·珀尔(Judea Pearl)所主张。班德亚帕德耶在他近几年的文章([1], [[2], [3] )中,强调有三个关于于辛普森悖论的问题需要得到充分的分析才能够说明这个悖论得到了解决:1. 辛普森悖论为什么是悖论;2. 辛普森悖论是在什么条件下产生的;3. 遇到辛普森悖论该如何做?第三个问题他服膺珀尔的方法,认为因果性只会在第三个问题有作用,但是前两个问题他认为珀尔的解释都错了,应该给予逻辑-基础的解释。在这一篇文章中,我试图证明哲学家班德亚帕德耶对珀尔前两个问题及相关因果解释的批评都是不正确的,且他自己的逻辑-基础的解释也可商榷。
关键词: do-演算;后门准则;可交换性;可坍塌性;因果性
Abstract: There are two kinds of accounts (logic-based and causal) of Simpson’s paradox. one from philosopher Bandyoapdhyay, the other from computer scientist Judea Pearl. In [1], [2], [3], Bandyoapdhyay tried to show that there are three questions associated with Simpson’s paradox that need adequate analysis: (i) Why is SP paradoxical? (ii) What conditions generate SP? (iii) How to proceed when confronted with SP? Developing a logic-based account of SP, he tried to argue that there are no causal factors at play in answering questions (i) and (ii). Causality enters only in the third question. Comparing with these two accounts, I prove that Bandyoapdhyay’s criticism of Pearl is not correct, his account of SP also faces many problems.
Key Words: Do-calculus; Back-door criterion; Exchangeability; Collapsibility; Causality
一、导论
当我们做关于因果推断的时候会面临很多困难,辛普森悖论[2]是我们所面临困难的一个典型。什么是辛普森悖论呢?它指的是存在那样一种数据,在总体中所存在的统计关系在子总体中会发生反转。我们可以通过下面一个简单的玩具例子来说明[3]:我们假定一个大学只有历史系和地理系,这两个系招聘办公室工作作人员,五个男性申请历史系的职位,只有一个被录取,而八个女性申请,两个被录取,所以对于男性的成功率是 20%,而女性的成功率是 25%,所以历史性更偏爱女性; 而在地理系,8 个男性申请,6 个被录 取,五个女性申请,4 个被录取,男性的成功率是 75%,而女性的成功率是 80%,地理系的招聘也更加偏爱女性。但是从总体上来讲,一共有 13个男性,和 13 个女性申请职位,其中 7 个男性和 6 个女性录取,男性的录取率要高于女性的录取率
我们可以把上述的问题,用概率的语言表达如下:
P (Y |X) > P (Y | ~X)
P (Y |X, Z) < P (Y | ~X, Z)
P (Y |X, ~Z) < P (Y | ~X, ~Z)
其中 Y 表示的是招聘结果: 录取,~Y 表示不被录取; X 表示男性,~X 女性; Z 表示的是院系: 历史 系,~Z 表示地理系。原本我们得到的结果是 P (Y |X) > P (Y | ~X),当然得出的结论就是在招聘过程中有歧视女性的现象,但是如果我们院系的因素考虑进来,P (Y |X, Z) < P (Y | ~X, Z) ,P (Y |X, ~Z) <P (Y | ~X, ~Z) ,则得到的结果恰恰相反:从每一个系的数据来看,在招聘过程中有歧视男性的现象。乍一看之下,似乎这只是一个算术的问题,只是因为应聘历史系的女性稍多,然后又职位太少不容易被录取,所以才导致了这样的一个反转。但是这样一种反转一旦裹上生活情境的外衣,就不再只是一个表面的算术问题,就变成了一个现实需要处理的问题:那些因素我们应该考虑,哪些不应该?举一个很现实紧迫的例子,我们测试某一种药物,总体上我们发现这种药物有助于某种疾病的康复,但是如果我们把样本的男性和女性分开来考察的时候却发现,这两个分开的子样本却说明这种药物无助于疾病的康复,于是如何是好?总体上测试说明药物有效,但是分开来,男性服用无效,女性服用也无效,那我们如果得了这种疾病到底是服用还是不服用这种药物呢?[4]所以辛普森悖论需要被解决的现实意义在于,它的出现造成了我们在实际决策的时候的困扰,使得我们无所适从。
二、辛普森悖论的简介
爱德华·辛普森(Edward H. Simpson)第一次在 1951 年的一篇技术的文章提到了这种现象([4]),尽管类似的现象早在 1899 年就已经被提及([5])。科林·布莱斯(Colin R. Blyth)([6])首次把这种反转现象冠以 “悖论” 的头衔。在珀尔之前,统计学家都认为辛普森悖论是一种统计学现象,可以在统计学的框架内得到解决。但是珀尔独持异议,认为辛普森悖论之所以产生是因为我们的因果考虑,而我们如果要解决这个悖论,需要理解数据背后的故事,即导致产生这样结果的因果机制。但是统计学家则认为因果性是一个没有得到好的定义的心灵构建,所以不可以从因果的角度来理解,辛普森悖论是一种能够被侦测,理解的统计现象,而且也可以通过统计分析的工具来规避这种悖论的出现([7])。但是却一直没有一个统计学的标准来警告研究者不要得出错误的言论,或者说明到底是聚合的数据还是分离的数据代表着正确的答案。
但是在处理辛普森悖论问题所形成的共识是,统计的数据并不足以判定到底是聚合还是分离的数据更合理,真正遭遇到辛普森悖论需要做决策的时候,我们要考量的是 “数据背后的故事”。如何对这样一种额外的统计信息进行科学的刻画呢?丹尼斯·林德利(Dennis V. Lindley)和梅尔文·诺维卡(Melvin R. Novick)([9])倾向于通过 “可交换性”(exchangeability)来刻画这些信息,而珀尔则倾向于通过 “因果性” 来刻画。
三、对珀尔解决路径的批评与回应
这篇文章并不打算详细地探讨统计路径和因果路径的分歧和长短。而是聚焦在哲学家是如何理解和处理辛普森悖论的问题上。对于珀尔所提出来解决辛普森悖论的路径,哲学家没有提出任何不同的意见和方法,真正的分歧在于对于辛普森悖论本身的理解上:辛普森悖论何以为悖论?辛普森悖论是如何产生的?
1. 班德亚帕德耶的三个问题
班德亚帕德耶的文章([1], [2], [3])主要就是针对这两个问题提出来的,而且批评在 2011年的文章班德亚帕德耶([1])中已经提出来了,很遗憾我们没有在珀尔([10])文章中对这篇文章有任何的提及和回应。但是两篇文章比较起来有很多针锋相对的地方,甚至在论证径路上都是出奇的一致(比如,都是试图回答班德亚帕德耶所提出的那三个问题)。我们来看看他们两个人对这三个问题的回答:
1.1 辛普森悖论何以为悖论?
探讨这个问题之前,我们需要弄明白的一个问题就是,一个悖论之为悖论的标准是什么?我们只有给出了一个标准,然后证明这个情况符合这个标准,所以我们才可以认为它是悖论。班德亚帕德耶([3], p.68)中所引述的蒯因的标准:“任何一个结论乍看之下荒诞无稽,但是细究起来居然还有论证可倚靠”。我自己觉得这个标准还是有些模糊,不足以作为我们倚靠来做判断的基础,我认为更可接受的说法是:“悖论是一个论述,尽管是从真前提出发且明显合理地推导出来的,却导致了自我矛盾或者逻辑上不可以接受的结论”。([11])
1.1.1 班德亚帕德耶
在班德亚帕德耶看来,辛普森悖论的产生是不经过反思而错误地使用可坍塌原则所致。
定理1 (可坍塌原则(Collapsibility Principle)(CP)). 我们称一个数据集是可坍塌的当且仅当
• 简单地说,可坍塌原则来就是在子总体中成立的变元关系在总体中也必然成立。
• CP 是非因果的数值推理原则,与任何的因果直觉无关。
• 辛普森悖论的重构:
(1)女性和男性群体互不相容完全穷尽总体。一个人不能同时申请两个系的职位且满足辛普森悖论的两个条件。
(2)在历史系中,(从数据中可看到)女性的接受率要高于男性
(3)在地理系中,(从数据中可看到)女性的接受率要高于男性
(4)如果(2)和(3)为真,那么女性总体的接受率就要高于男性。(根据可坍塌原则版本 1)
(5)所以女性总体的接受率就要高于男性。(根据(2),(3),和(4) )
(6)然而,(从数据上可看到)在总体上, 女性的录取率低于男性
(7)女性总体的接受率既高于男性又低于男性(根据(5)和(6) )
在整个推导过程中,(4)扮演着关键的角色。但是根据我们的推导可知可坍塌原则版本 1 并不正确。 所以在班德亚帕德耶看来,之所以会产生辛普森悖论是因为人们对于 CP 的错误认知,想当然的认为它是对的,并以此为基础做出的推论,但是数据所给出的结果却和自己以为的结果不同,才导致了辛普森悖论的产生。
班德亚帕德耶上述重构的目的是要证明辛普森悖论何以为悖论,但是根据我们在上面已经给出的关于悖论的定,“是从真前提出发且明显合理地推导出来的,却导致了自我矛盾或者逻辑上不可以接受的结论”,如果辛普森悖论的得出是因为我们未经反思地使用了错误的可坍塌原则,那么根据这个定义,班德亚帕德耶所证明的并不是辛普森悖论何以为悖论,恰恰相反,他证明了辛普森悖论不是悖论。如果一个悖论的产生只是因为你个人的数学能力太差所致,所以悖论也就不为悖论了。
1.1.2 珀尔
珀尔认为悖论的产生是确定性原则 [10] 所推出的结果和数据所显示的结果不一致所致。
定理 2 (确定性原则 (STP)). 在每一个子总体中,如果行为 C 提高了事件 E 的概率,那么行为 C 也必 然在总体中提高事件 E 的概率,假如这个行为并不改变子总体的分布。
• 我们试着按照班德亚帕德耶的方法,把珀尔的论证重构如下:
(1)药物对女性有效
(2)药物对男性有效
(3)如果(1)和(2)为真,那么药物对于人类总体有效。(根据确定性原则)
(4)然而,(从数据上可看到)在总体上,药物对总体无效。
(5)药物即对人有效,又对人无效(根据(3)和(4) )
• 莱纳德·萨维奇 (Leonard J. Savage)([12], p. 21)首先引⼊确定性原则,他认为“我没有看到其他超逻辑的原则在决策方面这样地广为接受”。珀尔在书中 中把确定性原则当做定理来使用,并且认为“这个原则地独特性在于它获得了强烈而广泛的认可,尽管它并不是奠基在逻辑或者概率之上。”([13], p.181 )“任何一个声称表征人类思维的逻辑系统必然蕴涵着确定性原则作为一条定理。”([14], p.10)
• 班德亚帕德耶认为我们因为相信了一个错误的原则导致了辛普森悖论,而珀尔认为我们因为一个正确的原则才导致了辛普森悖论!至少从给出的悖论定义的角度来看,珀尔成功地证明了辛普森悖论何以为悖论。
1.2 在何种情形之下,这种悖论会出现?
1.2.1 班德亚帕德耶
班德亚帕德耶形式化的给出了辛普森悖论产生的充分必要条件。所用的方法就是从原先的例子出发,形式化数据的结构出来,以此作为辛普森悖论何以产生的定理。
因为形式化例子涉及到太多的符号,使用文字来表述让人不胜其乱,所以我们用下面的图来表示我们的那个故事,以使得问题重点更加明确,而不是把耐心消磨在这些不重要的细节上:
其中 意思是:定义为。有了上面的符号准备,班德亚帕德耶给出了一个辛普森悖论产生的定理,并也在数学上证明了这个定理的正确性。
定理 3 (辛普森悖论). 一个情形是辛普森悖论当且仅当
班德亚帕德耶认为只要数据满足一定的结构特征,悖论就会产生,不需要因果的考量。即没有因果的直觉,纯粹就是演绎的推理,你也能得出这样的结论。对于这个定理本身我没有任何意见,但是问题在于,首先这个定理,从珀尔的理论来看,应该只说明了辛普森反转是如何产生的。它阐述了这个反转产生的数学特征,并没有说明辛普森悖论是如何产生的。其次这个定理本身应用也过于狭窄,并不具有普遍性,比如这个数学定理应该如何处理两个以上院系反转的情形呢?比如下面这个情况,是辛普森悖论毋庸置疑,但是上面的定理却并不适用于这个例子。
表 1: 六个院系的数据
表 2: 总的数据
1.2.2 珀尔
珀尔判定在某种情形之下辛普森悖论是否会产生的方法是:用因果图来模拟数据产生的过程,一个给定场景的科学的内容就被编码在一个有向无环图(贝叶斯网)中了。然后再根据图模型的理论,我们就可以判定,在所模拟的场景中,辛普森反转是可能的还是逻辑上不可能的。这里涉及到图模型的理论,技术的细节我并不打算在这里讨论,但是我们可以通过几个例子感受一下这个理论的应用。
根据图模型的理论,图 (1) 的两个情境中,辛普森反转是有可能发生的,但是图 (2) 的两个情境,辛普森反转则在逻辑上是完全不可能的。通过因果图的语言来模拟相关的情境,在通过图模型理论来判定辛普森反转产生的相关可能性,这是珀尔解决第二个问题的思路。
1.3 当遇到辛普森悖论,当如何处理?
1.3.1 班德亚帕德耶
班德亚帕德耶没有提出任何建设性的方法来解决辛普森悖论的问题,但是他有举下面会提及到的相同数据不同解答的两个例子,似乎他想强调的是问题的复杂使得我们无由从表面的数据中得到任何的答案,为了解决问题,他认同珀尔的做法 “我们需要使用实质的背景知识, 这些背景知识本质上都是因果知识,来回答 ‘如何处理’的问题,正如做某事就是意味着‘使得’某事发生。”([3],p.68)
1.3.2 珀尔
当面对辛普森悖论的时候,我们最迫切需要得到的解答就是:正确的信息是在分离的数据中,还是在聚合的数据中?当面对一个对男性和女性都有效的药物但是对人类总体却没有效的药物的时候,一个病人应该是服用这个药物还是不服用这个药物呢?珀尔的 do-演算和后门准则已经为这样的问题提供了确切地答案。我们这里并不打算详细地阐述了do-演算,那需要一些技术的准备,我们只阐述由do-演算所得出可以用于解决辛普森悖论的后门准则背后的直觉。
每一个因果图都是有向无环图,我们考虑变元 X 对于变元 Y 的因果效应。关联 X 和 Y 的路径有两种,一种是直接的因果路径,即从 X 出发沿着箭头的方向最终指向 Y 的路径,还有一种是 “假路径”,需要条件化特定的协方差集合来阻塞后门路径。所谓后门路径是连接 X 和 Y 且箭头最终指向 X 的路径,所有后门路径都是假路径。
所以要求变元 X 对于变元 Y 的因果效应,需要条件化协方差集 Z,以满足如下的要求:
1) 阻塞所有从 X 到 Y 的虚假路径。
2) 使得那些真正的因果路径不受影响。
3) 不产生新的虚假路径。
而后门准则正是为了达到这个目的。
后门准则:
1. Z 不是 X 的子孙。
2. Z 阻塞了所有 X 到 Y 的后门路径。
后门准则的条件 1 满足了要求 3),而条件 2 满足了要求 2)和 1)。 所以如果我们所考虑场景的模型就是图 1 中的左图,那么根据后门准则我们要条件化 Z,所以正确的决策就要考虑分离的数据;如果我们所考虑的场景的模型是图 2 中的右图,我们不需要条件化 Z,所以正确的决策在聚合的数据中。
正如马克思所说,我们不只是要去理解世界,我们更重要的是要去改变世界,辛普森悖论逻辑基础的解释,或者因果基础的解释,对于现实世界的大多数人而言也许并不重要,最关键的问题在于,当我们真正面对这样一个悖论的时候,我们应该如何处理?他们所需要的只是一个简单直接的结果。班德亚帕德耶没有为这样的问题提供任何答案,而珀尔不只是回答了这个问题,也在他一以贯之的理论框架之下回答了第一个和第二个问题。这也是我在情感上更为信靠珀尔理论的地方。
四、对班德亚帕德耶的另外两个反驳
我再前面介绍这三个问题的时候已经逐一讨论了它们的问题和争点,还有几点,我们需要再详细讨论
一下:
1. 相同数据不同回答
我们先来看两个数据:
这个数据是农业的例子,W 代表的是白色品种,~W 代表的是其他的一个品种,Y 代表的是产量。
表 4: 辛普森悖论(关于药物的例子)
这个数据是药物的例子,T 代表的是服药,R 代表的是康复。班德亚帕德耶([3], p. 66-67) 举了上面两个例子来说明,首先,对于每一个辛普森悖论的情形,哪怕它和其他情形的辛普森悖论数据相同,对于诉诸于哪一个数据,总体还是子总体,可能会有不同的回答,即没有一个统一的回答。(正如农业的例子和药物的例子,我们得到的数据相同,但是关于农业的例子,决策的时候我们诉诸于数据总体,而关于药物的例子,决策的时候我们诉诸于子总体)。其次,班德亚帕德耶也承认,当面对同样数据的两个不同情形的时候,解决如何决策的问题就要诉诸于 “实质的背景信息”([3], p.68),而这些背景信息实质上就是因果。
面对班德亚帕德耶的质疑,我认为珀尔的回答如下:首先,上述两个例子尽管数据相同,但是回答的确不一样,但是没有一个统一的答案,并不意味着这里就有任何的问题,至少从珀尔的解决路径看来,相同的数据不同的回答没有任何矛盾,之所以会有这样的情形出现时因为数据背后的故事不同,而珀尔也指出了面对这样一种困难的时候,我们如何通过 do-演算或者后门准则来找到正确的答案。所以就算是没有一个统一的答案,但是有一个证明没有出错的解决问题的理论,没有统一的答案的责难也就没有什么意义了。其次,班德亚帕德耶认为自己找到了辛普森悖论产生的逻辑基础,只要数据符合那样的逻辑结构就会产生产生了悖论。但问题是,特别是像辛普森悖论这样迫在眉睫的决策问题,这样一个逻辑结构本身对于问题的解决于事无补。
2. 因果直觉的反例
班德亚帕德耶([3], p.65)举了一个反例来说明诉诸于因果直觉并不是辛普森悖论之为悖论的真正原因,因为这个例子不存在任何需要诉诸因果直觉的地方,尽管它也是辛普森悖论。
假定我们有两袋子石头,每一个石头要么大要门小,要么是红色要么蓝色。下图表中说明的是,在每一个袋子中,红色大石头的比率要大于红色小石头的比率,但是如果我们把两袋的石头混合在一起,比率大小与之前的相反。
表 5: 辛普森悖论(关于石头的例子)
班德亚帕德耶([3]) 认为上述的例子并不包含任何因果的直觉的假定,但是它仍然是辛普森悖论的一个例子。而珀尔([10])的文章中实际上已经解决了这个问题,文章中区分了“辛普森反转”和“辛普森悖论”。在珀尔看来为什么一个身家清白的,关系的算术反转(辛普森反转),哪怕是有一些不寻常,为何被冠以“悖论的” 头衔的呢?那是因为在决策的时候,我们赋予辛普森反转以因果的含义。从药物的例子我们就会得到一种药物对男性和女性都有效,但是对于人类总体却是无效的!根据 “确定性原则”,这是不可能的。于是才有了辛普森悖论。
五、结论
辛普森反转和辛普森悖论的区分实际上已经免疫了班德亚帕德耶对其的指控,在珀尔看来班德亚帕德耶所认为的那一个反例只是辛普森反转,并不是辛普森悖论,因为尽管我们总是倾向于把统计的关系赋予因果的解释,但是这个反例无法给予因果的解释,或者就算能够赋予因果的解释,也并不存在一个决策的困境,而只有赋予了因果的解释之后面临一个决策的困境的时候,这个辛普森反转才成其为辛普森悖论。但是班德亚帕德耶对于辛普森悖论产生的形式条件的分析的意义也有其意义,它使得我们明白,辛普森悖论从根子上来看就是一个比率的算术问题,但是我们给这样一个没有任何问题的逻辑骨架披上因果的外衣,放到现实世界的情境中,就让我们有了荒谬之感,悖论由此产生。
[参考文献]
[1] Bandyoapdhyay, Prasanta S, Davin Nelson, Mark Greenwood, Gordon Brittan a Jesse Berwald. The logic of Simpson’s paradox. Synthese. 2011, 181(2), 185–208.
[2] Bandyopadhyay, Prasanta S, Mark Greenwood, Don Dcruza Venkata Raghavan. Simpson’s paradox and causality. 2015.
[3] Bandyopadhyay, Prasanta S, R Venkata Raghavan,Don Wallace Dcruz a Gordon Brittan jr. Truths about simpson’s Paradox: Saving the Paradox from Falsity. In: Indian Conference on Logic and Its Applications. B.m.: Springer, 2015, s. 58–73.
[4] Simpson, Edward H. The interpretation of interaction in contingency tables. Journal of the Royal Statistical Society. Series B (Methodological). 1951, 238–241.
[5] Pearson, Karl, Alice Lee a Leslie Bramley-moore. Mathematical contributions to the theory of evolution.VI. Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses. Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character. 1899, 192, 257–330.
[6] Blyth, Colin R. On Simpson’s paradox and the sure-thing principle. Journal of the American Statistical Association. 1972, 67(338), 364–366.
[7] Liu, Keli a Xiao-Li Meng. A Fruitful Resolution to Simpson’s Paradox via Multi-Resolution Inference. nedatováno.
[8] Armistead, Timothy W. Resurrecting the third variable: A critique of Pearl’s causal analysis of Simpson’s paradox. The American Statistician. 2014, 68(1), 1–7.
[9] Lindley, Dennis V a Melvin R Novick. The role of exchangeability in inference. The Annals of Statistics. 1981, 45–58.
[10] Pearl, Judea. Comment: understanding simpson’s paradox. The American Statistician. 2014, 68(1), 8–13.
[11] Dictionary, Oxford English. Oxford English dictionary online. B.m.: Jstor. 2007
[12] Savage, Leonard J. The foundations of statistics. B.m.: Courier Corporation, 1972.
[13] Pearl, Judea. Causality. B.m.: Cambridge university press, 2009.
[14] Pearl, Judea. The sure-thing principle. Journal of Causal Inference. 2016, 4(1), 81–86.
[15] Kahneman, Daniel. 2011. Causes Trumps Statistics. in Thinking, Fast and Slow. Macmillan.
[1] 作者简介:吴小安 (1984—), 江苏南通人,首都师范大学在读博⼠。研究方向因果性,死亡哲学,哥德尔不完备定理。E-mail: nantongwu@gmail.com
[2] 怎么强调辛普森悖论在因果理论中的重要性都不为过,它是诺贝尔经济学奖得主丹尼尔·卡内曼在书中强调的“因果战胜统计”([15], pp. 166-174) 和 朱迪亚·珀尔“人是一架因果处理器”([13], p.180)的有力证明,它还证明了统计方法的界限,在数据分析中引入因果考量的必要性。
[3] 这源自一个真实的案例,1973 年加州大学伯克利分校男性的录取率为 44%,女性的录取率为 35%,因而被认为在招生的时候歧视女性申请者而被起诉, 但是当每个学院都要求出示本学院的录取数据时。出乎意料的是,绝大多数的学院的录取数据恰恰相反,女性申请人的录取率显著高于男性申请人。
[4] 我们认为这是一个悖论,在珀尔看来是因为我们使用了这样一个没有被明确表达的隐含假定:服药并不影响性别。如果这个假定不成立也就没有辛普森悖论了。但是这样一个假定我们无法在数据中检验它,而且在标准的统计数学中没有得到形式的表达。