社交账号登录

社交账号登录

0/34

上传头像

拖拽或者缩放虚线框,生成自己满意的头像

头像

预览

忘记密码

设置新密码

文化

关于因果关系的新科学,为什么说“你比你的数据更聪明”?

曾梦龙2019-07-17 18:53:41

“如果能用一句话来概括本书的内容,那就是‘你比你的数据更聪明’。数据不了解因果,而人类了解。”

《为什么:关于因果关系的新科学》

内容简介

朱迪·珀尔认为,因果关系研究在科学探索中处于核心地位,而因果关系科学真正重要的应用则体现在人工智能领域。本书回答的核心问题是:如何让智能机器像人一样思考?借助因果关系之梯的三个层级逐步深入地揭示因果推理的本质,并据此构建出相应的自动化处理工具和数学分析范式,作者给出了一个肯定答案。作者认为,今天为我们所熟知的大部分机器学习技术,都建基于相关关系,而非因果关系。要实现强人工智能,乃至将智能机器转变为具有道德意识的有机体,我们就必须让机器学会问“为什么”,也就是要让机器学会因果推理,理解因果关系。

作者简介

朱迪·珀尔(Judea Pearl),现加州大学洛杉矶分校计算机科学教授,“贝叶斯网络”之父, 2011 年因创立因果推理演算法获得图灵奖,同时也是美国国家科学院院士, IEEE 智能系统名人堂第一批 10 位入选者之一。

目前已出版 3 本关于因果关系科学的经典著作,分别为《启发法》(1984)、《智能系统中的概率推理》(1988)和《因果论:模型、论证、推理 》(2009)。他还获得过多项顶级科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。

达纳·麦肯齐(Danna Mackenzie),普林斯顿大学数学博士,自由科学记者,知名科普作家,著有《无言的宇宙》等作品,其学术论文多次收录于《科学》《新科学家》《科学美国》《探索》等重量级期刊。

书籍摘录

导言 思维胜于数据(节选)

本书将要讲述的故事会围绕一门科学展开,这门科学改变了我们区分事实与虚构的方式,但目前,它仍处于大众的视野之外。这门新科学非常重要,其已经影响到了日常生活的种种重要的方面,并且还有可能进一步扩大影响范围,覆盖从新药开发到经济政策制定,从教育和机器技术人到枪支管制乃至全球变暖等重大问题的探索和解决。值得注意的是,尽管这些问题涉猎的领域广泛多元并且完全不具可比性,但这门新科学仍然成功将它们全部纳入一个统一的框架,这在20年前是根本不可能实现的。

这门新科学并没有一个时髦的名字,和我的许多同事一样,我简单地称之为“因果推断”它本身也并不是什么高科技。因果推断力图模拟的理想技术就存在于我们人类自身的意识之中。数万年前,人类开始意识到某些事会导致其他事的发生,并且改变前者就会导致后者的改变。没有其他物种领悟到了这一点,更别说达到我们所理解的这种程度。由这一发现,人类这一物种创造出了有组织的社会,继而又建立了乡村和城镇,直至创建了我们今天所享有的科技文明。所有这一切都源于我们的祖先提出了这样一个简单的问题:为什么?

因果推断正是关于这个问题的严肃思考。它假设人类大脑是大自然有史以来为处理因果知识而设计出的最先进的工具。我们的大脑存储了海量的因果知识,而在数据的辅助下,我们可以利用这些知识解决当代社会所面临的最紧迫的问题。一个更宏伟的目标是,一旦我们真正理解了因果思维背后的逻辑,我们就可以在现代计算机上模拟它,进而创造出一个“人工科学家”。这个智能机器人将会为我们发现未知的现象,解开悬而未决的科学之谜,设计新的实验,并不断从环境中提取更多的因果知识。

但在冒险推测未来发展之前,了解迄今为止因果推断这门科学所取得的成就至关重要。我们将深入探讨它是如何改变了几乎所有依赖数据信息的学科中研究者的思维模式,以及它将如何改变我们的生活。

这门新科学解决了以下这些看似简单明了的问题:

•一种特定的疗法在预防某类疾病方面的成效如何?

•是新税法的颁布还是层出不穷的广告推销活动导致了销售额的增长?

•由肥胖引发的医疗保健成本增长的总体占比为何?

•雇用记录可否证明雇主实施了涉及性别歧视的招聘政策?

•我打算辞掉工作。我究竟该不该这么做?

这些问题的共同点在于它们都与因果关系有关,我们可以通过诸如“预防”、“导致”、“由……引发”、“证明”和“该不该”这样的词语轻易识别出它们。这些词在日常生活用语中很常见,我们的社会也一直在不断提出这样的问题并寻求答案。然而,就在不久之前,我们甚至还无法在科学的范围内找到途径明确地表述这些问题,更别说回答它们了。

到目前为止,因果推断对人类最重要的贡献就是让这个科学盲点变成了历史。这门新科学催生出了一种简单的数学语言,用以表达我们已知和欲知的因果关系。以数学形式表达因果关系的能力让我们得以开发出许多强大的、条理化的方法,将我们的知识与数据结合起来,并最终回答出如上述那 5 个涉及因果关系的问题。

过去的 25 年,我有幸成为参与了这一科学发展进程中的一员。在公众的视野之外,我曾目睹过它在学生宿舍和研究实验室中崭露头角,也曾听到过在严肃的科学会议中它的突破性进展所引发的共鸣。眼下,随着我们进入强人工智能(AI)时代,越来越多的人开始鼓吹大数据和深度学习的无尽可能性,这使我越发感觉到,向读者展示这门新科学正在进行的大胆探索,其对于数据科学以及人类在21世纪的生活所可能造成的诸多影响是恰逢其时且激动人心的。

我知道,当听到我把这些成就描述为一门“新科学”时,你可能会心存疑虑。你甚至可能会问,为什么科学家没有在更早的时间就开始这样做?比如在古罗马诗人维吉尔首次宣称“幸运儿乃是能理解众事原委之人”(公元前 29 年)的时候,或者,在现代统计学的奠基人弗朗西斯·高尔顿(FrancisGalton)和卡尔·皮尔逊(KarlPearson)首次发现人口统计数据可以揭示一些科学问题的答案的时候。在这些关键性的时间节点上,他们很遗憾地与因果关系失之交臂,这背后的曲折故事我将在本书的有关因果推断的历史渊源的章节中一一道来。在我看来,阻碍因果推断这一科学产生的最大障碍,是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。

通过“因果透镜”,许多科学问题看起来都会变得有所不同,我很高兴自己有机会研究这个透镜。过去的25年里,新见解和新工具赋予这一透镜越来越强的能力。我希望并相信本书的读者也将分享我的喜悦。因此,我想预告一下本书即将呈现的亮点内容,以此结束导论。

本书的第一章将观察、干预和反事实这三个台阶组合成因果关系之梯(ladderofcausation),这是本书的核心隐喻。它将向你揭示利用因果图(我们主要的建模工具)进行推理的基本原理,同时引导你一步步成为一名精通因果推理的专家。事实上,你将远远超过几代数据科学家,因为他们曾试图通过一个模型盲(model-blind)的透镜解释数据,完全忽略了因果关系之梯所阐明的特质。

本书的第二章将讲述一个匪夷所思的故事:统计学科是如何让自己陷入因果蒙昧的黑暗,及其对所有依赖数据的科学产生了怎样深刻的影响。我会在这一章讲述遗传学家休厄尔·赖特的故事,他是本书中的一位大英雄,他在 20 世纪 20 年代绘制出了世界上第一张因果图,多年来他是少数几个敢于认真对待因果论的科学家之一。

本书的第三章讲述的是一个同样奇妙的故事:我是如何通过对人工智能,特别是对贝叶斯网络的研究,皈依了因果论。贝叶斯网络是让计算机得以在“灰色地带”进行思考的第一个工具,有段时期,我曾坚信它掌握着开启人工智能大门的钥匙。而到了 20 世纪 80 年代末,我终于确信自己错了,本章讲述的正是我从贝叶斯倡导者变身为叛教者的整段旅程。不过,贝叶斯网络仍然是人工智能领域的一个非常重要的工具,仍然涵盖因果图的大部分数学基础。除了对贝叶斯法则和贝叶斯推理方法所做的浅显的、以因果关系为基本逻辑的介绍外,第三章还将为读者提供一些贝叶斯网络的应用实例。

本书的第四章讲述的是统计学对因果推断的主要贡献:随机对照试验(randomizedcontrolledtrial,简称 RCT)。从因果的角度来看,随机对照试验是一个进行人为干预的工具,用以解答P(L|do(D))问题,可以说这就是该工具的本质特征。随机对照试验的主要目的是将目标变量(比方说D和L)与其他变量(Z)分离,因为如若不进行分离,变量(Z)就会对二者产生影响。破解这种潜在变量产生的扭曲或“混杂”在近百年来一直未曾得到妥善解决。而本章将引导读者使用一种极其简单的方法来解决这个常见的混杂问题。通过在因果图中进行路径跟踪,你们在 10 分钟之内便能掌握这种方法。

本书的第五章将讲述因果关系史甚至科学史上的一个重要时刻,当时,统计学家纠结于“吸烟是否会导致肺癌”这一问题。由于无法使用他们最喜欢的工具——随机对照试验,他们在是否接受某一方的结论上始终难以达成一致,甚至对于如何理解这个问题也一直存在分歧。关于吸烟的争论将因果论的重要性推到了风口浪尖。数百万人因吸烟而丧生或折寿,就因为科学家没有适当的语言或方法论来回答这个因果问题。

在第五章的严肃话题之后,我希望本书的第六章会是让读者享受其中的轻松时刻。这章的主题是悖论:蒙提·霍尔悖论、辛普森悖论、伯克森悖论等。此类经典悖论的确可以当作脑筋急转弯来消遣,但它们也有严肃的一面,尤其是当你从因果的角度来分析它们的时候。事实上,几乎所有这些悖论都体现了某种与因果直觉有关的冲突,从而也揭示出了这种因果直觉的内在构造。这些悖论是一种警示,用以提醒科学家们人类的直觉是根植于因果的,而不是根植于统计和逻辑的。我相信读者会从那些有趣的古老悖论中得到“柳暗花明又一村”的体验。

终于,本书的第七章到第九章将带领读者踏上因果关系之梯激动人心的攀登之旅。我们会从第七章的干预问题入手,讲述我和我的学生们如何历经 20 年的努力,实现 do– 类型问题解答的自动化。我们成功了。我还将在本章解释“因果推断引擎”的本质,它能够产生“是/否”问题的答案以及图I.1中的被估量。对这个引擎的深入分析将让读者习得如何在因果图中发现某些模式,这些模式将生成因果问题的直接答案。我将这些模式称为后门调整、前门调整和工具变量,它们是研究者在实践中进行因果推断的主要工具。

本书的第八章将通过讨论反事实把你带到因果关系之梯的顶端。反事实被视为因果论的基本组成部分这一认识至少要追溯到 1748 年,当时苏格兰哲学家大卫·休谟(DavidHume)提出了这样一个有些别扭的因果定义:“我们可以给一个原因下定义说,它是先行于、接近于另一个对象的一个对象,而且在这里凡与前一个对象类似的一切对象都和与后一个对象类似的那些对象处在类似的先行关系和接近关系中。或者,换句话说,如果没有第一个对象,那么第二个对象就不可能存在。”大卫·刘易斯,普林斯顿大学的哲学家,于 2001 年去世,他曾指出休谟实际上给出的是两个而非一个定义。第一个是规则性定义(因后面通常跟着果),第二个是反事实定义(“如果没有第一个对象……”)。尽管哲学家和科学家更多地将注意力集中于规则性定义,但刘易斯指出,反事实定义与人类直觉的联系更为紧密:“我们认为因是起重要作用的事物,并且它所引起的差异必然就是有它和没它所发生结果之不同。”

读者将在本章结尾兴奋地发现,我们现在可以越过学术争辩,估算出任何反事实问题的实际值(或概率),无论这个问题有多么复杂。其中最有趣的问题就是观察到的事件的必要因(necessarycause)和充分因(sufficientcause)问题。例如,被告的行为有多大可能是原告受伤的必要因?人为的气候变化有多大可能是全球热浪的充分因?

最后,本书的第九章讨论的主题是中介。在因果图中谈论箭头绘制时,你可能会想,如果药物 D 只是通过影响血压 Z (中介物)来影响生存期,那么我们是否仍然要从药物 D 画一个箭头到生存期 L 。换言之, D 对 L 的影响是直接的还是间接的?如果两者都有,那么我们如何评估它们的相对重要性?这些问题不仅具有重大的科学意义,而且具有深刻的实际影响:如果我们了解了药物的作用机理,我们或许就可以开发出其他效果相同,但价格更低廉或副作用更少的药物。同样,读者将在本章结尾愉快地了解到,这一古老的中介机制问题将被简化为一道代数题,而科学家将通过使用因果工具包中的一些新工具来解决这些问题。

本书的第十章将通过追溯我本人走向因果研究领域的起始地带领读者走向尾声。正是这个问题,即人类智能的自动化(有时也被称为“强人工智能”)引导我开始研究因果关系的。我相信因果推理对智能机器至关重要,它可以让智能机器使用我们的语言与我们交流策略、实验、解释、理论乃至遗憾、责任、自由意志和义务,并最终让智能机器做出自己的道德决策。

如果能用一句话来概括本书的内容,那就是“你比你的数据更聪明”。数据不了解因果,而人类了解。我希望因果推断这门新科学能让我们更好地理解我们是如何做到这件事的,因为除了通过自我模拟,我们没有更好的方法去了解人类自身。与此同时,在计算机时代,这种新的理解也有望被应用于增强人类自身的因果直觉,从而让我们更好地读懂数据,无论是大数据还是小数据。


题图来自:pixabay

喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。