首页 理论教育提升效率:利用逻辑、算术和概率工具

提升效率:利用逻辑、算术和概率工具

【摘要】:中世纪的课程设置包含有7项人文学科,分作低阶的三艺和高阶的四艺。我们来看看修改后的三艺:逻辑、算术和概率。大学生在逻辑问题上的表现不容乐观。一大部分学生得出结论,没有考古学家是国际象棋棋手,而这是个无效的结论。逻辑规则最初被视为是思想规律的形式化。但如果一个物种的大脑在找到逻辑事实时没有给它一种确定的感觉,我们很难想象它会发现逻辑。另一个原因是,逻辑推断不可能是随意推出的。

中世纪课程设置包含有7项人文学科,分作低阶的三艺(语法、逻辑和修辞)和高阶的四艺(几何、天文、算术和音乐)。三艺最初是指三条路,后来意为交叉道路,再后来意为寻常事物(因为普通人都在交叉路口闲逛),最后是不足道的或琐碎的事物。在某种意义上,这个词源是恰当的:除了天文,没有人文学科是关于任何事情的。它们不解释植物动物岩石或人;相反,它们是可以应用于任何领域的智力工具。就像学生抱怨代数从来不会在现实世界中有所帮助一样,人们也可能会有疑问,自然选择把这些抽象工具灌输到我们脑中是否有用。我们来看看修改后的三艺:逻辑、算术和概率。

从技术上说,逻辑指的不是一般范畴上的理性,而是从一些陈述的事实推出另一个陈述的事实,基于的仅仅是它们的形式,而不是它们的内容。当我做如下推理时,我在运用逻辑。P是真的,P包含Q,所以Q是真的。P和Q是真的,所以P是真的。P或Q是真的,P是假的,所以Q是真的。P包含Q, Q是假的,所以P是假的。我可以推导出所有这些事实,而无须知道P是否意为“花园里有一只独角兽”“马里兰州生长大豆”或者“我的汽车被老鼠咬了”。

大脑做这种逻辑推理吗?大学生在逻辑问题上的表现不容乐观。例如,房间里有一些考古学家、生物学家和国际象棋棋手。没有考古学家是生物学家。所有的生物学家都是国际象棋棋手。根据这三点,你能得出什么结论?一大部分学生得出结论,没有考古学家是国际象棋棋手,而这是个无效的结论。没有一个人得出“一些国际象棋棋手不是考古学家”这个有效结论。事实上,有15%的学生称这些前提条件得不出有效的推论。

斯波克总是说,人类是没有逻辑的。但正如心理学家约翰·迈克纳马拉(John Macnamara)所争辩的,这个观点本身就不合乎逻辑。逻辑规则最初被视为是思想规律的形式化。这有些过誉,逻辑事实是真实的,无论人们怎么想。但如果一个物种的大脑在找到逻辑事实时没有给它一种确定的感觉,我们很难想象它会发现逻辑。对于“P、P包含Q、所以Q”,有一些特别引人注目、甚至是不可抗拒的东西。只要有足够的时间和耐心,我们就会发现为什么我们自己的逻辑错误是不正确的。我们对于“哪些事实是必要的”彼此达成一致。我们教授他人不是通过权威的强迫,而是苏格拉底式的,让学生们用自己的标准来识别事实。

人们当然确实用一些逻辑进行思考。所有的语言都有逻辑术语,比如“不、和、相同、等同和相反”。孩子们在不到3岁的时候就已经恰当地使用“和、不、或者和如果”了,不仅在英语中如此,在6种所研究的其他语言中也是如此。逻辑推断在人类思维中无处不在,特别是当我们理解语言时。这儿有一个心理学家马丁·布雷恩(Martin Braine)列举的简单例子:

约翰去吃午饭。菜单上标明有一个特价汤和沙拉,还送免费啤酒或咖啡。另外,如果你点牛排会附送一杯红酒。约翰选了特价汤、沙拉和咖啡,还有另外一些饮料。

(a)约翰得到免费啤酒了吗?(是的,没有,说不出)

(b)约翰得到免费红酒了吗?(是的,没有,说不出)

实际上,所有人都推出(a)的回答是“没有”。我们对于餐馆菜单的知识告诉我们,“免费啤酒或咖啡”中的“或”的意思是“不是两者都”——你只能免费得到其中之一;如果你想要另一个,你得花钱买。进一步推导,我们知道约翰选了咖啡。从前提“不是啤酒和咖啡两者都免费”和“免费咖啡”,根据逻辑我们推断出“不是免费啤酒”。(b)的回答也是“没有”。我们对餐馆的知识提醒我们,食物和饮料不是免费的,除非菜单上明确那么讲。所以我们增加了“如果不是牛排,就没有免费红酒”这个条件。约翰选择了汤和沙拉,这表示他没选牛排;所以我们用逻辑得出结论,他没有得到一杯免费红酒。

在根据通过语言从他人那里获知的零碎事实和某人自己的综合归纳,从而推导出关于世界的真实事件中,逻辑是不可或缺的。那么为什么在考古学家、生物学家和国际象棋棋手的问题中,人们似乎无视逻辑呢?

一个原因是,在英语这样的日常语言中,逻辑词汇是含糊的,却往往表示一些正式的逻辑概念。英语单词“或”有时可以表示逻辑连接词“或”(A或B或两者都),有时可以表示逻辑连接词“排他的或”(A或B但不是两者都)。语境往往会表示清楚讲话者想用的是哪个,但若是以意想不到的形式出难题,读者可能会猜错。

另一个原因是,逻辑推断不可能是随意推出的。任何真实的陈述都能衍生出无数个真实却没用的新陈述。从“马里兰州生长大豆”中,我们可以推导出“马里兰州生长大豆,或者奶牛跳到了月亮上”,“马里兰州生长大豆和要么奶牛跳到了月亮上要么没有”,如此类推,以至无穷(这是第1章中介绍的“框架问题”的例子)。除非有完全足够多的时间,否则即使是最好的逻辑推断者也只能猜测应该探索哪个含义,以及哪些含义可能是死胡同。有一些规则必须被抑制,因此,有效的推断将无可避免地会缺失。猜测本身不可能源于逻辑;一般来说,它来自假设讲话者是一位传递相关信息的合作性谈话伙伴,而不是一位恶意的律师或是一位判分严格、试图给人挑错的逻辑学教授。

或许最重要的阻碍是,心智逻辑不是一个掌上计算器,乐于接受任何A、B和C这样的输入。心智与我们关于世界的知识系统是交织在一起的。心智逻辑的特定步骤一旦启动,就不依赖于世界知识,但它的输入和输出直接传递着知识。例如,在餐馆的故事中,推断的联系在关于菜单的知识和逻辑应用之间交替进行。

一些区域的知识有它们自己的推断规则,可以强化逻辑规则,或者与逻辑规则跨用途应用。一个著名的例子来自心理学家彼得·沃森(Peter Wason)。沃森受到哲学家卡尔·波普(Karl Popper)的科学推理理想的启发。即如果对一个假说的证伪都失败了,那么这个假说就是可接受的。沃森想看看普通人是如何来证伪的。他告诉被试一套卡片的一面有字母,另一面有数字,然后请他们检验“如果一张卡片在一面有一个D,它在另一面就有个3”这个法则,这是一个简单的P包含Q的陈述。实验者给被试们看4张卡片,然后问他们,如果法则成立,那么他们应当翻开哪张卡片。试试这个:

大多数人要么选择D卡片,要么选择D卡片和3卡片。正确答案是D和7。只有“当P是正确的和Q是错误的”时,“P包含Q”才是错误的。3卡片是无关的;法则说D卡片有3,而不是3卡片有D。7卡片很关键;如果它的另一面有D,法则就错了。只有5%~10%接受测试的人选中了正确的卡片。甚至上过逻辑课的人也选错了。顺便说一句,不是人们把“如果D那么3”解释为“如果D那么3,反之亦然”。如果他们确实那样解释,但在其他方面却表现得像个逻辑学家的话,他们会翻看所有4张卡片。从这个实验中,可以看出有非常可怕的延伸含义。民众们没有理性、不讲科学、总是去证实他们的偏见,而不是寻求证据来证伪偏见。

但当这些枯燥的数字和字母现实世界的事件所取代时,有时——尽管只是有时——人们变成了逻辑学家。你是酒吧的一名保镖,在执行“如果一个人在喝啤酒,他必须是18岁以上”这条规则。你可以检查人们喝什么或者他们多大岁数。下面什么是你必须检查的:一名喝啤酒者、一名喝可乐者、一名25岁的人和一个16岁的人。大多数人正确选择了喝啤酒者和16岁的人。但仅有具体性是不够的。规则“如果一个人吃红辣椒,那么他喝冷啤酒”并不比D和3更容易被证伪。

考斯迈德斯发现,当规则是一项契约、一种利益交换时,人们会得出正确答案。在那些情况下,展示规则是错误的等同于纠出欺骗者。契约的含义是指“如果你从中获益,你必须符合一定的要求”;欺骗者没有符合要求而从中获益。酒吧的啤酒就是人们通过证明自己已经成年而获得的收益,而欺骗者则是不到年龄的饮用者。吃了红辣椒再喝啤酒只是因与果,所以饮用可乐(在逻辑上必须确认)似乎并不相关。考斯迈德斯表明,当人们把P与Q解释为收益和成本时,人们就是在做合乎逻辑的事情,即使这些事件很奇特,像吃小羚羊肉或发现鸵鸟蛋壳一样。不是一个逻辑模块被开启了,而是人们在使用不同分组的规则。这些规则适用于检测欺骗者,有时与逻辑规则相吻合,有时不吻合。当翻到成本和收益术语时,就像在“如果一个人付20美元,他就收到一块表”中,人们仍旧选择欺骗者卡片(他收到那块表,他没有付20美元)——在逻辑上既不正确,也不是毫无意义的卡片造成的典型错误的选择。事实上,同样的故事可以引出合乎逻辑或者不合逻辑的选择,这取决于读者对于谁是欺骗者的解释(如果有欺骗者的话)。“如果员工得到养老金,他已经工作了10年。谁违背了规则?”如果人们站在员工的角度,他们寻找工作了12年而没有养老金的工人;如果他们站在雇主的角度,他们寻找工作了8年就持有养老金的工人。这一基本研究发现已经在施威阿尔人(厄瓜多尔的原始部落)中得到了印证。

心智似乎有一个具有自己逻辑的欺骗者监测器。当标准逻辑和欺骗者监测器逻辑相符时,人们的行为像逻辑学家一样;当它们有分歧时,人们在寻找欺骗者。是什么给了考斯迈德斯寻找这个心理机制的想法?是对利他主义的进化分析(见第6章和第7章)。自然选择没有选择公德心;自私的突变很快会繁殖,超过它的利他竞争对手们。自然界中任何无私的行为都需要一个特殊的解释。一个解释是交换报答:一个生物可以给予帮助以期换取未来的帮助。但恩惠交易对欺骗者来说总是脆弱的。为了进化成这样,它必须辅之以一个认知装置,用来记住谁已经接受帮助并确保他们给予回报。进化生物学家罗伯特·特利弗斯(Robert Trivers)预测人类——动物王国中最著名的利他主义者,应当已经进化出一个复杂的欺骗者监测器算法。考斯迈德斯似乎已经找到了它。

所以在逻辑学家的意义上,心智符合逻辑吗?有时符合,有时不符合。一个更好的问题是,在生物学家的意义上,心智是良好设计的吗?这里“是”的含义要更强些。逻辑本身可能分拆琐碎的事实,却错过重要的事实。心智似乎确实使用逻辑规则,但它们根据语言理解过程来吸收、混合以世界知识,辅之或代之以适合内容的特殊推断规则。

数学是我们与生俱来的一部分能力。出生刚一星期的婴儿看到物体从两个变成3个(或相反的情况)时都会活跃起来。婴儿在10个月大时就能注意到摆放着多少个物品(不超过4个),而且无论这些东西是同质的还是异质的,捆在一起的还是散开的,甚至无论是物体还是声音。根据心理学家凯伦·韦恩(Karen Wynn)的实验,5个月大的婴儿甚至可以做简单的算术。实验者给他们看米奇老鼠,然后用幕布盖住,把第二只米奇放进去。婴儿们在幕布拉开时会期待看到两只米奇,如果只显示一只的话,他们会感到惊讶。给其他婴儿看两只米奇,然后把一只移到幕布后面。这些婴儿会期待看到一只米奇,当发现有两只时会感到奇怪。到18个月大时,孩子们知道了数字不但不同,而且有顺序,例如,可以教孩子们选择图片。在一些动物身上实验也发现了类似的能力,或者这些能力也可以学习。

婴儿和动物真的能数数吗?这问题听起来可能很荒谬,因为这些生物没有语言。但记下数量并不依赖于语言。想象一下,每次当你听到一次敲鼓声都打开水龙头一秒钟,那么玻璃杯中水的数量将代表着敲鼓的次数。大脑或许有着相似的机制,它积聚的不是水,而是神经冲动或者激活的神经元数量。婴儿和许多动物都似乎具备了这种简单的数数能力。这会有许多潜在的选择优势,这些优势取决于动物所处的环境,它们包括从估计在不同地方觅食的回报率,到解决诸如“三只熊走进山洞;两只出来了。我该进去吗?”这样的问题。

成年人使用不同的方式来表征数量。一个是相似体——对“多少”的感觉——它可以被解释为像一个数字线图像的心理意象。但我们还给数量分配了数字单词,并用这些单词和概念来度量、更准确地数数、加和减较大的数。所有的文化都有表示数字的词,尽管有时只是“一”“二”和“许多”。在你窃笑之前,记住数字的概念与数字的词汇量无关。无论人们是否知道表示大数的词(像“4”或者“1000的6次幂”)。他们都会知道,如果两个集合是相同的,你给其中一个集合增加1,那这一集合就会更大些。无论这两个集合是有4项还是有1000的6次幂项,上述论断都成立。人们知道他们可以通过把两个集合中各项逐个配对来看看剩余多少,这样比较两集合的大小;甚至数学家们在对无限集合的相对大小做奇怪论断时,也不得不使用这一技术。没有表示大数的词的文化往往采用一些手法,比如像举起手指,按顺序指向身体的部位,或者两三个一组抓住或排列开物体,来达成计数的目的。

两岁大的孩子喜欢数数、排列集合和进行数字感引导下的活动。学龄前儿童数较小的集合,即使是在他们必须把各种物体混在一起,或是必须把物体、行动和声音混在一起时也在数。在他们真正掌握数数和度量之前,它们已理解了许多其中的逻辑。例如,他们会试着切开一支热狗,把它平均分配,给每人两块(尽管每块可能大小不同);当一个数数的木偶数漏一项或重复计数时,他们会冲着它大喊大叫,尽管他们自己数时也总是犯相同的错误。

正规的数学是我们数学直觉的延伸。算术显然源自于我们对数字的感觉,几何则源自于我们对形状和空间的感觉。著名数学家桑德斯·迈克·莱恩(Sannders Mac Lane)推测,基本的人类活动是每个数学分支的启发来源:

数数→算术和数论

度量→实数,微积分,分析

形状→几何,拓扑学

构形(如建筑中的)→对称,群论

估计→概率,测度论,统计学

移动→机械学,微积分,动力学

计算→代数,数值分析

证明→逻辑

猜谜→组合学,数论

分组→集合论,组合学

莱恩认为,“数学起始于各种人类活动,用来解决许多一般性而不是任意的概念,然后将这些概念及其各方面的互动关系加以形式化”。数学的力量在于形式的规则系统可以“将各种初始人类活动的深刻和微妙特性加以编码”。所有人——甚至蹒跚学步的幼童——都本能地知道从A径直到B然后再到C的路程距离要长于从A径直到C的距离。所有人还都能视觉想象出一条线如何界定一个正方形的边缘,以及形状如何能邻接一起组成更大的形状。但需要一个数学家来证明三角形斜边的平方等于另外两边的平方之和,这样人们就能计算AC捷径所节约的路程,而无须亲历跋涉。

有人认为,学校数学源自于直觉数学,这并不是说它来得很轻松。戴维·吉里认为,自然选择赋予了孩子们一些基本的数学能力:确定小集合的数量,理解“多于”“少于”和较小数字的排序,加减小集合,以及用数字词汇来简单地数数、度量和算术。但也就到此为止。他认为,孩子们在生物上并没有被设计能够运用大数字词汇、大集合、基于10的系统、分数、多列加减法、进位、借位、乘法、除法、根和指数。这些技能发展得非常缓慢、不均衡或者根本没有。

在进化基础上,如果孩子们在心理禀赋上具备了学习数学的技能,那才会令人惊讶。这些工具只是在较晚近的历史和少数几个文化中才被发明,要是贴上人类基因组的标签,这在时间上太晚、地域上也太局部了。最初孕育这些发明的是农业文明中农产品剩余的记载和交易。由于有了正规的学校教育和书写语言(其本身也是一项最近的、非本能的发明),这些发明可以经过几千年的积累,简单的数学运算可以组成越来越复杂的运算。书写符号可以作为计算的媒介来克服短期记忆的局限,就像今天的硅芯片一样。(www.chuimin.cn)

人们怎么能用他们石器时代的心智来运用高技术的数学仪器呢?第一种方式是,让心智模块能够作用在与当初设计不同的物体身上。通常,线条和形状这样的信号输入是由我们负责空间感觉的意象和心智组块来分析的,而大量的东西则是由我们的数字机能来分析的。但为了实现莱恩解决从狭隘中提炼通用的理想(例如,从一堆石头的数目这样的狭隘概念中,清理出数量的通用概念),人们可能需要将他们的数字感觉应用到一个起初觉得好像不属于适当种类的物体。例如,人们在分析一条沙地中的线时,可能并不需要连续扫描和切换的习惯性意象运作,而是要从一端到另一端来报数虚拟线段。

第二种方式是,练习。这种方式类似于获得在卡耐基音乐厅表演机会的方式。数学概念来自于把旧的概念以一种有用的新方式组合在一起。而那些旧的概念也是更旧的一些概念的组合物。每种组合、子组合都是由被称为组块和自动化的心理铆钉连接在一起的:通过大量的练习,概念黏合成更大的概念,步骤顺序被组合为单个一步。自行车是由框架和轮子组成,而不是由管子和辐条组合而成;食谱讲怎样做调味汁,而不是讲怎样拿勺子开启罐子。就像它们一样,数学学习是将已经大量学习的惯例结合在一起。微积分老师哀叹学生们觉得这门课难,不是因为导数和积分是深奥的概念——它们不过是比率和累积而已——因为你无法做微积分,除非你的代数运算已经是第二天性了,而绝大多数学生上这门课时,代数的掌握程度还是不行,因此需要在此集中耗费他们大量的心理能量。数学是残酷的累积性学科,向前一直追溯到从一数到十。

进化心理学对于儿童教育学颇有启示,这在数学教学方面尤为明确。美国儿童在数学才能测试方面处于工业化发达国家中表现最差的行列。他们并非天生蠢才,问题在于,教育的设置忽视了进化因素。在美国,数学教育的主导哲学是建构主义,混合了反文化和后现代意识形态的皮亚杰式心理学。孩子们必须在一个社会性环境中主动积极地为自己构建数学知识,而这种环境的内驱力中则对概念的含义没有达成一致。老师提供了材料和社会性氛围,但不做讲授或引导讨论。演练和练习,通向自动化的途径,被称为是“机械论”和不利于理解的。正如一位儿童教育者明白地解释道:“对于具体数学概念的可能建构范畴是由孩子们对此概念所做的可能修改决定的,或者是作为数学学习环境中互动沟通的一个结果。”这种结果,另一位教育者宣称:“有可能让学生来为自己建构,历史上花费了几千年才进化而来的数学知识。”

正如吉尔瑞所指出的,建构主义对于自然发自于所有孩子的小数字和简单算术直觉来说是有价值的。但它忽略了我们先天具有的设备与人类文明在后天加装在我们身上的辅助工具之间的差异。将我们的心智模块设置为针对并非设计所用范围的材料而工作,这非常困难。孩子们不能自发地把一串珠子看作是一个集合中的元素,或是把一条线看作一些数字。如果你给他们一堆积木,让他们将这些积木一起用来做些什么,他们会用积木来练习他们的直觉物理学和直觉心理学,但不一定练习他们的直觉数字感。更好的教学安排是,明确指出各种理解方式之间的联系。可以告诉孩子们来用三种不同方式做每一道算术题:数数、画图和把各部分摆成一条数字线。如果没有练习过把暂停的序列步骤加入一个心智反射中,学习者就总是会从最小的螺母螺栓起构建数学结构,就像从未分组块装配过表的制表匠每次因接电话而停下来手中的活计后,都不得不重新从零开始工作一样。

精通数学会有丰厚的回报,但这种回报是辛勤工作换来的,而辛勤工作本身并不总令人愉快。不像在其他文化中常见的,努力赢得的数学技能会受到尊重,在美国的文化中,对数学的掌握不大可能兴旺繁荣。令人悲哀的是,同样的事情正在美国的阅读指导教育方面重演。其称为“整体语言”的主导技术中,语言是自然发展的人类本能这一洞见已经被断章取义为这样一种论断,阅读是自然发展的人类本能这样在进化上不可能的。旧式的将字母与发音建立联系的练习,被专注于丰富文本的社会环境所取代,而孩子们则没有学习阅读。如果不了解心智在我们进化的环境中被设计所做的事情,所谓正规教育这样的非自然活动就不大可能取得成功。

“我永远也不会相信上帝在和这个世界掷骰子。”这是爱因斯坦的一句名言。无论爱因斯坦关于量子力学和宇宙的说法是否正确,他对人们在日常生活中游戏规则的声明都一定是错误的。生命不是国际象棋而是西洋双陆棋,每一轮都要掷骰子。结果就是,很难做出预测,特别是对未来的预测(正如约吉·贝拉所宣称的那样)。但在一个由所有规律构成的宇宙中,根据过去所做的决策要比随意做出的决策更好些。这一直是对的,所以我们估计有机体,特别是像人类这样偏好信息的物种,会进化出关于概率的敏锐直觉。概率论的创始者们,像逻辑学的创始者们一样,想象他们只是在将常识感觉形式化了而已。

但为什么用马西莫·皮亚泰里·帕尔马里尼(Massimo Piattelli-Palmarini)的话来说,人们似乎常常是“概率盲”呢?许多数学家和科学家总是悲叹,普通人在对风险推理时表现出数学盲。心理学家阿莫斯·特沃斯基和丹尼尔·卡尼曼积累了大量巧妙的事例,来展示人们对机遇的直觉把握似乎蔑视了概率理论的基本规则。这里有一些著名的例子:

人们怀着赌博的心态购买州政府彩券,有时被称为“愚蠢税”。但既然赌博场馆必须盈利,赌徒一般而言,就必定会输。

人们对飞机的恐惧更甚于汽车,特别是在看(听)到一条残酷的飞机失事新闻之后,尽管统计数字表明,乘飞机要比坐汽车安全得多。人们害怕核能,尽管更多的人因煤炭而残疾或丧命。每年有1000名美国人死于意外触电,但摇滚明星们没有发起活动来降低家居电压。人们鼓噪着要禁止杀虫剂残余和食品添加剂,尽管它们与植物为了阻止虫子吃掉自己而进化出的数千种自然致癌物相比,致癌的风险微乎其微。

人们觉得如果轮盘在一排中黑的那里已经停下过6次,它就该在红的那里停了,尽管轮子没有记忆,每次旋转也都是独立的。一大批自封的预言家形成一个产业,在股票市场的随机游走中产生幻觉倾向。篮球迷们相信篮球运动员在“手热”的时候,投篮命中率如有神助,尽管他们空心入框和打板弹出的接连顺序其实与掷硬币也没什么两样。

下面这个问题是提给哈佛大学医学院的60名学生和员工的:“如果对一种发生率为1/1000的疾病检验呈现阳性的错误率为5%,一个人被发现有阳性结果而事实上也罹患这种疾病的概率是多少,假定你对这个人的症状一无所知的话?”最常见的回答是0.95。回答的平均值是0.56。正确答案是0.02,只有18%的专家猜对了这个答案。根据贝叶斯定理,这个答案可以用发生率或基本率(1/1000)乘以检验的敏感性或击中率(检验呈阳性的患者比例,假定为1),再除以阳性检验结果的整体发生率(检验结果呈阳性的情况下,分别相对于病人和健康人患该病机会加总的百分比——也就是说,检验呈阳性的患病者1/1000×1和检验呈阳性的健康人999/1000×0.05之和)。这个问题的令人头痛之处在于,许多人把“错误的阳性比率”误解为健康人中呈阳性结果的比例,而没有解释为呈阳性检验结果的健康人比例。但最大的问题是人们忽视了基本率(1/1000),这个比率本应当提醒他们这种疾病非常罕见,因此对于某个患者而言,即使检验结果呈阳性,也不大可能患有该病。他们很显然犯了“因为斑马有马蹄声,所以马蹄声暗示着斑马”这样的谬误。调查显示,当病人对于一种罕见疾病的测试呈阳性时,许多医生常会无必要地吓唬这些病人。

来试试这个问题:“琳达31岁,单身,为人坦率,非常聪明。她的专业是哲学。作为一名学生,她非常关注歧视和社会公正方面的问题,她还参与了反核武器的示威活动。琳达是一名银行出纳员的概率是多少?琳达是一名银行出纳员而且积极参与女权主义活动的概率是多少?”人们有时把“她是一名女权主义银行出纳员”的概率比“她是一名银行出纳员”的概率估计得还要高。但“A且B”比单独“A”的概率还要高,这是不可能的。

当我在课堂上讲授这些研究发现时,一个学生大声说:“我真为我所属的物种而感到丢脸!”其他人也感到了这种羞愧,如果不是为他们自己的话,那就是为街上的路人。特沃斯基、卡尼曼、古尔德、皮亚泰里·帕尔马里尼,还有许多社会心理学家都得出结论,认为心智并没有被设计为掌握概率法则,尽管这些法则和规律支配着宇宙。大脑能够处理有限量的信息,所以它没有来计算定理,而是使用粗略的经验法则。

一个法则是:一个事件越令人记忆深刻,它就越可能发生(我能记得最近一次恐怖的飞机失事,所以飞机不安全)。另一个是:一个人越类似于一种刻板印象,他就越可能属于那种类别(比较我对于银行出纳员心理意象的符合程度,琳达更符合我对于女权主义银行出纳员的心理意象,所以她就更可能是女权主义银行出纳员)。有着渲染性标题的畅销书籍对坏消息的传播更加推波助澜:《非理性:内心中的敌人》《注定的幻觉:理性的错误如何控制我们的心理》《我们如何知道不是如此:日常生活中人类理性的谬误》。我们作为直觉统计学家的不称职解释了人类愚蠢和偏见的沮丧历史。

特沃斯基和卡尼曼的论证是心理学中最发人深省的研究之一,这项研究还使人注意到我们对社会和个人风险的公共讨论,其知识水平之低下令人沮丧。但在一个概率的世界中,人类心智真的对概率这么不在意吗?对于人们常会搞砸的问题,其解决方法可以在一个廉价计算器上敲几个键就算得出来。许多动物,甚至蜜蜂,在它们觅食时都能计算精确的概率。这些计算真的超过了有数以兆计突触的人脑的信息处理能力了吗?这难以让人相信,人们也不必相信它。人们的理性不像它最初看起来的那么傻。

首先,许多风险选择不过就是选择,这毋庸置疑。以赌徒、飞机恐惧者和化学物质远离者为例,他们真的不理性吗?有些人在等待那些能彻底改善他们生活的事件结果时,感到很愉快。有些人不喜欢被困在一个筒里,然后脑子里不断充斥着一种令人恐惧的死亡方式的念头。有些人不喜欢吃蓄意掺和了毒药的食物(就像有些人大概不会选择去吃添加了无害虫子肉的汉堡包一样)。上述这些选择比起在香草冰激凌和巧克力冰激凌中选择前者来说,一点儿也没有更不理性。

心理学家格尔德·吉仁泽(Gerd Gigerenzer)、考斯迈德斯和托比指出,即使当人们对于概率的判断远离事实时,他们的推理也可能是有逻辑的。任何心理能力都不是万能的。颜色视觉被钠汽路灯所愚弄,但并不意味着它的设计就很差。它的设计很好,在记录不断变化照明中恒常的颜色方面远超过任何照相机(见第4章)。但在这个无法解决的问题上,它对于这个世界默认的假设还有待改进。当这个假设在一个人造的世界里不再成立的时候,颜色视觉就失灵了。对于我们的概率估计器来说,情况也是如此。

以著名的“赌徒谬误”为例:期望硬币正面的连续出现会增加硬币反面出现的机会,仿佛硬币有记忆而且希望公平一样。我还记得自己十几岁时在一次全家度假时一回丢脸的经历。我父亲说,已经连续下了几天雨使我们不能尽兴,好天气该到了,然后我纠正他,说他犯了赌徒谬误。但受困几日的爸爸是对的,是他无所不知的儿子错了。冷锋没有在一天结束时掠过地球,第二天早晨又来新的冷锋。云的覆盖一定有一般的大小、速度和方向,如果一周的多云天气确实预示着云层后缘的临近和即将到来的拨云见日,这并不让(现在的)我感到惊讶,就像一列行进的火车中第100节车厢比第3节车厢更可能预示着车尾的临近。

许多事件都像这件事一样。它们有着一段有生命的历史,一个随时间推移而发生的变化着的概率,统计学家们称之为风险函数。一个精明的观察者应当犯赌徒谬误,并尝试根据事件现有的历史来预测它下一次的发生,这种统计被称为时间序列分析。有一个例外:被设计用来导致事件独立于其历史而发生的设备。哪种设备会这样做?我们把它们称之为赌博机器。它们存在的原因就是为了挫败喜欢将模式转化为预测的观察者。如果我们对模式的热爱是拙劣的,因为随机性随处可见,那么赌博机器会很容易建造,赌徒们也很容易被欺骗。事实上,轮盘赌、老虎机、骰子、扑克和硬币都是精密的仪器;它们对制造的要求很高,但也易于被击败。在二十一点中犯“赌徒谬误”的算牌者记住发的牌,并赌它们不会很快再次出现,他们是在拉斯维加斯不受欢迎的人。

所以在除了赌场之外的任何世界,赌徒谬误都几乎不是一个谬误。如果只是因为我们无法赢过赌博机器,就把我们对事物直觉式的预测能力称作谬误,这显然是一种因果倒置的说法。赌博机根据定义就是设计来击败我们直觉预测的。这就像说,我们的手设计不佳是因为它们难于脱开手铐。对于“手热”错觉和体育迷们的其他谬误也是同样道理。如果篮球投篮易于预测的话,我们也就不再把篮球称为一项运动了。有效率的股票市场是另一项被设计用来击败人类模式监测的发明。它的设立是为了让交易员迅速根据随机游走的偏差来利用资本,从而也就消除了这种偏差。

其他所谓的谬误可能也是由欺骗我们概率计算器的进化玩意儿所引发的,而不是由天生的设计缺陷所导致的。“概率”有许多含义。一个是长期的相对频率。“一分硬币面朝上停下来的概率是0.5”的意思是,扔100次硬币,50次会是面朝上。另一个意思是对于单个事件结果的主观置信。从这个方面讲,“一分硬币面朝上停下来的概率是0.5”的意思是指在0到1的刻度上,你对扔下一次面朝上的置信是在确定它会发生和确定它不会发生的中间值。

表示单个事件概率的数字只是作为主观置信的估计才有意义,这在现在很常见:明天下雨的概率有30%;加拿大人队今晚击败悍鸭队的概率是5:3。但心智或许进化成将概率认为是长期的相对频率,而不是对单个事件置信的数字表示。概率数学的发明只是17世纪的事情,用比例或百分比来表示则出现得更晚。百分率是在法国大革命后同其余的计量系统一起出现的,最初是用作利率和税率。输入公式算概率则是更晚近的事了:群体收集数据、书写记录、检查误差、积累档案以及刻度计算得出数字。我们祖先最接近概率的含义是对未知有效性的传闻,再加上像“很可能”这样的粗糙标签。我们祖先可用的概率一定来自他们自身的体验,其意思是指频率:多年以来,长紫斑的人中8个有5个第二天就死掉了。

吉仁泽、考斯迈德斯、托比和心理学家克劳斯·费尔德勒(Klans Fiedler)注意到,医疗决策问题和琳达问题询问的是单个事件概率:这个病人患病的可能性有多大,琳达是银行出纳员的可能性有多大。习惯于相对频率的概率本能会觉得这种问题超过它的势力范围了。只有一个琳达,她要么是银行出纳员,她要么不是。“她是银行出纳员的概率”是不可计算的。所以他们交给人们这个难解的问题,但表述方式确是以频率的方式,不是单个事件概率。1000个美国人中有一个患这种疾病;1000个健康人中有50个检验呈阳性;我们收集了1000个美国人;有多少个检验呈阳性的人们患有这种疾病?100个人符合对琳达的描述,有多少人是银行出纳员?有多少是女权主义银行出纳员?现在大多数人——多达92%——表现得像个好统计学家了。

这种认知疗法有着巨大的实际意义。许多艾滋病毒检验呈阳性的人估计也劫数难逃。一些人甚至采取了极端性措施,包括自杀,尽管他们既知道大多数人没有患艾滋病(特别是不属于众所周知的风险群体的人),也知道没有任何测试是十全十美的。但医生和病人们很难使用这些知识来校准他们被感染的概率,即使他们都知道这些概率。例如,最近几年在不属于艾滋病高风险群体的德国男人中,艾滋病毒呈阳性的占0.01%,典型艾滋病毒测试的敏感度(击中率)为99.99%,错误阳性率大约为0.01%。测试呈阳性病人的前景听起来似乎不太妙。但假设医生这样给病人解释:“想想10000名像你这样的男人,我们预计有一名感染了这种病毒,他基本上确定检验结果呈阳性。在9999名没有感染的男人中,还有另外一人检验呈阳性。这样我们有两个检验呈阳性的,但只有其中一个真正感染上了这种病毒。目前我们所有知道的就是你的检验呈阳性。所以你实际感染这种病毒的概率是五五开。”吉仁泽发现当概率以这种方式(像频率一样)表述时,人们(包括专门医师)在预测医疗测试后患病的概率方面准确性有极大的改善。对于其他不确定条件下的判断,比如刑事审判中的犯罪认定,情况也是如此。

吉仁泽认为,人们将概率等同于频率的直觉认识不仅使他们计算起来像统计学家,还使他们在思考概率概念本身(一个相当含糊和矛盾的概念)像统计学家。单个事件的概率到底是什么意思?出版商们愿意捏造一些无法审核的数字,比如迈克尔·杰克逊(Michael Jackson)和拉托亚·杰克逊(LaToya Jackson)是同一个人的概率是500:1;或者玉米地里的圆圈发自缶波斯(火星的一个卫星)的概率是1000:1。这些陈述正确吗?错误吗?基本正确吗?我们怎么知道呢?一个同事告诉我,我讲话时他会来的可能性是95%。可他没有来,他撒谎了吗?

你可能会想:假定单个事件概率就只是主观置信,用相对频率来校准置信难道不是理性的吗?如果日常生活中人们不那么做,难道他们就不理性了?呵,不过,是什么的相对频率?要数频率,你得确定要数的一组事件,而单个事件属于无限多数的组。理查德·冯·米塞斯(Richard von Mises)是概率理论的一位倡导者,给出了一个例子。

在一组35~50岁的美国妇女的样本中,4%的人在一年内患上乳腺癌。因此史密斯夫人,一位49岁的美国妇女,在下一年患上乳腺癌的可能性为4%吗?没有答案。假定在一个从45~90岁妇女的样本中——史密斯夫人也属于这个集合——11%的人在一年中患上乳腺癌。史密斯夫人的患病概率是4%,还是11%?假定她母亲患有乳腺癌,而45~90岁且母亲患有乳腺癌的妇女中,22%的人会患上该病。她的概率是4%,11%还是22%?她还吸烟,住在加州,在25岁前和40岁后各生了一个孩子,是希腊人的后裔……我们应该拿她来比较哪个群体,才能发现“真实的”概率?你可能会想,所属集合越具体,就越好——但所属集合越具体,它的容量就越小,频率也就越不可靠。如果世界上只有两个人特别像史密斯夫人,其中一个人患有乳腺癌,有人会说史密斯夫人的患病概率是50%吗?极端地讲,真正同史密斯夫人在所有细节上都可比的集合就只包含史密斯夫人自己。但在一个只有一个元素的集合中,“相对频数”没有任何意义。

这些关于概率含义的哲学问题不是学术性的;它们影响到我们所做的每个决策。当一个吸烟者理性化地认为,他90岁的父母几十年来每天都抽一包烟,所以全国范围的概率不适用于他,他可能非常正确。在1996年总统选举中,高龄的共和党候选人成为一个问题。《新共和》杂志刊登了如下信件:

致编辑:

在贵刊题为《多尔太老了吗?》的社论(4月1日)中,你们的保险统计信息是误导人的。平均72岁的白人男性在5年内有27%的死亡危险,但健康和性别之外的因素还必须考虑到。那些还在工作中的人,就像参议员鲍勃·多尔那样,有着长得多的寿命。此外,统计数字显示良好的健康状况与更长的寿命相关。将这些特征考虑在内后,平均73岁(多尔如果任职总统,他当时的年龄即73岁)的人在未来4年内将死亡的概率是12.7%。

是的,那么平均73岁,富有而且在工作,出生于堪萨斯,不吸烟,在炮弹下仍幸免于难的白人男性的概率又是多少?一个更具戏剧性的差异出现于1995年O.J.辛普森谋杀案的审判中。律师阿兰·德肖维茨在探讨此案的辩护时在电视上说,在虐待妻子的男性中,只有1/1000的人会进一步谋杀他们的妻子。在给《自然》杂志的一封信中,一位统计学家指出,在虐待妻子而之后他们的妻子被谋杀的男性当中,有一半多的人就是谋杀的凶手。

许多概率理论家下结论说,单个事件的概率无法计算,这个过程都是毫无意义的。一位数学家曾经说,单个事件概率是“完全无意义的话”。另一位数学家也语带讥讽,说这些计算应该被交由“精神分析,而不是概率理论”来处理。这不是说人们能够相信他们对单个事件想要的任何事情。说我和迈克·泰森打一架,我输的可能性要大于赢的可能性,或者说我今天晚上不大可能被外星人绑架,这样的陈述并不是毫无意义。但它们不是数学上精确的真或假的陈述,质疑它们的人们也没有犯基本谬误。关于单个事件的陈述无法用一个计算器来决定;它们需要通过权衡证据、评估论证的说服力、改造陈述使其易于评估,以及所有凡夫俗子对不可知的未来进行推断猜测时容易犯错的其他过程,这样才能确定结果。

所以根据许多数学家所说的,即使是人类蠢行中最明显的错误——说琳达更可能是一个女权主义银行出纳员而不是银行出纳员——也不是一个谬误。既然单个事件概率在数学上是无意义的,人们就不得不尽可能地将这个问题合理化。吉仁泽认为,因为频数是有讨论余地的,而人们在直觉上没有给单个事件赋予数字,它们有可能转换到第三种,非数学的概率定义,“由刚刚提供的信息确保的信念程度”。这个定义在很多字典中都找得到,还用于法庭上,对应于比如合理的根据、证据的重要程度,以及合理怀疑这样的概念。如果关于单个事件概率的问题促使人们进入这个定义——如果被试们非常合理地推测认为,实验者已经出于某种原因涵盖了琳达的概略,那么这就是他们所做的自然解释——他们会把问题阐释为,在多大程度上,根据琳达所提供的信息能够确保得出结论说,她是一个银行出纳员吗?一个合理的回答是,不太大。

概率概念最后一个令人费解的问题是一种认为世界是呈现稳定状态的信念。概率的推导是基于昨天搜集的频率而在今天做出的预测。但那是那时,这是现在。你怎么知道世界在这间歇中没有变化?在一个变化的世界中是否有任何概率的信念是真正理性的,概率哲学家对此进行着辩论。精算师和保险公司担心得甚至更多——一个当前事件或生活方式的变化使得保险公司的表格过时,这会令这些公司破产。社会心理学家关注一些倒霉蛋,他们拒绝购买具有很好维修记录统计的汽车,只是因为听说一个邻居的同款式汽车昨天出了故障。吉仁泽提出了一个相似的例子,一个人不让他的孩子在一条从未出过事的河里玩耍,因为他听说一个邻居的孩子那天早晨在那儿遭到鳄鱼的攻击。两个情形的差异(除了后果的程度不同之外)在于我们判断汽车的世界是稳定的,因此旧的统计数据可以适用;而河流的世界是变化的,所以旧的统计数据就值得商榷。街上的路人更看重一件最近的逸闻,而不是一沓统计数据,这并不一定就是不理性。

当然,人们有时推理确实存在谬误,特别是在今天数据泛滥的情况下,但是每个人也都应当学习概率和统计。但一个没有概率本能的物种是学不会这门课程的,更不用说发明它了。当人们得到的信息格式与他们自然思考概率的方式相吻合时,他们可以做到惊人的准确。宣称我们的物种是概率盲的论断,正如他们所说的,是不大可能真实的。