概述
阿莱(艾勒)悖论是决策论中的一个悖论。
1952年,法国经济学家、诺贝尔经济学奖获得者阿莱作了一个著名的实验:
对100人测试所设计的赌局:
- 赌局A:100%的机会得到100万元。
- 赌局B:10%的机会得到500万元,89%的机会得到100万元,1%的机会什么也得不到。
实验结果:绝大多数人选择A而不是B。即赌局A的期望值(100万元)虽然小于赌局B的期望值(139万元),但是A的效用值大于B的效用值,
即:1.00U(1m) > 0.89U(1m) + 0.01U(0) + 0.1U(5m)。【1】
然后阿莱使用新赌局对这些人继续进行测试,
- 赌局C:11%的机会得到100万元,89%的机会什么也得不到。
- 赌局D:10%的机会得到500万元,90%的机会什么也得不到。
实验结果:绝大多数人选择D而非C。即赌局C的期望值(11万元)小于赌局D的期望值(50万元),而且C的效用值也小于D的效用值,
即:0.89U(0) + 0.11U(1m) < 0.9U(0) + 0.1U(5m)。【2】
而由【2】式得 0.11U(1m) < 0.01U(0) + 0.1U(5m)
1.00U(1m) – 0.89U(1m) < 0.01U(0) + 0.1U(5m)
1.00U(1m) < 0.89U(1m) + 0.01U(0) + 0.1U(5m)
与【1】式矛盾,即阿莱悖论。
阿莱悖论的另一种表述是:按照期望效用理论,风险厌恶者应该选择A和C;而风险喜好者应该选择B和D。然而实验中的大多数人选择A和D。
阿莱悖论的解释:出现阿莱悖论的原因是确定效应(Certain effect),即人在决策时,对结果确定的现象过度重视。
阿莱悖论(Allais Paradox)另释
1、阿莱问题的提出
期望效用(Expected Utility)理论假设概率是线性的。针对其线性假设的最著名反例是阿莱悖论。阿莱悖论包含了两对二择一选择题。阿莱所设计的原选择问题与以下问题相近似:
从中可见,第一对选择题包含一个肯定备择方案和一个风险备择方案。第二对选择题实际上是从第一对选择题脱胎而来:消除了一个各方案所共同拥有的可能结果(0.89的概率获得$l 000 000),选择A 便成了选择C而选择B便成了选择D。据阿莱报告,面临第一对二择一选择题时,大多数人偏爱A(肯定备择方案),该选择在期望效用理论里意味着:
u(1 000 000)>0.10u(5 000 000)+0.89u(1 000 000)+0.0lu(0)或(1-0.89)u(1 000 000)>0.10u(5 000 000)
然而,面临第二对二择一选择题时,大多数人则偏爱D,该选择在期望效用理论里意味着逆向的不等关系:
0.01u(1 000 000)<0.10u(5 000 000)
以上结果违背了期望效用理论的独立性(independence)原则或称为“确定事件原则”(surething principle)。依独立性原则,人们对选择 A(C)或选择B(D)的偏爱不应受到由0.89的概率所产生的共同结果值($l 000 000或$0)的影响。
自阿莱悖论问世以来,研究者在70、80年代陆续积累了许多实验证据,证明独立性原则会被违背。决策领域也因此新发展了许多修订线性假说的理性期望模型(rational expectations mode1)。这些模型大都从修正线性概率的假设人手,提出各可能结果的效用不再被客观概率所乘,而是被非线性的决策权重(decision weights)所乘。而决策权重不必遵守概率的数学定律,并假定互补事件(complementary even)的决策权重之和可以小于1,即,w(P)+ w(1一P)< 1。从而将期望效用理论无法解释为最大化反应的阿莱悖论等问题,又成功地描述为一种新的最大化的抉择反应。
以极具代表性的Kahneman和Tversky的前景理论(prospect theory)为例,该理论提出了一个非线性的权重函数π。其中,大中概率被权重函数所低估(underweighted),小概率被权重函数所高估 (overweighted)。低估(underweighting)大中概率的结果可导致被权重的概率之和小于1,即,π(P)+ π(1-P)< 1。这种权重函数的特性被Kahneman 和Tversky称之为“次确定性”(subcertainty)。正是这所谓的“次确定性 化解了阿莱所发现的悖论: (1-O.89) u(1,000,000)> 0.10u(5,000,000)>0.1lu(1,000,000),或,(1-0.89)>0.1l。请注意,期望理论是预先假定被人们选定的方案一定是具备了某种“最大值”的方案,即,在第一对选择题中,A 的“总价值”>B的“总价值”;在第二对选择题中,D 的“总价值”>C的“总价值”,从而演绎出“次确定性”关系:π(1.0)一π(0.89)>π(0.11)。
阿莱本人对阿莱悖论亦有自己的解释。他在获诺贝尔经济学奖演讲时,阐述了他对以他名字命名的阿莱悖论的看法:“阿莱悖论”只是在外表上显得自相矛盾,它实际上符合了非常深刻的·,22理现实——接近必然时对安全的偏好。
该文对阿莱悖论所作的研究设计是基于对一所谓“齐当别”抉择模型 的检验。这一抉择模型认为决策者的认知能力无法胜任最优化模式所需要的精确定量计算,也不能够以“效用”或者“心理距离”的方式表达对选择对象整体估算的结果。因而假定:左右人类风险决策行为的机制不是最大限度地追求某种形式的期望(expectation)值,而是某种形式上辨察选择对象之间是否存在优势性(dominance)关系。借助一表征系统(最好和最坏可能结果维度)来描述涉及了阿莱选择题的备择方案,该模型将人类的抉择行为描述为一种搜寻一备择方案在主观上优势于另一备择方案的过程。即:在方案A(C)在最坏可能结果维度上优越于方案B(D),而方案B(D)在最好可能结果维度上优越于方案A(c)的情况下,为了利用“弱优势”(weak dominance)原则达成决策,人们必须在一维度上将差别较小的两可能结果人为地“齐同”掉,而在另一维度上将“辨别”差别较大的两可能结果作为最终抉择的依据。
“齐当别”模型看阿莱悖论的方式与现代派生的理性期望模型很不一样。该模型注意到,若假设人们对金钱的主观价值函数(效用)为非线性的凹型,在第一对选择题中,B方案的“坏结果”(获零元)与 A方案的“肯定结果”(获一百万元)之间的差异显得非常突出;而在第二对选择题中,D方案的“好结果”(获五百万元)与C方案的“好结果 (获一百万元)之间的差异显得非常突出(见图1)。这意味着,在第一对选择题中大部分人的决策是在最坏可能结果维度上进行,在第二对选择题中大部分人的决策是在最好可能结果维度上进行。阿莱悖论的产生,是因为人们的先后两次决策不是固定在同一维度上进行。
认为先后两次决策不是在同一维度上进行,从而导致违背期望效用理论之公理的分析亦可应用于违背不变性(invariance)原则的“亚洲疾病问题。
在著名的“亚洲疾病问题 中,B方案的“零一结果 (最坏可能结果)与A方案的“肯定结果 (200人将生还)之间的差异在正面框架里显得非常突出,而D 方案的“零一结果 (最好可能结果)与C方案的“肯定结果 (400人将死去)之间的差异在负面框架里显得非常突出(见图2)。这意味着,当正面表征时大部分人的决策是在最坏可能结果维度上进行,当负面表征时大部分人的决策是在最好可能结果维度上进行(操纵维度差别而产生的反例见Li )。
从图1和图2中可见,改变“共同结果值 和更替“正负框架 均可以改变最好和最坏可能结果维度上的相对差别。因此,如果研究者借此尝试将原问题中的维度差别朝相反方向转换,便有可能产生与原阿莱悖论相反的选择结果。在这种思路的指导下,作者设计了一系列涉及阿莱悖论的实验,如,“登山队问题州引以及“瓦斯爆炸问题 。在Li的登山队问题中,被试所表现出的不一致的冒险趋势也违背了期望效用理论的独立性原则,但是其违背的类型与阿莱悖论完全相左。即大多数被试在第一对选择题中选择风险备择方案,而在第二对选择题中变换其选择。这是因为,在第一对选择题中,B方案的 “坏结果 (救活不了任何人)与A方案的“肯定结果 (肯定救活1人)之间的差异被设计成相对不显著;而在第二对选择题中,B方案的“坏结果 (89%的机会救活不了任何人)与A方案的“坏结果 (67%的机会救活不了任何人)之间的差异却被设计成相对显著。在Li和Adams的瓦斯爆炸问题中,期望效用理论的独立性原则在正面框架中被人遵守但是在负面框架中却被人违背。这是因为,在正框架里所操纵的“共同结果值”变化是为了促使大部分人的两次决策都在最坏可能结果维度上进行,而在负框架里所操纵的“共同结果值 变化则是为了鼓励大部分人的两次决策分别在两个不同可能结果维度上进行 (第一次决策是在次好 可能结果维度上进行;第二次决策是在最坏可能结果维度上进行)。所收集到的数据表明:只有“共同结果值 的变化能够改变不同维度上可能结果的大小差异,阿莱悖论才有可能产生;改变了“共同结果值”而没有改变不同维度上可能结果的大小差异,阿莱悖论则不可能产生。
为进一步验证人们对阿莱选择题的反应确实是受“齐当别 策略的支配,此项研究采用了一种称为 “判断 的任务。它将各备择方案的最好结果相互配对,又将各备择方案的最坏结果相互配对。然后要求被试判断哪一种结果之间的差异最大。被试若判断最好结果之间的差异最大,“齐当别”模式则推测,被试应挑选最好配对中拥有较好结果的方案(B或 D)。反之,被试若判断最坏结果之间的差异最大, “齐当别 模式则推测,被试应避免最坏配对中拥有较坏结果的方案(B或D)。请注意,在第一对选择题中,肯定方案的结果本身既可看成是最好结果(与 B的最好结果相比较时)又可看成是最坏结果(与B的最坏结果相比较时)。因此,人们选择方案A(保守方案),是因为被试在最坏结果之间(“肯定获一百万元”对“0.01的概率获得零元”)刻意避免了方案B 所提供的较坏结果(0.01的概率获得零元);人们选择方案B(冒险方案),是因为被试在最好结果之间 (“肯定获一百万元”对“0.10的概率获得五百万元 ) 精心挑选了方案B所提供的较好结果(0.10的概率获得五百万元)。
2、实验
(1)实验设计
1)材料
此项实验要求被试次第完成两种任务:选择任务和判断任务。选择任务即阿莱的选择题,呈现给被试的选择题如前部所示。判断任务如下所示:第一对判断题(选出差别最大的配对)
- F:“肯定获一百万元”对“0.10的概率获得五百万元”
- G.“肯定获一百万元”对“0.01的概率获得零元” 第二对判断题(选出差另1最大的配对)
- I:“0.11的概率获得一百万元”对“0.10的概率获得五百万元”
- J:“0.89的概率获得零元”对“0.90的概率获得零元”
反应顺序为:第一对选择题、第一对判断题、第二对选择题、第二对判断题。
2)实验结果
阿莱式的选择结果意味着,选择类型与共同结果值之间存在着一定的关系。当共同结果的值为 $1,000,000时,人们喜欢肯定备择方案;当共同结果的值减至$0时,人们变换其选择方案。若考虑 “第三变量”(判断类型),便可获得更多的信息,并构成列联表(表1)。
如表1所示,在第一次选择和判断中,此项实验有过半数的被试(61%)喜欢风险方案B。其结果与阿莱式的选择结果不尽相符,然而,选择变异可以被判断类型所解释的效应(phi squared)为显著性水平的11%(p<0.01)。另一方面,在第二次选择和判断中,此项实验的大部分被试(92%)喜欢方案D。其结果非常符合阿莱式的选择结果,其中亦有 7%(p<0.01)的选择变异可以被判断类型所解释。
综合两次选择和判断的结果,一共有1 59次反应(65%)符合阿莱的立场。选择类型与共同结果值之间存在显著关系(x2(1):31.34,p<0.01)。另一方面,一共有182次反应(75%)符合“齐当别”抉择模型的立场。共同结果值、判断类型和选择类型之间也存在着显著关系(x2(3)= 52.47, p<0.01)。
3、讨论
应用于风险状态下决策的第一个规范性理论是期望值(Expected Value)理论 此后,迫于理论不能预测及解释行为,人们不断地对风险状态下的决策模式进行修正。Bernoulli所讨论的St.Petersburg悖论证明,如果人们的风险决策是某种期望值的最大化,这个期望值决不是EV。而阿莱悖论又证明,如果人们的风险决策还是某种期望值的最大化,这个期望值既不是EV也不是EU。然而,尽管在该领域的理论发展过程中涌现了许多自认为不同的决策模型,但当前的主流决策模型实际上只研究及采用了一种评价法则—— 期望法则(expectation rule)。证明期望法则具有合法性的理念一直驱动着这领域里的研究者。以后所派生出的理性期望模型 (rational expectations mode1)也只是朝着一个方向修正原有的旧模型。即预先假定被人们选定的方案一定是具备了某种“最大值”的方案,如果被选中的方案被证明不具备客观上的“最大值”,那就转而证明被选中的方案是具备了主观上的“最大值”;如果通过对客观风险结果或者对结果的客观概率作适当地转化后被选中的方案仍然被证明不具备某种 最大值”,那么,就采用之类或者更复杂期望值的计算以证明被选中的方案具备了另一种“最大值”。理性期望模型的百年发展,从EU理论的传统或Bemoullian版本 、到EU理论的yon Neumann和Morgenstem 版本、到Savage 的主观 EU 理论 、到weighted utility模型 、到Rank-Dependent Utility、到sign-dependent utility模型、到rank-and sign-dependent utility模型等,均没有跳出这个巢臼 。
试借用一个决策小轶事来说明这领域里的研究者面临悖论时的所作所为。这个轶事说的是如何测试一个小男孩(小时候的林肯总统?)的辨数能力。事由的起因是有人拿出两枚硬币,让小男孩从中任挑一枚收下。结果,这小男孩选择了一枚小面值的硬币。消息传开,众人硬是不信。于是,接二连三有人用同样的手法来重复这种测验。面对一枚小面值的硬币和一枚大面值的硬币之间作抉择时,这小男孩总是毫不犹豫选择了小面值的硬币。
对小男孩这种屡试不爽的决策行为,经济学家可能解读为,该行为是违背了“最大化 原理的非理性行为。心理学家则可能会说,且慢,虽然被小男孩选中的硬币被经济学家证明不具备客观意义的“最大值 ,但是,小男孩之所以选中该枚硬币,是因为该枚硬币对小男孩而言,是主观上具备了“最大值 的硬币:u(中选硬币的值)>u(落选硬币的值)。让我们研究“金钱错觉 ,特别是家境贫困孩子的“金钱错觉 ,从而推导出这能使以上不等式成立的U函数。将客观标准的值换成主观标准的值后,小男孩的行为就变得可以理喻了。换言之,这领域里的研究者总是从预测失败中想到“最大化 的标准可能出了差错,要做的事是再接再厉修改不符实际的“最大化标准,而鲜有人怀疑“最大化 的原则本身会出错。
然而,根据人们的实际选择演绎出非线性的价值函数(如在受益和受损区域分别为凹型和凸型的 s状价值函数v)和非线性的权重函数(如π函数),然后利用演绎出的非线性函数来让人信服修正后的 “最大化 选择模型是有效度的,这种做法并不能证明“最大化 假设本身是正确的。这样做犹如能寻觅到证据来证明一古老的假设— — 地球是扁平的。寻求证据说明被选中的方案是可以被主观函数演算成具有某种“最大值 ,就好比寻求证据说明心理反应 (如,扭曲,错觉,放大等)是物理变化的非线性函数。虽然人们可以不断找出比传统对数函数更适合个体的心理物理函数,说该函数可使人们将地平线在主观上知觉地更加“扁平 ,找到这样的心理物理函数并不构成对“地球是扁平的 假设的证明。
此实验收集到的数据表明,由判断类型所揭示的“齐当别 策略能够对不同“共同结果值 条件下的风险决策行为作出较连贯地解释。这些结果连同 “登山队问题 等结果,一道质疑了人类风险决策行为是某种期望值的最大化的说法。也许,不断修正的期望模型最终又能演绎出新的主观价值函数或主观概率函数,将人们的风险决策行为圆满地描述为最大化过程;也许,指导人们作风险决策的原则根本就不是期望法则,有如Simon的“满意法则 (satisficing) ,须修正的期望模型只不过是为掩盖旧错误而犯下的新错误,现在到了后来人考虑摆脱 “期望法则 隆圈的时候了。
回到小男孩的选择问题,在最后一次测验时他如是说:“如果我选了大面值的硬币,你们还会一而再、再而三地试我吗?