“这山望着那山高”的数学原理

现在邀请你和一位路人甲来做一个游戏:我拿出两个信封分别递给你们,并告诉你们一个装着的钱是另一个的两倍(但不知道哪个多哪个少)。你们有一次互相交换的机会,想交换吗?然后打开信封,看一下自己拿到的钱数(但不要让对方知道),现在还想交换吗?

我们用中学生都会的数学来分析一下——当你拿到信封后,你可以设其中的钱数为\(x\)。显然,另一个信封的钱数,有一半的概率是\(2x\),一半的概率是\(0.5x\)。所以“不交换”这个选项能使你平均得到\(x\),而“交换”这个选项能使你平均得到\((2x+0.5x)/2=1.25x\)。显然,交换对你更有利,无论你是否打开信封看到钱数,这个推理都是成立的,而且路人甲也会经过这样的推理过程,认为交换对他更有利。

等等!一个不创造新的价值的交换怎么可能对双方都有利呢?零和博弈的任何策略都不可能互利共赢,一定是我们的推理出了问题。

我们换个思路来思考这个问题:先假设两个信封中的钱数分别是\(y\)和\(2y\),那么我刚开始拿到的钱的期望是\((y+2y)/2=1.5y\),如果交换,拿到的钱的期望仍然是\((2y+y)/2=1.5y\),换或不换没有任何区别。之前的思路的问题在于,它当自己拿到的是\(y\)时,令\(x=y\);当自己拿到的是\(2y\)时,令\(x’=2y\)。实际上交换后所得的期望应为\((2x+0.5x’)/2\),它通过混淆\(x\)与\(x’\),产生了错误的结果。

打开信封看钱数也不会有任何改变,假设你看到自己的信封中装了100元,并不是对方装50元和装200元的概率各占一半!这两种情况的概率是不明的,如果贸然认为各一半,也就等同于贸然认为我令\(y=50\)和\(y=100\)的概率各一半,但我在介绍规则时可没有对此作出任何保证,规则是“\(y\)为任意值,你得到\(2y\)的概率与得到\(y\)的概率各一半”。

于是,通过逆向思维,我们可以计算出:规则为“\(y\)为任意值,你得到\(2y\)的概率与得到\(y\)的概率各一半”,并且实际得到了100元时,\(y=50\)的概率占\(2/3\),\(y=100\)的概率占\(1/3\)。只有这样的比例分布才使得对方所得钱数的期望也为100,符合前面所得出的“换与不换都一样”的结论。

这真是一个很有悖于常识的思路。

这个数学问题在生活中是存在的。我们如果将“两个信封”改成“许许多多个信封”,就可以和社会相类比。社会上每个人的天资/地位/生活状态(以下统一抽象为“得分”)都是符合一定的概率分布的,可以理解为许许多多个事先包装好的信封被发给了许许多多个人。如果只知道分布规律,不知道得分数值大小,贸然以自己的情况为基准来推测其他人的情况,正如不知道\(y\),因为自己的信封里装了100元,就推测对方有50元或200元的概率相等。基于这样的推测,必然会导致“交换是更有利的”这一错误的结论,也就是“对方的得分的数学期望比我高”。

接下来将证明,无论社会中每个人的得分符合什么样的分布函数,只要:

  1. 不知道全体社会成员的平均得分大小(不知道信封中分别装了多少钱);
  2. 只知道分布函数形状(只知道一个信封装的钱是另一个的二倍);
  3. 认为自己得分在社会中所在的位置,符合该分布函数(看到自己有100块钱,就认为对方的钱数是50或200的概率各一半);

那么一定会导致“这山望着那山高”、“感觉别人平均来说生活得比我好”的心理(感觉交换信封对我有利)。

设得分\(x<kx_0\)的人占总体的比例为\(f(k)\),全社会的平均得分应为\(x_0\int kf’(k)\mathrm{d}k\),\(x_0\)是社会成员未知的。我自己得分为\(x\),试图以此猜测\(x_0\)的值。

基于上述错误的思维方式,我会认为\(x_0>x/k\)的概率为\(f(k)\),得出\(\mathrm{E}x_0=x\int\frac{f’(k)}{k}\mathrm{d}k\)。将其代入全社会平均得分的式子,并将积分的乘积转化为二重积分,得出全社会的平均得分为:\[x\int\frac{f’(k)}{k}\mathrm{d}k\int kf’(k)\mathrm{d}k=x\iint\frac{f^{-1}(y)}{f^{-1}(x)}\mathrm{d}x\mathrm{d}y\]

研究上式中的系数\(\iint\frac{f^{-1}(y)}{f^{-1}(x)}\mathrm{d}x\mathrm{d}y\),这是在\((0,1)^2\)上对\(g(x,y)=\frac{f^{-1}(y)}{f^{-1}(x)}\)的积分。此区间具有对称性,\(g(x,y)=1/g(y,x)\),又因为\(\frac{g+1/g}{2}\ge 1\),故该积分结果必大于或等于1。\(f^{-1}(x)\)不可能为常值函数,因此该积分结果必大于1。由此得到结论:\[x\int\frac{f’(k)}{k}\mathrm{d}k\int kf’(k)\mathrm{d}k>x\]即社会平均得分比自己的得分高。

P.S. 没想到推导过程中居然要用到刚刚学的多变量微积分知识,开心~