博弈论里有两个超级明星——一个是去年仙逝的纳什,一个就是囚徒困境。纳什作为主角被拍成了电影《美丽心灵》,获得了第74届奥斯卡最佳影片和最佳导演奖;囚徒困境则不仅出现在成千上万篇学术文献中,养活了很多我的同行,还可以很容易被公众掌握,用来令人信服地解释很多社会现象。说得尽的纳什,说不尽的囚徒困境。今天我们就来聊一聊囚徒困境,囚徒困境不仅。
囚徒困境有多个版本,下面大概是最简单的一个。假设两个人玩一个游戏:每人面前有一个箱子,里面装着面值分别为10元和100元的两张钞票。每人从中取出一张钞票:如果取100的,最终要给对方;如果取10元的则自己留下。只要不是太笨的人就能很容易想明白,不管对方怎样选择,拿10元的留给自己都是最“聪明”的决策。所以很可能的结局是每人只得10元。这个结果不仅是唯一的纳什均衡,还是一个占优均衡,从而是唯一的演化稳定均衡和唯一的相关均衡。这是囚徒困境非常有说服力的重要原因。明明可以每人都拿100,为什么彼此不能多一些信任呢?如果你不相信这个预测结果的话,可以看看Friend or Foe,相信这个拍了130集的真人秀会加深你对人性的认知。
博弈论的通俗著作中有不少庸俗且不靠谱的玩意,比如教人怎么用博弈论炒股啊,撩妹(汉)啊等。但是活学活用囚徒困境真的可以帮我们重新审视一大类现象。在这类现象里,每人都处在一个跳不出的“局”里(局中人,多么传神的称呼啊)。每个人都很“聪明”很“理性”或者有其不得已,但“聪明反被聪明误”,这一个个不得已最终造就一个大家都不愿看到的悲催结局。说老实话,博弈论里这么好用的模型并不多。我希望通过大家都熟悉的奥数问题来说明囚徒困境就在我们身边。只要用心去琢磨,总能发现一些别人没注意过的新的囚徒困境。
奥数本身作为发现杰出数学人才的平台并没有问题,而且对于有一定天分又对数学特别感兴趣的孩子来说,奥数教育对于发掘他们的数学潜力有非常积极的作用。不过,如今这种与升学挂钩的全民奥数就显得有些疯狂了。这种疯狂得近乎畸形的奥数教育不仅不能培养真正的数学创造力,而且还会扼杀多数孩子对数学的兴趣。
疯狂奥数中有两个相互关联的囚徒困境,分别发生在学生与学校之间。意识到这个双重囚徒困境的存在对于我们理解奥数问题为什么难以解决会有重要启发。这比空洞的呼吁号召大家改变教育理念或许更有益。
很多人会好奇:奥数明明只适合有一定天赋对数学特别感兴趣的孩子,对于不感兴趣的孩子,为什么非要折磨他们呢?这真是有所不知。多数让孩子参加奥数培训的家长并不是期望自己的孩子将来当数学家。家长的目标通常很现实,就是上一个好点的中学,因为小升初择校要考奥数。常考的题目就那些类型,参加奥数辅导对提成绩非常管用。这些题目普遍比较偏比较怪,不在正常教学范围内,再聪明的孩子仅指望临场发挥一般也不行。所以不管别的孩子参加不参加培训,对于多数孩子和家长来说,参加培训都是最优选择。
有意思的是,大家都参加培训时升学考试的结局跟大家都不参加培训其实没有太大差别。最终都是那一波最优秀的孩子被名校选上。这跟各种过级考试不一样,起作用的不是绝对成绩而是相对排名。
我们很自然会问,为什么家长之间不能达成一种默契,都选择不培训呢?这样不仅节省了大量开支,孩子们也免受折磨,可以有更充裕的时间来从事真正感兴趣的活动。这样孩子们的整体素质也会有所提高。
这就是问题的关键所在——大家不可能达成这种默契。因为这本质上是一个囚徒困境的局,局中人自己很难破。何况这还牵涉到成千上万的孩子和家长,学术界一般把这种多人的囚徒困境称为社会困境,其合作难度比两三个局中人高出不是一点两点。有机会我们再来单独聊“集体行动的逻辑”。
所以疯狂奥数是同龄人过度竞争的结果。人人都怕输在起跑线上——过度反应——大家一起输在起跑线上。即便此竞争中的胜出者,毫无疑问也是受害者。因为我们最终要面对一个更大的局,那就是全球化竞争。
上面这一层学生或者说家长之间的囚徒困境很多对博弈论有所了解的朋友早就注意到了,并非本文原创。或许笔者首先注意到的是,其实还有一个上层的囚徒困境发生在学校之间。
既然奥数这么可恶,各中学校长又都是精英中的精英,对局势的了解比我们普通人透彻一百倍,他们直接取消奥数考试不就完了吗?何况还有教育局的三令五申?这就牵涉到了奥数的特殊作用。
我们知道一所中学办成什么水平,主要取决于两个因素,师资和生源。而后者比前者更关键。所以如何设法争夺优秀生源是中学校长们面对的重要问题。注意,这里的“优秀”主要是指将来高考能出好成绩,所以是一个相对而非绝对指标。因为只有状元和被北大清华录取才最利于宣传,最能给学校长脸面。这当然主要不是学校的过错,因为全社会包括家长对学校的评价主要看这些。这容易看得到容易度量。即便是仅针对成绩,如果一所中学使入学时成绩很差的孩子高考时有大幅提升,家长也不愿意把孩子送去。这多少有点奇怪。我不知道是不是家长普遍希望自己孩子能跟尽可能优秀的同龄人做同学的缘故。
可是孩子们脑门上又没写着自己的智商,怎样选拔优秀学生呢?普通考试区分度不高,效果一般,尤其是为了选拔将来能出彩的顶尖学生。而奥数(或者比较偏的难的怪的数学题)就具有这样的神奇功能:奥数成绩高与在中学表现优异并最终在高考中出彩高度正相关。所以率先领悟到这一点的中学在竞争中获得了优势。如果你了解某明星中学崛起的秘密,就会很容易赞同我的观点。后来所有的中学都发现了这个窍门,都用奥数这个指标筛选学生。这是奥数得以星火燎原的重要原因。当然,由于马太效应,最先掌握这个窍门的中学迅速取得了后来者很难超越的优势地位。
但是,假设其它因素不变,所有中学都使用奥数指标跟大家都不用效果又差不多。正如前面所分析的,这导致了生源素质的整体下降。所以说中学之间也有一层囚徒困境,他们自己也解不了这个局。
有了上面的分析就不难理解为什么说“奥数不能作为选拔人才的工具”。跟有些人的分析恰恰相反,我认为并不是奥数成绩选拔人才不靠谱。相对于其它指标或手段,它其实非常靠谱。它很管用,但是我们还是不能用。这个世界有时候就是这么吊诡。
所以靠行政命令强行取消奥数也就成为我们唯一的选择。北京最近搞的小升初划片入学应该可以从根子上切断疯狂奥数存在的土壤。当然,这又会引入新的问题。从这个例子中我们也很容易理解市场并非万能,“看不见的手”也有失灵的时候。广泛意义上囚徒困境的存在是市场失灵的重要原因。
当一个指标足够重要的时候,局中人通常会有“刷指标”的冲动。指标,而非指标背后想度量的内容,成为大家的唯一追求。GDP,SCI,各种例子数不胜数。如果没法控制住大家刷指标,这个指标会慢慢失效。这就是经济学中的古德哈特定律(Goodhart’s law)。当然古德哈特定律并不总是起作用。最完美的指标是大家越去刷变得越有效。还有一类指标,它的有效程度跟大家刷不刷关系不大。比如奥数,参加辅导某种意义上就是刷指标。但是正如我们前面讲的,普遍参加辅导并不会使这个指标失效(尽管普通孩子参加辅导而聪明孩子不参加会使它失效),这就是奥数的神奇之处。
需要注意的是,我们前文的分析存在若干不足。比如我们并未引入辅导机构,而它们也是重要的局中人,有时候跟中学还有千丝万缕的联系。再比如我们假设孩子的智商和优秀程度是先天决定的,教育的功能仅仅是让优秀者拥有一个可以向市场释放的信号。尽管这是2001年诺贝尔经济学奖得主斯宾斯在信息经济学开山之作之一Job Market Signaling中的基本假设,但毫无疑问教育本身会提升学生的素质,而且这种提升并不一定均匀。学生参加奥数辅导也并非均匀地提升他们的成绩。有些学生裸考成绩很烂,但是经奥数辅导开了窍成绩大幅提升(甚至爱上数学)也并非没可能。最后,不同学校拥有不同的奥数组织资源,它们走出囚徒困境的迫切程度不一样。但无论如何,我认为前文的分析抓住了一些核心矛盾,对于我们理解疯狂奥数问题会有重要启发。
标准囚徒困境模型预言的是一个很悲观的局面。如何走出囚徒困境,给经济学家、社会学家、生物学家提出了巨大挑战。现实有时候又没有理论预测那么悲观,合作在生物界和人类社会相当普遍。如何解释囚徒困境环境下合作的起源和发生,是理论生物学界和经济学界过去几十年的热门话题。
文章来源于科大学院
如有侵权请联系管理员删除
扫一扫关注公众号,看更多物理竞赛干货
复制 wulijingsai 微信公众号搜索关注