囚徒困境

商人书院 > 知识技能 > 经济学 > 正文

囚徒困境

媒体：blogchina.com 作者：　
专业号：王军 2008/11/16 23:56:55

　　囚徒困境（Prison Dilemma）是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

　　1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：

　　警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

　　若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

　　若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

　　若二人都互相检举（互相“背叛”），则二人同样判监2年。

　　用表格概述如下：

	甲沉默（合作）	甲认罪（背叛）
乙沉默（合作）	二人同服刑半年	甲即时获释；乙服刑10年
乙认罪（背叛）	甲服刑10年；乙即时获释	二人同服刑2年

　　解说

　　如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

　　囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：

　　若对方沉默、背叛会让我获释，所以会选择背叛。

　　若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

　　二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

　　这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

我也说两句

E-File帐号：用户名：密码： [注册]

评论：（内容不能超过500字。）

*评论内容将在30分钟以后显示！

版权声明：
1.依据《服务条款》，本网页发布的原创作品，版权归发布者（即注册用户）所有；本网页发布的转载作品，由发布者按照互联网精神进行分享，遵守相关法律法规，无商业获利行为，无版权纠纷。
2.本网页是第三方信息存储空间，阿酷公司是网络服务提供者，服务对象为注册用户。该项服务免费，阿酷公司不向注册用户收取任何费用。
  名称：阿酷（北京）科技发展有限公司
  联系人：李女士，QQ468780427
  网络地址：www.arkoo.com
3.本网页参与各方的所有行为，完全遵守《信息网络传播权保护条例》。如有侵权行为，请权利人通知阿酷公司，阿酷公司将根据本条例第二十二条规定删除侵权作品。

书香门第

专业号：王军2

王军2的最新文章：