TDC 关闭

博弈经典“囚徒困境”对利益最大化的启示

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。

  【环球旅讯】(特约评论员 胡质健)1950年,由就职于兰德公司的梅里尔•弗勒德(Merrill Flood)和梅尔文•德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特•塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并检控对方("背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监10年;若二人都保持沉默,(即"合作"),则二人同样判监半年;若二人互相检举(即互相"背叛"),则二人同样判监2年。他们如何选择?此例的分析对很多问题,如价格战、环境保护、商务谈判、关税战等等问题的处理有广泛的指导意义。

  首先来分析囚徒们如何选择,以及不同选择会有什么样的结果。显然,如果囚徒们互相合作,利益将得到最大化,只需要坐半年牢后无罪释放。若囚徒们不互相合作,则无法脱离困境,利益不能最大化。他们每人其实只有两个选择,即沉默或认罪,也就是与对方合作或背叛对方。结果也只有四种,请看图表。

  甲沉默(合作) 甲认罪(背叛)
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
乙认罪(背叛) 服刑10年;乙即时获释 二人同服刑2年


  囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在无法沟通的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。   

  以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但大多数囚徒只追求自己个人利益,而不信任对方,多数情况是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低。这就是“困境”所在。例子有效地证明了在非零和博弈中,帕累托最优和纳什均衡是互相冲突的。

  那么,在酒店或在线旅行社的定价过程中,对整体或每家酒店或在线旅行社都有利,利益最大化的做法是大家都不降价或者都提价(即合作),通过提高产品服务的质量和品牌的竞争力提高市场份额。但是,很多酒店和在线旅行社不考虑整体的利益,只考虑自己的利益,也不相信对方而采取降价的策略。他们的思路是这样的:如果我们降价而对方不降价,顾客就会从他们那边跑到我们这边,从而,我们的收入和市场占有率提高了;如果我们不降价,对方也许会降价或偷偷地打折,那么我们的顾客就流失了。所以不如我们先降价。每个酒店和在线旅行社都这么想,价格战不可避免,整个行业的收入减少,市场价格一片混乱,最后两败俱伤,全倒霉。

  所以,在竞争与合作中,我们应该常常想到如何采取整体利益最大化的策略,实现共赢,多赢,因为除了是你死我活,非胜即败之外,还有可能大家都赢,而且每个人都赢得更多的可能。这就是笔者在康奈尔大学学习的《谈判的策略和技巧》的精髓。

胡质健
胡质健

环球旅讯特约评论员

胡质健先生是《收益管理--有效实现饭店收益最大化》作者,美国资深酒店人、收益管理实战专家,康奈尔大学酒店管理硕士。

已发表文章 6 篇
© 以商业目的使用环球旅讯拥有版权的内容,请遵循环球旅讯 版权声明 获得授权。非商业目的使用,请遵循 CC BY-NC 4.0

评论

请登录 参与评论
旅连连公众号

关注『旅连连』公众号

订阅每日资讯推送

微信
微博
QQ
微信扫码分享
打开微信扫一扫

微信扫码参与话题讨论