zsdnishishui的博客

唯有创造才是“真”

论囚徒困境和纳什均衡

这两个概念都是博弈论中的概念,那什么是博弈论呢,博弈论是研究竞争现象的一种理论方法。既然是理论方法就会有许多假设的前提,但在现实情况下,这些前提很可能不会同时存在。所以所有理论方法,只是有助于你分析并理解现实世界,它只是一种方法,或者是一种思维工具而已,切不可生搬硬套。博弈论在经济学、生物学、物理学、社会学、政治学中都有应用,所以博弈论是一种十分有用的分析框架。

先介绍一下囚徒困境,然后在囚徒困境中找到纳什均衡的局面,最后进行一下总结。

1.囚徒困境

1.1两个犯罪嫌疑人都被抓了起来,并且这两个人都是理性、自利的,并且不能相互交流。都被告知如下规则。

  乙沉默(合作) 乙认罪(背叛)
甲沉默(合作) 二人同服刑半年 甲服刑10年;乙即时获释
甲认罪(背叛) 甲即时获释;乙服刑10年 二人同服刑5年

在这种情况下,两个人会做什么选择?答案是两个人都会选择背叛对方。分析如下:

甲想:

如果乙沉默,我背叛的话,就会立即获释。

如果乙背叛,我沉默的话,就会判刑十年。

所以甲会选择背叛。同理乙也会选择背叛。最终两人都会服刑5年。

其实有一个最优解就是:甲乙都选择沉默。这就是“困境”所在:个人的最优解,并不是全局的最优解。

1.2知道次数的囚徒困境。比如限制十次

经过上次的教训,甲知道了沉默是全局的最优解,但是最后一次,甲背叛,乙沉默的话,甲会立马获释。

所以前九次甲都会选择沉默,已获得对方的信任,最后一次会选择背叛。同理乙也会这么想。当双方都知道对方在最后一局选择背叛,那么会有人在第九局选择背叛,依次类推。第一局双方都会选择背叛。

1.3不知道次数的囚徒困境

经过多次博弈,背叛会受到惩罚,双方趋向于选择合作。

2.纳什均衡

在博弈中会存在一个均衡,任何一方都不愿改变策略,因为这种状况下改变策略会不利于自己。囚徒困境下的纳什均衡是:双方都背叛。

可以用排除法找到答案,如果两人都沉默的话,只要任何一方背叛,会立马获释。这种双方都沉默的局面并不稳定。如果一方沉默,另一方背叛的话。没有人傻到自己沉默,所以这种情况也是不稳定的。

3.总结

3.1局部最优解不是全局最优解。

3.2个人的理性选择,会造成全局的非理性。

3.3纳什均衡不是全局最优解。

3.4人类一般都会选择背叛对方。但是法规的出现,是人类从背叛走向合作的转折点。

自私与报复是人的本性

目录