论囚徒困境和纳什均衡
这两个概念都是博弈论中的概念,那什么是博弈论呢,博弈论是研究竞争现象的一种理论方法。既然是理论方法就会有许多假设的前提,但在现实情况下,这些前提很可能不会同时存在。所以所有理论方法,只是有助于你分析并理解现实世界,它只是一种方法,或者是一种思维工具而已,切不可生搬硬套。博弈论在经济学、生物学、物理学、社会学、政治学中都有应用,所以博弈论是一种十分有用的分析框架。
先介绍一下囚徒困境,然后在囚徒困境中找到纳什均衡的局面,最后进行一下总结。
1.囚徒困境
1.1两个犯罪嫌疑人都被抓了起来,并且这两个人都是理性、自利的,并且不能相互交流。都被告知如下规则。
乙沉默(合作) | 乙认罪(背叛) | |
---|---|---|
甲沉默(合作) | 二人同服刑半年 | 甲服刑10年;乙即时获释 |
甲认罪(背叛) | 甲即时获释;乙服刑10年 | 二人同服刑5年 |
在这种情况下,两个人会做什么选择?答案是两个人都会选择背叛对方。分析如下:
甲想:
如果乙沉默,我背叛的话,就会立即获释。
如果乙背叛,我沉默的话,就会判刑十年。
所以甲会选择背叛。同理乙也会选择背叛。最终两人都会服刑5年。
其实有一个最优解就是:甲乙都选择沉默。这就是“困境”所在:个人的最优解,并不是全局的最优解。
1.2知道次数的囚徒困境。比如限制十次
经过上次的教训,甲知道了沉默是全局的最优解,但是最后一次,甲背叛,乙沉默的话,甲会立马获释。
所以前九次甲都会选择沉默,已获得对方的信任,最后一次会选择背叛。同理乙也会这么想。当双方都知道对方在最后一局选择背叛,那么会有人在第九局选择背叛,依次类推。第一局双方都会选择背叛。
1.3不知道次数的囚徒困境
经过多次博弈,背叛会受到惩罚,双方趋向于选择合作。
2.纳什均衡
在博弈中会存在一个均衡,任何一方都不愿改变策略,因为这种状况下改变策略会不利于自己。囚徒困境下的纳什均衡是:双方都背叛。
可以用排除法找到答案,如果两人都沉默的话,只要任何一方背叛,会立马获释。这种双方都沉默的局面并不稳定。如果一方沉默,另一方背叛的话。没有人傻到自己沉默,所以这种情况也是不稳定的。
3.总结
3.1局部最优解不是全局最优解。
3.2个人的理性选择,会造成全局的非理性。
3.3纳什均衡不是全局最优解。
3.4人类一般都会选择背叛对方。但是法规的出现,是人类从背叛走向合作的转折点。
自私与报复是人的本性