论囚徒困境和纳什均衡

这两个概念都是博弈论中的概念，那什么是博弈论呢，博弈论是研究竞争现象的一种理论方法。既然是理论方法就会有许多假设的前提，但在现实情况下，这些前提很可能不会同时存在。所以所有理论方法，只是有助于你分析并理解现实世界，它只是一种方法，或者是一种思维工具而已，切不可生搬硬套。博弈论在经济学、生物学、物理学、社会学、政治学中都有应用，所以博弈论是一种十分有用的分析框架。

先介绍一下囚徒困境，然后在囚徒困境中找到纳什均衡的局面，最后进行一下总结。

1.囚徒困境

1.1两个犯罪嫌疑人都被抓了起来，并且这两个人都是理性、自利的，并且不能相互交流。都被告知如下规则。

	乙沉默（合作）	乙认罪（背叛）
甲沉默（合作）	二人同服刑半年	甲服刑10年；乙即时获释
甲认罪（背叛）	甲即时获释；乙服刑10年	二人同服刑5年

在这种情况下，两个人会做什么选择？答案是两个人都会选择背叛对方。分析如下：

甲想：

如果乙沉默，我背叛的话，就会立即获释。

如果乙背叛，我沉默的话，就会判刑十年。

所以甲会选择背叛。同理乙也会选择背叛。最终两人都会服刑5年。

其实有一个最优解就是：甲乙都选择沉默。这就是“困境”所在：个人的最优解，并不是全局的最优解。

1.2知道次数的囚徒困境。比如限制十次

经过上次的教训，甲知道了沉默是全局的最优解，但是最后一次，甲背叛，乙沉默的话，甲会立马获释。

所以前九次甲都会选择沉默，已获得对方的信任，最后一次会选择背叛。同理乙也会这么想。当双方都知道对方在最后一局选择背叛，那么会有人在第九局选择背叛，依次类推。第一局双方都会选择背叛。

1.3不知道次数的囚徒困境

经过多次博弈，背叛会受到惩罚，双方趋向于选择合作。

2.纳什均衡

在博弈中会存在一个均衡，任何一方都不愿改变策略，因为这种状况下改变策略会不利于自己。囚徒困境下的纳什均衡是：双方都背叛。

可以用排除法找到答案，如果两人都沉默的话，只要任何一方背叛，会立马获释。这种双方都沉默的局面并不稳定。如果一方沉默，另一方背叛的话。没有人傻到自己沉默，所以这种情况也是不稳定的。

3.总结

3.1局部最优解不是全局最优解。

3.2个人的理性选择，会造成全局的非理性。

3.3纳什均衡不是全局最优解。

3.4人类一般都会选择背叛对方。但是法规的出现，是人类从背叛走向合作的转折点。

自私与报复是人的本性

zsdnishishui的博客

唯有创造才是“真”

归档

分类

关于我

搜索

RSS

论囚徒困境和纳什均衡

目录