囚徒困境 | 因自作聪明而作茧自缚

🌵什么是囚徒困境(prisoner's dilemma)?
☄️两个嫌疑犯作案后被警察抓住,警察知道两人有罪,但缺乏足够的证据。所以将他们分别关在不同的屋子里接受审讯。
☄️警察告诉每个人:如果两人都抵赖,各判刑1年;如果两人都坦白,各判8年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判10年。
☄️于是两个嫌犯都面临两种选择:坦白或抵赖。显然两人都抵赖各判1年的这个结果是最好的。但结果却是两个嫌犯都选择了坦白。
☄️因为在这种情况下,每个嫌犯的最优选择都是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判十年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。
.
🌵为何我们会陷入这种困境?
💐囚徒困境是基于人性里最自私的一面,而这种困境难以破解,所以找到破解囚徒困境的方法其实只有一个,那就是学着信任别人。
💐但人性的本能是,除却至亲之外人们是很难完全相信他人的,更不要说陌生人了。所以 “信任”这个方案根本就行不通。
.
🌵《墨菲定律》一书中提出了一个破解之道——反复博弈
🍦不固定次数的重复博弈,可以化被动为主动。反复博弈是相对于单次博弈来讲的,也就是说要“囚徒”双方在一次博弈之后,还要继续发生别的关系,进行再一次的博弈。
🍦就囚徒困境里的那两个囚徒来说,如果只是单次选择,他们当然会孤注一掷地选择“坦白”。但是如果他们身后都有更大的势力背景,加上担心会被对方势力报复,他们就不得不考虑将来的关系发展,不敢再自私的出卖对方,而会倾向于选择“抵赖”,那么他们就都只需要坐1年牢就够了,而这就有了最佳选择。
.
🌵贝叶斯均衡(Bayesian Nash equilibrium)
🍦在不完全信息的静态博弈中,每个人同时行动,所以我们没有机会观察和判断别人的选择。这时我们可以主动提供给其他参与人固定的战略选择,使其他人的最优战略依赖于自己的选择。
🍦这时每个局中人都会选择这个使自己期望值达到最大化的策略,而不会有人倾向于选择其他策略。
🍦那么此时我们的想法和选择就都不会单方面作出改变,因为如果:
- 选择改变,意味着如果想法不变,改变选择的人收益会减少。
- 想法变了,而选择没有变,改变选择的人的收益同样会减少。
.
✨囚徒困境的例子其实在日常生活中比比皆是,破解此局的重点是我们不要过于局限于当前,而应该将单次博弈扩展,如此才能得到彼此的绝对信任,达成最好的结果。✨