设想你正与被关在另一个屋子里的“嫌疑人”进行囚徒困境的博弈。而且,再设想这种博弈不是进行一次而是多次。你博弈最后的得分是你被监禁的总年数。你希望使这种得分尽可能地少。你应该用什么策略?你应该从坦白还是保持沉默开始?另一个参与者的行动会如何影响你以后的坦白决策?
多次的囚徒困境是极为复杂的博弈。为了鼓励合作,参与者应该相互惩罚不合作行为。但以前描述的Jack和Jill的水卡特尔的策略——只要一方违约,另一方就永远违约——是非常不宽容的。在反复许多次的博弈中,在一段不合作时期之后,允许参与者回到合作性结果的策略,可能更好一些。
为了说明哪一种策略更好,政治学家Robert Axelrod主持了一场比赛。人们通过输入为反复进行囚徒困境博弈而设计的电脑程序进入比赛。然后每个程序都与其他所有程序进行博弈比赛,得到待在狱中总年数最少的程序的是“赢家”。
赢家最后被称为一报还一报的简单策略。根据一报还一报的策略,参与者应该从合作开始,然后上一次另一个参与者怎么做自己也怎么做。因此,一报还一报参与者要一直合作到另一方违约为止,然后再违约到另一方重新合作时为止。换句话说,这种策略从友好开始,惩罚不友好的参与者,而且,如果对方做出保证,就给予原谅。令Axelrod惊讶的是,这种简单的策略比人们输入的所有更复杂的策略都好。
一报还一报策略有悠久的历史。它实质上是《圣经》上“以眼还眼,以牙还牙”的策略。囚徒困境的比赛表明,这可能是进行生活中某些博弈的一个好的经验法则。
当然,人们有时能合作也会有原因。囚徒困境表明合作是困难的。但合作真的不可能吗?当被警察审问的时候,并不是所有囚徒都决定出卖他们的犯罪同伙。有时尽管卡特尔的个别成员有违规的激励,但卡特尔也能维持勾结性的协议。最经常的情况是,参与者可以解决囚徒困境是因为,他们的博弈不是一次性的,而是多次性的。