《自私的基因》读书笔记: 第十二章:竞争与合作:“囚徒困境”

吴小庆

<p class="ql-block" style="text-align: justify;">阿克塞尔罗德</p> <p class="ql-block"> 合作是对竞争而言的,竞争是合作的最终目的,合作是竞争的最佳手段。</p><p class="ql-block"> 团结就是力量,合作的双方及多方为了共同的利益,暂时或永久地采取合作的手段,以获取最大的利益。合作是个体之间的联合,每个个体都有自己的利益,人不是天使,每个个体在相互合作谋求最大利益的同时,首先关心的是自己的利益,在打自己的小九九,都想以最小的代价获得最大的利益。</p><p class="ql-block"> 三国时候吴蜀联合以抗魏,取得了赤壁之战的胜利,以后蜀国又借势向西发展,拿下了西川,一举奠定了三国鼎立的格局。但后来吴蜀在荆州问题上处理不当,造成吴蜀反目,吴蜀联盟宣告破灭,双反各有削弱,后被魏各个击破。荆州之争中吴国看似占了便宜,但在战略上讲却是失败的,以局部利益影响了整体利益的获得。</p><p class="ql-block" style="text-align: justify;"> 如何才能以最小的代价获得最大的利益呢?多大利益分配才能保证合作各方不分裂呢?这是一个使人困惑的难题,要解开这个难题,首先需从人的本性讲起。</p> <p class="ql-block"> 一个人出生时,没有是非观点,只有本能。而本能是绝对自私的(因为能存活下来的基因,都是绝对自私的基因,是基因决定本能),从利他利己的角度来看,是恶的。</p><p class="ql-block"> 而善,则是后天教育的结果,因为人是群居动物,要想自己生活的好,必须考虑到同伴及群体的利益,为群体服务,对人好,才能对己好,这就是善的起源与目的。</p><p class="ql-block"> 正如《韩非子·备内》说:“医善吮人之伤,含人之血,非骨肉之亲也,利所加也。故舆人成舆,则欲人之富贵;匠人成棺,则欲人之夭死也。非舆人仁而匠人贼也,人不贵则舆不售,人不死则棺不买。情非憎人也,利在人之死也。” 中国古代文学家司马迁也说道:“天下熙熙,皆为利来;天下壤壤,皆为利往。” 又着重说明 “仓廪实而知礼节,衣食足而知荣辱。” 礼生於有而废於无。可见:善良及利他主义是后天教育的结果,而自私利己则是与生具有的,是千万年来从我们的祖先基因中遗传下来的。我们可以坦率地承认:我们生来自私。</p><p class="ql-block" style="text-align: justify;"> 既然是自私的,那就无利不起早,利益的分配决定合作的程度。</p> <p class="ql-block" style="text-align: justify;"> 在讨论这个问题前,我们先复习一下博弈论。博弈论又被称为对策论(Game Theory),是现代数学的一个新分支,属于运筹学的一个重要学科。主要研究竞争性质现象中的数学理论和方法。研究游戏中个体的实际行为,及它们的优化策略。 这里使用最多的便是零和博弈与非零和博弈。</p> <p class="ql-block" style="text-align: justify;">(图1:最简单的博弈)</p> <p class="ql-block"> 零和博弈:属非合作博弈,指参与博弈的各方,在严格竞争规则下,一方的利益获得必然意味着另一方利益的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。如两人对弈,比赛场中的淘汰赛,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输方为-1分,两者相加永远是0,称为零和博弈,社会财富无半点增加。 </p><p class="ql-block" style="text-align: justify;"> 非零和博弈:非零和博弈(non-zero-sum game)是一种合作性的博弈,博弈中各方的收益或损失的总和不是零值。在非零和博弈中,对局各方不再是完全对立的,一个局中人的所得并不一定意味着其他局中人要遭受同样数量的损失。也就是说,博弈参与者之间不存在“你之得即我之失”这样一种简单的关系。其中隐含的一个意思是,参与者之间可能存在某种共同的利益,蕴涵着“双赢”或者“多赢”这一理念,但同时也隐含着“双输”或“多输”的结果。</p> <p class="ql-block"> 另外还有负和游戏:是指,没有赢家,河蚌相争、渔翁得利;或博弈虽有一方获胜但付出了惨重的代价,得不偿失,杀敌一千、自损八百,实为双输局面。如现在的俄乌战争就是这个局面。</p><p class="ql-block"> “正和游戏”是指,赢家所得比输家所失要多,或者没有输家,结果为“双赢”或“多赢”。如近年来的房地产,不管是买房的,还是卖房的,都得到了获利,为正和游戏。</p><p class="ql-block" style="text-align: justify;"> 但这种关系非一成不变的,取决你站的角度不同而改变:如拆掉一座房子,又在原地重建一座相同的房子,从GDP的角度上,得到了增长,是正和博弈;在社会财富增长角度上讲,社会财富并没有得到增长,这就是零和博弈;但如果你站在社会财富浪费的角度上,折腾了多天,浪费了这么多人力物力,而财富并没有增加,这就是负和博弈。</p> <p class="ql-block"> 现代合作中存在着一个根本问题,两个工业化国家之间相互设置的贸易壁垒就是一个很好的例子。由于自由贸易能给双方都带来好处,因此,如果贸易双方都能消除这些壁垒能给双方带来好处。问题是,无论哪一方单方面采取行动主动消除自己一方的贸易壁垒,他就会发现自己处于不利于本国经济的贸易状态下。事实上,不论一个国家如何做,另一个国家保持他的贸易壁垒总是比较有利的。</p><p class="ql-block"> 如近来英国的脱欧,就是要保留对欧盟的贸易壁垒,实际上每一个国家都有动机来保持自己的贸易壁垒,尽管带来的结果比双方合作要差得多。但在局部或近阶段会有利,个体对自身利益的追求将损害整体利益时,这个更本的问题就体现出来了。</p><p class="ql-block" style="text-align: justify;"> 为了解决这个问题,1950年美国兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔始创出相关困境的理论,后来由顾问艾伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”理论。</p> <p class="ql-block" style="text-align: justify;">(图2:囚徒困境)</p> <p class="ql-block" style="text-align: justify;"> 理论的设计前提是这样的:两个共谋犯罪的人被关入监狱,不能互相沟通情况下。</p><p class="ql-block" style="text-align: justify;"> 如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。</p><p class="ql-block" style="text-align: justify;"> 由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。所谓困境,是指如果双方都背叛,其结果比双方都合作要差得多,这个简单的游戏,就是本文分析的基础。</p> <p class="ql-block"> R:对双方合作的奖励; T:对背叛的诱惑</p><p class="ql-block"><br></p><p class="ql-block" style="text-align: justify;"> S:给笨蛋的报酬; P:对双方背叛的惩罚</p> <p class="ql-block"> </p><p class="ql-block"> <span style="text-align: justify;"> </span></p> <p class="ql-block"> 表格中,在上方A区里的总分值是最高的6分,此时甲乙两方均选择了合作模式;而在B区与C区中总分值为5分,此时甲乙两方一方选择合作,而另一方选择背叛;在D区中总分值是最低的,此时甲乙双方均选择背叛。</p><p class="ql-block"> 细看,就会发现,在A区中尽管有6分,但为甲乙两方所分享,各得3分;但在B和C区背叛者却可以一人独得5分,远高于A区的3分,诱惑非常大;</p><p class="ql-block" style="text-align: justify;">在总是希望获得最大权益的游戏者内心,总是希望着背叛,以获得最大的权益。但最大的权益意味着面临最大的风险,一旦如果对方也跟你一样选择背叛,那结果就是两败俱伤,大家都只能得一分,远低于双方合作的分值。 </p> <p class="ql-block" style="text-align: justify;"> 再分析就会发现,如果甲乙双方仅仅合作一次,那肯定都会选择背叛,不背叛的那一方就是笨蛋,什么都没有得到,这就解释了为什么旅游景点、车站、码头的物品往往是价高质差,因为卖方并不打算再跟你做第二次生意。</p><p class="ql-block" style="text-align: justify;"> 如果要合作许多次,那就难说了,合作为共赢,背叛为共输,双方就会选择合作,但又准备着在最后一次合作时选择背叛。所以有时买方总会与卖方说,下次我们还会再来(吃饭、购物),意味着再次合作。这其中最糟糕的情况出现在本来是一个长期合作,双方共赢的局面,但因为一方贪小利,选择背叛,导致合作失败,双方共输。如以往卖浸水的辣椒、以次充好的苹果给外商,一开始是多赚了不少钱,但后来人家再也不来了,合作无法进行,结果亏了不少钱。</p><p class="ql-block" style="text-align: justify;"> 在社会博弈论中,没有永恒的朋友,只有永恒的利益。不分对错,舍弃成见,为了共同的利益,有时敌我双方也可以放弃前嫌,达成短期的合作。如北伐及抗日战争中的G共合作。</p> <p class="ql-block" style="text-align: justify;">(图3:狮子与鬣狗合作,捕食角马)</p> <p class="ql-block" style="text-align: justify;"> 经济学、社会学最核心的问题之一就是:在市场中,每个人都有自私自利动机的情况下,怎样才能从合作中获得最大利益?</p><p class="ql-block" style="text-align: justify;"> 在市场上承诺和合同都只是一种策略,只要报酬够高而惩罚力度相对不大,博弈论就应该选择背叛。只要缺乏监督或者相应惩罚,官僚可以背叛组织纪律、贪官屡抓不尽、基金经理可以背叛投资者、地沟油可以冠冕堂皇地登堂入室、各种假货、伪劣品种可以充斥市场,因为博弈论指出选择背叛是他们的最优策略。</p> <p class="ql-block"> 假如双方是完全平等的(在交易中是这样),又要进行长期的合作,那我们该选择什么样的策略来使自己的利益最大化呢?</p><p class="ql-block"> 首先继续打交道的机会是合作的前题,一次性的博弈,就是当知道以后“再也不见”的时候,人们一有机会就会采取“宰你没商量”,合作看起来是“傻瓜”的选择。专业语词表达,就是“只要个体再也不相遇,背叛策略就是唯一稳定的策略”,或者“未来相对于现在不是足够重要时,没有任何形式的合作是稳定的。”</p><p class="ql-block" style="text-align: justify;"> “囚徒困境”是如此的困惑,以至于一个人选择的最好的策略居然是取决于另一对策者会怎么做,而不取决于自己。(未完待续:)</p>