博弈论

约翰·冯·诺依曼

前言

  • 假设现在有人能够让博弈行为接近野蛮,或者让人类之间的友善行为和凶残行为之间的差距无限大,那么谁就更容易在博弈中取胜。
  • 博弈的基本构成要素分为决策人、对抗者、生物亲序、局中人、策略、得失、次序。
  • 它们会发挥出主动寻找规律和有序环境的本能。
  • 假设在一个博弈赛局中,局中人的策略是有限的,便称其为有限博弈,反之则称为无限博弈。
  • 合作博弈和非合作博弈。二者的最大差别在于参与博弈的人有没有达成一个相对具有约束力的协议。假设有协议可以参照,便是合作博弈;反之,则是非合作博弈。
  • 若以时间顺序为基准,博弈论可以分为两类:静态博弈和动态博弈。
  • 囚徒困境属于静态博弈,而棋牌类的博弈,或者那些行动、决策有先后的博弈则是动态博弈。

译者序

  • 策略博弈论,我们通常将它称为博弈论,有些时候也会用“竞赛论”或者“对策论”来表示。
  • 《博弈论》还直接推动了个人概率、统计决策、运筹学等诸多问题的研究进程。
  • 通俗意义上说,一个参与者的一个策略选择就是一套简单的行动法则,是提供给这个参与者所有可能情况下的行动指导。
  • 博弈论可以使人们在有限的条件和既定的要求下,从繁多的数量关系里寻找出最适宜、最高效的解决方案。
  • 在多人博弈中,比如当两个理性头脑为了一个目标产生冲突的时候,最终的答案总是会同时依赖于两者的决定,所以这时的形势与个人最大化问题的形势便不再相同。
  • 在这个博弈中,若A是先行者,他便可以用这样的策略获胜,即首先将一枚硬币放在桌子的正中央,接着每当对方放下一枚硬币,就在与之对称的位置上放上一枚硬币,这样一来,他便永远不会输,谁后放谁就会输。这是一个完美的信息博弈,只要知道谁先谁后就能知道谁赢谁输。
  • 在他看来,不让别人知道你的秘密的前提是,你自己也不知道

导读

  • 约翰·冯·诺依曼没有把经济生活看作一个已知系统,而是将其看作一种由多人参与的博弈。在这种博弈中,参与者需要遵循一定的规则,并试图让自身的利益最大化。
  • 在使用这套公理体系的过程中,人们不用时刻考虑数学表达式对应的现实事物,只需要在逻辑推理的终点将数学符号还原为现实事物。也就是说,这里的每一种数学符号都有其现实意义,但在逻辑推理过程中不需要考虑它们对应的现实意义,只需在得出结论之后再把结论反映为现实事物,这样就能实现这一逻辑推理的价值
  • 零和博弈的特点在于参与者只有两人,且一方获得的利益恰好等于另一方失去的利益,或者说一方胜利,另一方注定失败。
  • 在多人博弈中,参与者可能为了获利而相互结盟,形成人数相同的两个联盟,或者形成一个多人联盟和一个单人联盟。这样一来,多人博弈又变成了两人博弈。
  • 确定博弈解集的标准是:参与博弈的人没有理由认为任意一种博弈解集的归责系统要严格优于另外一种。
  • 这部著作必将成为准确定义和清晰表述经济学的重要工具。

博弈论的“前生今世”

  • 从这个意义上来看,博弈论又可以被称作对策论,同时它还有一个较为通俗的名字,即赛局理论。博弈是具有斗争性和竞争性的现象,而博弈论所研究的就是有关这类现象的理论和方法。
  • 此,我们不难理解博弈论所要研究的内容:事实上,博弈论就是站在研究者的角度,充分考虑博弈各方所有可能的行动方案,并运用数学方法找出最合理的行动方案的一种理论或方法。由于它的主要工具是数学,所以严格来说它是一种数学理论或数学方法。
  • 什么是纳什均衡呢?它指的是:博弈中的所有人都将面临的一种特殊情况,即当对手不改变自己的策略时,他当前的策略是最优选择,如果参与者改变他当前的策略,他的利益就会受损。只要博弈参与者都保持理性,那么他们在纳什均衡点上就不会有改变自身策略的冲动。
  • 子博弈完全均衡和颤抖之手完美均衡。
  • 博弈论在多个学科和领域获得了广泛的应用,特别是在生物学、经济学、计算机科学、数学、政治、军事等学科和领域的表现尤为出色。
  • 1973年,美国《自然》杂志上刊登了一篇论文,其中便提出了一个有关博弈论的生物学概念,即进化稳定策略。此外,我们还能在演化博弈理论、行为生态学等方面见到博弈论的身影。
  • 一般来说,博弈论引入经济学是由美国著名数学家约翰·冯·诺伊曼和经济学家奥斯卡·摩根斯坦在20世纪50年代率先完成的。
  • 博弈论的引入清晰地呈现出经济主体之间的辩证关系,使得经济学的分析有了新的思路。这不仅与现实市场竞争十分贴近,还为现代微观经济学和宏观经济学奠定了基础。
  • 博弈需要具备一定的要素,主要有五个方面:局中人、策略、得失、次序、均衡。

博弈的分类

  • 若根据局中人对彼此的了解程度来划分,博弈同样能分为两类:一类是完全信息博弈,在这类博弈中,每位参与者都能准确地知道所有其他参与者的信息,包括个人特征、收益函数、策略空间等;另一类是不完全信息博弈,在这类博弈中,每位参与者对所有其他参与者的信息不够了解,或者无法对其他每一位参与者的信息都有准确了解。
  • 博弈论是一门形式理论,它所研究的是理性局中人的相互作用。
  • 博弈论是这样一个过程:它是个人或团体在一定规则约束下,依据各自掌握的关于别人选择的行为或策略,决定自身选择的行为或策略的收益过程。
  • 对博弈论的探索不是一件容易的事情,即使最简单的二人博弈也大有玄妙:若在一场棋局中,棋手都是最理性的棋手,他们可以准确地记住对手和自己的每一步棋,那么一方在下棋时,为了能战胜对手,他就会仔细考虑另一方的想法;同样另一方在出子时也会如此考虑。同时,一方还可能考虑另一方在想他的想法,另一方也可能知道对手想到了他的想法,如此往复,问题会变得越来越复杂。
  • 1944年,现代系统博弈理论初步形成,其标志是冯·诺依曼与美国经济学家奥斯卡·摩根斯坦合著的《博弈论与经济行为》出版发行。
  • 简言之,其理性思想就是“抱最好的希望,做最坏的打算”。

博弈论的意义

  • 由这两种考虑,我们可以得出一个基本准则,即企业应该把战略建立在假设对手按照其最优策略行动的基础之上,或者假设自身处于利润最低的条件下,再制定应对策略。
  • 一个国家在国际贸易方面往往有两个选项:一是保持贸易自由;二是实行贸易保护。贸易的自由和壁垒之间也能形成一个纳什均衡,这个均衡的代价是高昂的,它会使贸易双方采取不合作策略,陷入永无休止的贸易战当中。贸易战一旦打响,必定会使双方的利益都受到损害,所以这是一个双输的策略。
  • 用博弈的方式去思考问题将会给我们带来不一样的思想体验。从某种程度上来说,博弈论意味着一种全新的思想或一种全新的理解分析的方法。

如何找到一个最优策略

  • 理性就意味着他在博弈中是从自己的利益出发的,或者说他是自私的。理性的人在博弈过程中会将自身利益最大化作为目标,博弈论的研究也是建立在理性人之间的博弈之上的。
  • 每场博弈中都会涉及三大要素:参与者、策略、得失。
  • 一是博弈者为什么要合作;二是博弈者在什么时候合作,什么时候不合作;三是博弈者如何使别人与他合作。
  • 若现在进行一场合作博弈,A、B分别代表博弈双方,两者都能自由进行无差别选择。现在,摆在两人面前的选择有两个:合作和不合作。我们用Y代表合作,用N代表不合作,并设定以下规则:若A和B都选择Y,两人都得3分;若A和B都选择N,两人都得1分;若一人选Y,另一人选N,选Y的人得0分,选N的人得5分。
  • 该博弈论通过得分矩阵可以清楚地描述个体理性与团体理性之间的矛盾。若个人在博弈中追求利益最大化,就会使群体利益受损,这就是这类博弈所体现的重要内涵
  • 他发现得分排名靠前的程序一般有三个特点:一是具备善良性,即从来不主动背叛别人;二是具备可激怒性,即对于别人的背叛不能一直许以善意的合作,还要具备一定的报复;三是宽容性,即别人背叛了你一次,你不能无休止地进行报复,而要在别人选择合作的时候与其合作。

博弈中合作的过程和规律

  • 罗伯特·阿克塞尔罗德在静态群体中研究博弈论,最终得到的最优策略是一报还一报策略
  • 第一,所有参与者在进化的过程中都会有试错行为。参与者在一个陌生环境中不知道该怎么做,他只能不断进行尝试,若某种尝试后的结果是好的,他就会照着这个尝试的方法继续做下去。第二,参与者之间会有遗传现象。如果一个人本身是爱合作的,那么他的后代就会拥有更多的合作基因。第三,每一个参与者都具备学习性。对参与者来说,对局过程也是一个相互学习的过程,比如一报还一报策略优秀,参与者就会学习这种策略。
  • 群体中的合作是逐渐扩大化的,或者说,群体是向着越来越合作进化的。
  • 合作性的提高第一是要建立在持久的关系上,爱情很美好,但恋人之间的合作也需要建立在婚姻契约上才能长久。第二是每一个想提高合作性的人都要提高识别别人行动的能力,如果你连对方是否合作都搞不清楚,你便没法对他的行为做出回报。第三是要说到做到,信誉第一,若别人在比赛的某一回合对你采取不合作策略,你承诺在下一轮比赛中也不与他合作,就一定要做到,让别人知道你是个不好惹的人,就不敢不与你合作。第四是避免一次性对局,能多次完成的对局要尽量分步完成。这样做的好处在于可以使对弈双方长久地维持关系,如此才有合作的可能,比如在贸易谈判的过程中尽量多步骤进行,这样可以一步步敦促别人与你合作。第五是对于别人的成功不要嫉妒,对于别人的失败不要落井下石。第六是不要主动背叛别人,避免成为罪魁祸首,成为众矢之的。第七是不仅要对合作予以回报,也要对背叛进行回报。第八是不要贪小便宜,不会有人与耍小聪明占别人便宜的人合作。
  • 总得分最高并不意味着在每一次博弈中都要拿到最高分。
  • 圣贤孔子曾提出人与人之间应该以德报德,以直报怨的观点,这是一种修正的一报还一报策略,其先进程度提前了几千年。“直”的意思是公正,“以直报怨”就是用公正来回报背叛,其所修正的是惩罚背叛者的程度。依据公正的原则,本来要罚背叛者10分,现在只需罚其5分。这样做可以结束世代循环报复的魔咒,让文明得以形成。
  • 阿克塞尔罗德坚持认为合作不需要信任,也不需要预期就是被诟病最多的地方。
  • 重复博弈的例子很少或很难实现,参与者在遭到背叛后往往没有机会给予反击,甚至毫无还手之力,比如核威慑、资本实力悬殊的违约行为等。这时就要引入法律手段,用法律的惩罚来取代一报还一报,实现依法治国,以法律促进合作

博弈论的应用

  • 市场类型主要有四大类:完全竞争市场、垄断竞争市场、完全垄断市场和寡头垄断市场。
  • 策略二:保证最低价格。
  • 第一是使自身成为理性的经济人,一切行动都要以利润最大化为出发点。
  • 如果没有博弈论的研究成功,人们对现代社会竞争和冲突这些现象的理解将处于一个非常浅薄的阶段。
  • 企业要想实现和谐的目标,就需要以服务社会为宗旨,以公平诚信为原则,以安全环保为基础,以协调有序为保障,以依法治企为根本,以科学发展为目标。
  • 所以达成协议的首要基础是规则的透明,它也是人们互相信任的首要条件。
  • 在博弈中,经济利益只是构建和谐的部分因素,却不是全部因素。人文因素也是构建社会和谐的基石。

第一章 策略博弈——了解对手,战而胜之

  • 博在古代指的是赌博,而弈则是下棋或者围棋
  • 博弈就是根据自己所掌握的情况,在自身所处的环境中做出最佳选择的一种谋略。

何为博弈——博弈的分类与基础构成

  • 在宣布博弈结束时,所有参与博弈的局中人所获得报酬的总和是否永远为零?若总和为零,那么就相当于支付只在局中人之间进行,并不产生其他事物的生产与消耗,即我们所接触到的一切具有娱乐性质的游戏。这种博弈称为零和博弈,反之则称非零和博弈。
  • 在零和二人的博弈中,应该注意的根本问题是:博弈中的每个局中人是怎么策划其活动的?在博弈的各个阶段,他们又有什么情报信息呢?若其中一个参与者了解到另一个参与者的策略,会对整个博弈产生什么样的影响呢?若了解了全部关于博弈论的理论知识,又能起到什么样的作用呢?
  • 那些能够描写博弈这个抽象概念的规则全体,是博弈从开始到结束,按照特定的方式进行,整个进行的过程称为一场博弈。
  • 着”(读作zhao)是博弈的构成元素,我们也应该知道其界定。“着”指的是,在赛局的所有可能选择中做出抉择的权利,此项权利可以交给赛局中的某一个人执行,或者采用随机的方式进行,而这些方式在博弈的具体细则中都有非常明确的规定。
  • 在赛局中,可以将“着”分为两种。假设在局中人中指定任意一人做出选择,那么将会依赖他的自由选择权,其中不掺杂任何其他的因素,这种选择被称为“着”中的“第一类的着”,亦或者“局中人的着”。假设在赛局中所做出的选择是建立在某种机械规则上的,那么便会依据一个确切的概率来决定它最终的结果,这种选择方式被称为“第二类的着”,抑或者“机会的着”。

博弈的解——混合策略

  • 相信不少人都玩过井字棋游戏,假设在游戏中自己先行,只要自己的方法是正确的,那么对手将无法击败自己。
  • 最简单、常用的策略是先行的一方将硬币放在圆桌的正中心,由此一来,不论对手将硬币放在何种位置,先行的一方都能够将硬币放在恰好对称的位置,这能够保证先行的一方永远不会输,而且输掉博弈的人只能是对手。
  • 通过这类博弈,我们能够清楚地认识到,如果你不想让对手知道自己的“秘密”,那么自己也不要知道。或许你可以采用投掷硬币的方式,并且用正反面决定自己所要采取的行动,在这种随机的决定下,即使你的对手十分理性,同时知道了你的政策,最后他能获胜的几率也仅仅是一半罢了。

掌握“情报”——博弈的制胜法典

  • 掌握“情报”——博弈的制胜法典
  • 假设我们将探究目标放在一个特定的“着”上面,若这个特定的“着”是一个“机会的着”,便说明了局中人的选择取决于机会,此时任何人的意志、关于其他事情的知识和见解都不会对其造成干扰。
  • 即当博弈赛局中的人进行选择时,他究竟掌握了多少有关的、具体的情报,是博弈中的一个重要特性。
  • 而这种前备性包含着先现性,但是反过来说,先现性并不蕴含前备性
  • 在双陆博弈中,掷骰子便是“机会的着”
  • 还有不少博弈中的先现性不具有前备性,这表示在“人的着”中,参与赛局的局中人并不清楚前面做出了怎样的决策。
  • 所谓先现性,指的是赛局中所有“着”的先后顺序,而且它具有传递性质。

不可传递性

  • 那么建立联盟一起对付另外的局中人是完全合理的
  • 所以说,甲在打出他手中的第一张牌时,他清楚地知道自己的一手牌;此时丙在跟牌中打出他手中的牌时,能够清晰地知道甲打出的第一张牌,但是丙并不知道甲手中的一手牌是什么。
  • 博弈中的前备性并不具有传递性,虽然它在博弈中提供了一些“信号”
  • 即对局中人是有利的,能够加快“信号”传递,并且这种信号是在“内部组织机构”中发布的,它是依靠桥牌中常用的信号打法实现的。
  • 这些都属于博弈的策略范畴,但是并不属于博弈的规则。由
  • 所谓“偷鸡”指的是一种虚张声势的做法。
  • 直接信号”和“反面信号”,后者指的是一种误导博弈中对手的信号
  • “直接信号”指的是问题只包括一个局中人时,而且必须在前备性不可传递的前提下进行
  • 在博弈赛局中,应该发出多于或者少于“简单的”博弈方式中所包括的信号,而且所有的目的都应该“脱离”这种“简单”的博弈方式。但是,若想达到这种状态则需要付出一定的代价才能实现。
  • 所有具备不可传递的前备性的例子都涵盖了“机会的着”的博弈

第二章 零和二人博弈——必然有输有赢

  • 其实人生就是一场永无止境的博弈,我们需要学会在博弈中生存,与他人友好相处,以及学会适应和使用世界上的其他法则,在这个过程中更好地为自己做出选择。

一人博弈:一场“斗智”之战

  • 具备先现性与前备性等价的情况的要求是:唯一的局中人有两个“人的着”,即A和B,在进行每个“着”时,局中人并不知道另一个“着”的选择结果,在情报不完整的情况下这种情况是难以实现的。
  • 那么所有的社会成员的利益关系是一致的。需要注意的是,在这种情况下,我们不能将每位成员都看作博弈的局中人,主要原因是在成员之间不存在利害关系

“偷鸡”:“虚张声势”促成功

  • “不看牌”指的是,局中人愿意接受他在前一局中最后一次的“叫价”,而且他所接受的这个金额要比现在的数额低,而且两个参与者都没有其他的异议,此时,两个局中人便不会在意各自手上握有怎样的牌,因为他们手上的牌无须全部摊开。
  • 若是手上的牌是弱牌的一方,他便可以选择加价或者叫高价,进而引起对手不看牌,以此达到一种自己手上握有强牌的假象,利用这种方式极有可能用手上的弱牌赢过对方手上的强牌。
  • 一种是其中的一个局中人手上握有弱牌,但是想要给对手营造出一种手上握有强牌的假象,进而混淆对方的决策。另一种是其中的一个局中人手上的确握有强牌,却要制造出一种自己手上其实是弱牌的假象。这两种动机都是为了向自己的对手传递出反面的信号,给对手的决策造成干扰,进而增大自己在博弈中获胜的可能性。
  • 这就告诉我们,若想成功地“偷鸡”,其实并不需要在博弈中遇到一个实力相当的对手,而是在于对手是否会在博弈赛局中偏离完美的策略,同时,“偷鸡”对这种情况是有所防备的。

第三章 零和三人博弈——“三分天下”还是合作“双赢”

  • 不论何种博弈赛局,都应该先看自己的承受能力和能承担的风险,才能在博弈中更有胜算,获得更多的收益。

你的“策略”决定了“对战”结果

  • 像零和一人博弈中,会出现一个最大值的问题,而零和二人博弈中,则是十分鲜明的最终受益的对立问题,而且这里并不能再用最大值的问题进行解决。
  • 或者说,他有足够的余地选择与另外两个人中的任何一个人,建立某种利害关系,包括将这种关系建立到怎样的程度
  • 当零和三人博弈中的一个局中人确定了自己想要与剩下的两个人之一建立共同的利害关系时,这种博弈便成了为自己选择同盟者的问题。
  • 实际上,在零和二人博弈中,起到关键性选择的是,哪个局中人能够猜透与自己相对的局中人的选择
  • 由此看来,我们已经十分清楚零和三人博弈与零和二人博弈本质上的区别,即博弈的局中人是选择与其他的局中人达成合作还是打算单独行动。
  • 合伙可能性的出现是博弈中最有意义的策略。

“配铜钱”升级

  • 假设在博弈赛局中,对手能够很有经验地统计出对局中的第一个局中人的特点,便有可能对局中人的策略和行为做出合理的预测,因此他有机会掌握不同策略的概率。
  • 由此一来,我们能够清晰地看出,在此类型的博弈中,赛局中的任意一个局中人需要尽量保证自己的决策不被对手猜到,为了保证自己的意图不被对手发现,要在策略的选择上尽量保证随机选择不同的策略,因为能够确定的只有若干策略的概率,而且这是一种十分有效的博弈方式。
  • 实际上自己不清楚所要做出的决策选择也是一种对自身安全的保障,因为它在某种程度上避免了消息的泄露。

“合伙人”:共同利益驱使下的抉择

  • 即使博弈规则是具有对称性的,即绝对的、正式的,也无法高效地保证所有的参与者在应用这些博弈规则时是公正的、对称的。
  • 没有形成合伙这种现象是让人觉得不可思议的

对称的对立面——不对称分配

  • 在博弈赛局中,一个局中人能够从对局中获得收益,一方面取决于博弈规则对合伙的规定,另一方面依赖于这个局中人与他的合伙人所建立的合伙的可能性。

“追根溯源”:本质与非本质博弈

  • 这种情形下的博弈我们可以不考虑局中人之间建立合伙的可能性,那么这就是非本质的博弈。反之,若是存在合伙动机的博弈,即合伙在博弈中是必不可少的,那么它就是本质博弈。

不同的声音:完全情报的“反对意见”

  • 当我们建立了一套自认为普遍有效的理论时,必须能够拥有承担所有的反对意见的能力。

寻找“可解”的n人博弈

  • 在自然科学中有一个众所周知的经验,那就是先对一些特殊场景(在技术上是可以解决的,并且能阐释基本的原则)进行透彻的了解,从而在此基础上逐渐发展为可以归纳一切的、一劳永逸的理论的先导。

附录一 博弈论定律

  • 零和博弈理论认为,世界是一个封闭的空间,里面的所有机遇、财富、资源等都是有限的,当世界中的某个地区或者国家的财富或者资源增加时,也就意味着别的地区或者国家的财富或者资源在减少,这便像一种无形的掠夺。

重复博弈

  • 在重复博弈的赛局中,每个局中人的行动和策略,都会不同程度地受到前面的参与者的决策的影响,甚至可以说每个局中人的选择都会依赖其他参与者的行为。
  • 事实上,当所有的博弈仅仅进行一次时,人们往往更加关心它的最终结果;假设博弈会重复进行多次,那么人们的注意力将会变成最终的收益,甚至会舍弃眼前的利益,只为获得更加长远的利益,进而根据情况做出不同的策略选择。由此一来,重复博弈的结果便会取决于博弈所进行的总次数,而这个总次数又会影响到最终博弈均衡的结果。
  • 可以将重复博弈总结成三个基础特征:第一,在进行重复博弈的过程中并没有“物质”上的关联,简言之就是上一个阶段所进行的博弈,并不会改变接下来所要进行的博弈结构。第二,在进行重复博弈的每个阶段,所有的参与者都能够看到前面的参与者所做出的决策。第三,对于参与重复博弈的参与者而言,他们所获得的收益是在每个阶段所获得收益的加权平均数。
  • 当参与博弈的人自身的所有信息都不被他人所了解时,那么他能够在整个重复博弈的过程中建立良好的声誉,借此他极有可能获得长远的利益。

囚徒困境

  • 囚徒困境是博弈论和非零和博弈中最经典的一个例子,它表示在某种情况下,那些有利于个人利益的选择,相对于团体而言并非有益处。
  • 最终的结果往往更加偏向于最后一种,即由于无法交流、互不信任,最后互相揭发。这种情况,恰好印证了约翰·纳什的非合作博弈理论。
  • 最终经过反复博弈后,所有的参与者极有可能从最初的互相猜忌转变为相互信任。
  • 但是当对方的合作意图并不是非常明显,或者无法确认时,出卖自己的同伙便能够让自己减刑或者立即释放,而且同伙可能也会为了自身的利益而招供出自己,在这种情况下,出卖自己的同伙是能够让自身的利益最大化的。
  • 比如揭发对方之后,很有可能会遭到不同形式的报复,而且他们无法将那些执法者所设定的利益作为自己是否揭发对方的考量标准。

智猪博弈

  • 智猪博弈告诉人们,当在博弈赛局中处于弱势的一方时,应该学会选择这种等待的占优策略。

斗鸡博弈

  • 斗鸡博弈(Chicken Game)这个名词其实是一种翻译失误的产物,在美国口语中Chicken的释义代表了“懦夫”,因此,它应该是“懦夫博弈”
  • 最好的结果便是双方都选择退让,既不会两败俱伤,又不会让其中的某一方丢了颜面。
  • 假设双方都选择主动行动,便相当于通知对方自身已经处在给对方最后的通牒,甚至可以说是相互威胁的状态
  • 任何一个博弈,若只有一个纳什均衡点,那么我们便能够轻易地预测出此博弈的结果,因为这个纳什均衡点就是已知的博弈的结果。反之,当一个博弈有多个纳什均衡点时,想要对博弈的结果做出预测,便需要我们了解其中的所有细节信息,诸如参与者究竟是哪一方选择了进,哪一方选择了退。根据这些额外的信息,我们才能对博弈结果做出判断。

猎鹿博弈

  • 猎鹿博弈,最早出现在法国启蒙思想家卢梭的《论人类不平等的起源和基础》一书中,它又称为安全博弈、协调博弈,或者猎鹿模型。
  • 若想在博弈中建立合作,便需要参与博弈的双方主动学会与对手建立良好的共赢关系,在保证自身利益的同时,也要考虑对方的利益。

蜈蚣博弈

  • 可以得出若是在进行博弈的第一步时A便选择了不合作,那么A和B所获得的最终收益都是1,这样的选择远远小于A选择合作时的收益

酒吧博弈

  • 酒吧博弈是在博弈论的基础上发展起来的一个博弈理论模型
  • 后来,人们在他的这种研究之上发现了“神奇的60%客满率”定理,即当人们选择去酒吧时,最初的观察结果并未找到任何规律,但是通过长时间的观察发现,每次去酒吧的人数和不去酒吧的人数之比接近60:40。

枪手博弈

  • 只要丙谁都不打中,在接下来的对决中他就处于相对而言最有利的位置。

警察与小偷博弈

  • 在此前提下,即警察和小偷都是选择最佳占优策略时,我们将会获得一个十分有趣的结果,即警察和小偷成功的概率是相等的。(此处略去计算过程)
  • 在这种游戏中,并不存在纳什均衡,因为参与此游戏的每个人出“剪刀”“石头”“布”的情况都是随机的,而且游戏的参与者不会让对方推断出自己的策略,甚至自己在此游戏中的策略倾向性。因为,当对方了解到自己的策略倾向时,自己便会面临极大的输掉游戏的风险。
  • 实际上,当我们需要采取混合策略时,便要找到自己所要做出的策略方法,并且要让对手觉得你所做出的策略不会影响到他们。
  • 博弈取胜的要点在于运用其中的偶然性,针对对方是否发现你的某些策略性行为做出及时应对,进而保证自己成功的概率。

海盗分金

  • 海盗分金 有五个海盗(记为1、2、3、4、5号)掠得一百枚金币,决定以抽签的方式依次提出分金方案,并由五人共同表决。要想通过方案,必须有超半数的人同意才可以,否则这个人将会被扔进大海。这其实是一个博弈的过程,在分金的过程中,要想不被扔入大海,必须充分考虑其他人的利益,从而以最小的代价获取最大的收益。假设五个海盗都聪明绝顶并有足够理智的判断力,那么该如何进行博弈过程呢?

附录二 约翰·冯·诺依曼小传

  • 约翰·冯·诺依曼有很多头衔,首先他是一位杰出的数学家,其次他是颇有建树的计算机科学家,同时他也是出色的物理学家、化学家。
  • 在他8岁的时候,它就能用微积分来解决数学问题。
  • 遇到问题定期与专业人士交流,这又能帮他打破自我思考的壁障,获得全新的思路和智慧。

从学生到专家的转变

  • 作为美国含金量最高的研究院,普林斯顿高级研究院当时对外聘用的教授只有6名,大名鼎鼎的爱因斯坦就是其中之一,而冯·诺依曼是这六位教授中最年轻的一位,当时他只有30岁。

速算背后的秘密

  • 两个自行车手在相聚32千米的两地,各骑一辆自行车相向而行,他们同时出发,其中有一个骑手的车把上停着一只苍蝇,这只苍蝇在两人出发时开始向另一位骑手径直飞去。苍蝇会在飞到另一位骑手的自行车把手上后立刻返回,继续飞向第一位骑手的自行车把手,这样苍蝇不断往返于两辆自行车之间,直到两车相遇为止。假如两位骑手的骑速为16千米每小时;苍蝇飞行的速度是24千米每小时,那么在两车相遇时,苍蝇共飞行了多少千米?”
  • 冯·诺依曼是“计算机之父”,他参与研制了世界上第一台电子多用途计算机。

伟大的贡献和天才的陨落

  • 博弈论被广泛应用于社会现象的研究中,它的基本思想主要用于研究多个主体之间的利益关系,侧重于竞争者之间的议价、交涉、合作、利益分配等问题。
  • 最大最小定理是指当两个人进行博弈时,任何一方若能在考虑每种可能策略所带来的最大损失的基础上,选择其中最小的一种,那么这种策略便是“最优策略”。
  • 经济学的研究大致可分为两类:一类是用于定性研究的纯粹理论;另一类是用于实证和统计的计量经济学。
  • 冯·诺依曼用他的博弈理论让经济学问题变得具有预期性,从概率学上,保证了所能采用的最优策略满足维护当局者利益最大化的要求。