模型思维

斯科特·佩奇

作者简介

在离散状态马尔科夫（数学模型）过程中，如果把人生看成努力和不努力两个状态，只要状态转移矩阵确定了，长期来看，在每个状态下所停留的时间比例也就都确定了。如果人生的动力源泉是固定的，努力的百分比就是固定的，那么短期内努力或者不努力并不会有什么影响。也就是说，问题的根本不在于你的状态，而在于源动力！所以，在瓶颈期遇到困难实在不想努力的话，多去找一找自己的源动力，想想当初为什么出发。

序言这本书是怎样写成的

对我来说，成功意味着我在这个世界上的有效性：我能够把我的思想和价值观带给这个世界，我能够以积极的方式改变它。
我可以向学生展示各种相关的工具和思想，提高他们推理、解释、设计、沟通、行动、预测和探索的能力。
任何值得做的事情都必定会招致质疑。
美国著名现代诗人华莱士·史蒂文斯（Wallace Stevens）曾经这样写道：“也许，真理取决于在湖边散步的时间。”
有些深洞永远无法填满，它们会提醒我们珍惜生命所提供的宝贵机会。
并以积极的方式去改变世界，那么我将这些资料组织成书的努力就得到了最大的回报

01 做一个多模型思考者

本书的核心思想是：多模型思维能够通过一系列不同的逻辑框架“生成”智慧。
本书所讨论的模型可以分为三类：对世界进行简化的模型、用数学概率来类比的模型以及人工构造的探索性模型。
我们也许可以通过数据了解到已经发生了什么和正在发生什么，但是，由于现代世界是高度复杂的，我们可能很难能理解为什么会发生这种情况
所有模型都有三个共同特征。第一，它们都要简化，剥离不必要的细节，抽象掉若干现实世界中的因素，或者需要从头重新创造。第二，它们都是形式化的，要给出精确的定义。模型通常要使用数学公式，而不是文字。模型可以将信念表示为世界状态的概率分布，可以将偏好表示为各备选项之间的排序。
构建模型是一门艺术，只能通过不断实践才能熟练掌握，这不是一项以观赏为目的的活动，需要刻意地练习。

02 模型的7大用途

模型本身可能就是为探索思想和总结观点而构建的虚拟世界。
构建模型的第一种方法是具身法（embodiment approach）。用这种方法构建的模型包括重要部分，同时对于不必要的维度和属性，要么剥离，要么将它们整合在一起考虑。
弗朗西斯·培根曾经这样写道：“人生的伟大目标，不在于知，而在于行。”
预测毕竟是与解释不同的。有的模型可以用来预测，但是却不一定能解释什么。深度学习算法可以预测产品的销售情况、明天的天气变化、价格演变趋势和身体健康状况，但是它们几乎没有提供什么解释。
将一个模型用于多种用途，正是本书中将会反复出现的一个主题。

03 多模型思维

选择取决于用途：在预测时，我们经常需要大模型；而在解释时，小模型则更好一些。
孔多塞陪审团定理告诉我们，通过构建多个模型并使用多数规则，将比只使用其中一个模型更加准确。这个模型依赖于世界状态（state of the world）的概念，它是对所有相关信息的完整描述。
孔多塞陪审团定理：多数投票正确的概率比任何人（模型）都更高；当人数（模型数）变得足够大时，多数投票的准确率将接近100%。
分类模型存在一组世界的对象或状态，每个对象或状态都由一组属性定义，每个属性都有一个值。根据对象的属性，分类模型M将对象或状态划分为一个有限的类别集{S1，S2，……，Sn}，然后给每个类别赋值{M1，M2，……，Mn}。
预测的实证研究结果与这种推论一致。虽然增加模型可以提高准确性（根据多样性预测定理，必定会是这样），但是在已经拥有了一定数量的模型之后再继续增加模型，每个模型的边际贡献就会下降
现在，我们已经得到了关键的直觉：增加类别的数量能够通过将具有不同均值的家庭归入同一个类别减少分类误差。统计学家将这种情况称为模型偏差（model bias）。但是同时，构建更多类别则会增加对每个类别均值估计的误差，统计学家将这种情况称为均值方差的增加。
成功的一对多思维取决于创造性地调整假设和构建新的类比，以便将为某个特定目的而开发的模型应用到新的领域。因此，要成为一个多模型思考者，需要的不仅仅是数学能力，更需要的是创造力。
为了避免过度拟合，可以避免使用高阶项。不过，一种更巧妙的解决方法是，可以采取自举聚合法（bootstrap aggregating）或装袋法（bagging）来构建模型。

04 对人类行为者建模

时至今日，我们仍然无法说出哪一种人类行为理论是设定很成功并在各种环境下都通过了检验的。
我们怎样对人建模，归根到底取决于问题的背景和想要实现的目标
无论做出什么假设，我们都无法摆脱假设的影响。我们被绑在逻辑一致性的“桅杆”上，不能随便制造影响。
人是多样性的、易受社会影响的、容易出错的、有目的的、有适应能力且拥有自己主体性的。
人是多样性的、易受社会影响的、容易出错的、有目的的、有适应能力且拥有自己主体性的，也就是说，我们有行动的能力。
对人建模的最后一个挑战来自人的主体性：我们有采取行动的能力，改变行为的能力以及学习的能力。
消费的理性行为者模型假设：行为者个体的效用来自总消费C和住房支出H，其效用函数可以写成如下形式：结果：效用最大化的行为者个体会将自己收入的1/3用于住房。2
第一，人们往往会表现得“似乎”在最优化。
第三，在“赌注”（利害关系）很大的情况下，人们更应该投入足够的时间和精力来做出接近最优的选择。
选择理性行为者模型的理由“似乎”：基于智能规则做出的行为可能与最优或近似最优行为无法区分。学习：在重复的情况下，人们应该能够接近最优行为。大的“赌注”：在重大决策中，人们会收集信息并认真思考。唯一性：最优行为通常是唯一的，从而使模型成为可检验的。一致性：最优行为创建一致的模型。如果人们学会了利用这样的模型，就不会改变自己的行为。基准：最优行为提供了一个基准，作为人们认知能力的上限。
损失厌恶和双曲贴现（hyperbolic discounting）。损失厌恶是指面对收益时，人们表现为风险厌恶，面对损失时，人们却表现为风险偏好。
双曲贴现意味着，人们对近期的贴现更强。
爱尔法鲁模型：适应性规则有100个人，每个人每个星期都要独立地决定是否前往爱尔法鲁酒吧。如果决定前往，且只有60个人或更少的人到场，那么这个人的收益为1，否则收益为-1，决定不前往爱尔法鲁酒吧的人收益为0。每个人都有一套规则来决定是否参加。这些规则可以是固定的，也可以依最近一段时间以来的参加人数而定。每个星期，每个人都要按照遵循他的规则集合中曾产生过最高收益的规则行事。
模型产生了什么样的结果？我们有四种选择：均衡、周期、随机性或复杂性。
产生周期或均衡的模型则可以创造一个稳定的环境，因此我们有理由期望人们可以学习，没有人会持续采取次优的行动。
最优行为可能是一种不切实际的假设，特别是在复杂情况下。另一方面，如果一个系统产生了稳定的结果，而且某个人可以采取更好的行动，那么这个人很可能会找到这种更好的选择。
卢卡斯批判政策或环境的变化可能引起受影响者的行为反应。因此，使用过去的行为数据估计的模型将不准确。模型必须考虑到人们对政策和环境变化做出反应这一事实。

05 正态分布

我不敢说自己比其他65个人都更聪明——但是我当然要比那65个人的平均水平更高。理查德·费曼（Richard Feynman）
我们可以通过中心极限定理（Central Limit Theorem）来解释正态分布的普遍性。中心极限定理告诉我们，只要把随机变量加总或求其平均值，就可以期望获得正态分布。
正态分布的特征在于其均值和标准差（或者等价地，其方差）。也就是说，所有正态分布的图形看上去都是相似的，大约68%的结果在均值的一个标准差内，大约95%的结果在两个标准差内，并且超过99%的结果在三个标准差内。
中心极限定理只要各随机变量是相互独立的，每个随机变量的方差都是有限的，且没有任何一小部分随机变量贡献了大部分变差，那N≥20个随机变量的和就近似一个正态分布。2
均值的标准差公式表明，大的总体的标准差要比小的总体的标准差低得多。由此可以推断，在小的群体中应该会观察到更多的好事和更多的坏事。
中心极限定理要求我们对随机变量求和或求平均值，以获得正态分布。如果随机变量是不可相加而是以某种方式相互作用的，或者如果它们不是相互独立的，那么产生的分布就不一定是正态分布。事实上，一般情况下都不会是。

06 幂律分布

每个基本定律都有例外，但是你仍然需要定律，否则你所拥有的只是毫无意义的观察。那不是科学，只是做笔记。
幂律分布就是通常所称的长尾分布或重尾分布。
产生幂律分布要求非独立性，通常以正反馈的形式出现。
在幂律分布中，事件发生的概率与事件大小的某个负指数成比例。
齐普夫定律对于指数为2的幂律分布（a=2），事件的等级排列序号乘以它的大小等于常数，即：事件等级×事件大小=常数

07 线性模型

是的，我承认我在说谎。但为什么你非要强迫我给出一个线性解释呢！线性解释几乎总是谎言。埃莱娜·费兰特（Elena Ferrante）
模型通常假定变量之间存在某种特定的函数关系。这种关系可以是线性的，也可以是非线性的，或者可以包括阈值效应。
在线性关系中，由于第二个变量的变化而导致的第一个变量的变化量不依赖于第二个变量的值。
线性回归模型的目标是找到能够最小化到各数据点的直线。
回归线越靠近数据，模型解释的数据越多，R2就越大（得到解释的百分比越大）。如果数据全部都恰好位于回归线上，R2就等于100%。
统计学家使用p值来表示系数的显著性，p值等于基于回归的系数不为零的概率。p值为5%意味着数据由一个系数等于零的过程生成的概率为1/20。显著性的标准阈值是5%（通常用*表示）和1%（通常用**表示）。
回归所揭示的是变量之间的相关关系，而不是因果关系
花时间学习和参加“快班”课程这两个因素也可能没有什么用，因为也许存在选择性偏差（selection bias），那些花更多时间学习、参加“快班”课程的学生，数学成绩可能本来就更好。
大系数与新现实线性回归揭示了自变量与我们感兴趣的（因）变量之间的相关程度。如果这种相关是因果关系，那么具有大系数变量的变化就会产生很大的影响。基于大系数的政策在保证能够带来改进的同时，排除了涉及更多根本性变化的新现实。
线性模型只是一个开始，大多数有趣的现象都不是线性的。
树木的集合称为森林。机器学习算法会在一个训练集上随机构造出树，然后将那些在检验集上准确分类的树保存下来。

08 非线性模型

讨论非线性科学，就类似于讨论无大象的动物学。约翰·冯·诺伊曼
我们阐明了增长和正反馈是如何产生凸性的，收益递减和负反馈又是如何产生凹性的。在绝大多数学科中，都包含了这两类模型。
关于生产的经济学模型假设交货期和库存成本会随着企业规模的增大而减少，从而使每单位产品的销售利润成了企业规模的一个凸函数，这也就解释了为什么沃尔玛能够获得如此高的利润
凸函数的斜率是递增的：函数值随度量值的增加而增加。
72法则如果一个变量在每个周期内以R（增长率小于15%）的百分比增长，那么下面提供了一个很好的近似：
摩尔定律（Moore's law）则指出，可以安装在一块集成电路上的晶体管数量每两年会增加一倍。摩尔定律之所以持续存在，是因为用于研发的投入带来了近乎恒定不变的进步速度。
具有正斜率的凸函数会以递增的值增加，具有负斜率的凸函数就会变得不那么陡峭，也就是说，最初具有较大负斜率的凸函数将逐渐走平。半衰期模型（half-life model）中的方程就是如此，这个模型可以用来刻画分解、折旧和遗忘。
半衰期模型如果每H周期，剩余数量的一半会衰减，那么在t周期后，剩余的比例为：[插图]
柯布-道格拉斯模型给定L个工人和K个单位资本，总产出如下所示：产出=常数×LaK（1-a）其中a是介于0到1之间的实数，表示劳动力的相对重要性。
简单增长模型产出函数：[插图]投资规则：I（t）=s×O（t）消费-投资方程：O（t）= C（t）+I（t）投资-折旧方程：M（t+1）= M（t）+I（t）-d×M（t）其中，O（t）=产出，M（t）=机器，I（t）=投资，C（t）=消费，s=储蓄率，d=折旧率。
在经济的长期均衡中，投资的新机器数量等于折旧损失的机器数量。
本章的一个核心结论是，一旦包括了非线性，直觉就变得不够用了。

09 与价值和权力有关的模型

你的价值不在于你知道了什么，而在于你能够分享什么。罗睿兰（Ginni Rometty）
第一个标准是“最后上车者价值”（last-on-the-bus value，简称LOTB），它等于一位行动者在团队已经形成的情况下加入团队时的边际贡献。第二个标准是夏普利值（Shapley value），它等于行动者遍历所有可能的加入团队的序列，加入团队时的边际贡献平均值。
对永远不能为团体增加价值的博弈参与者必须赋予零值，所有博弈参与者的价值总和必定等于博弈的总价值。
合作博弈合作博弈由N个博弈参与者和一个价值函数组成。这个价值函数为任何子集S⊆N分配一个值V（S）赋值。这些子集称为联盟。没有博弈参与者组成的联盟的价值等于零，即[插图]。所有N个博弈参与者的价值V（N）等于博弈的总价值。
夏普利值给定合作博弈{N，V}，夏普利值的定义如下：N个博弈参与者加入联盟的次序有N！个，让O代表这所有N！个次序。对于O中的每一个次序，将博弈参与者i增加的价值定义为当博弈参与者i加入时价值函数发生的变化。博弈参与者i的夏普利值等于他在O中所有次序上增加价值的平均值。
第一，我们是通过对所有可能次序中博弈参与者的边际贡献来计算夏普利值的，因此任何永远不能增加价值的博弈参与者的夏普利值都为零。第二，对任何两个相同的博弈参与者，即对每个联盟贡献相同的任两个博弈参与者，也必须分配给他们相同的夏普利值。第三，由于所有次序的价值总和等于博弈的总价值，所以夏普利值的总和也必定等于与博弈的总价值。这里需要注意的是，“最后上车者价值”虽然满足前两个性质，但是却不满足最后一个公理。
夏普利值的公理基础夏普利值唯一满足以下公理：零性：如果博弈参与者为任何联盟增加的价值都等于零，那么该博弈参与者的价值等于零。公平性／对称性：如果两个博弈参与者对任何联盟都具有相同的增加价值，那么这两个博弈参与者具有相同的价值。完全分配性：博弈参与者价值的总和等于博弈的总价值V（N）。可加性：给定两个定义在相同博弈参与者集合之上的博弈，它们的价值函数分别为V和[插图]，那么在博弈（V+[插图]）中，一个博弈参与者的价值等于该博弈参与者在V和[插图]的价值的总和。
与这个例子相似的席位分配在现实世界的议会制度中经常出现。因此，只拥有少量席位的政党往往可以掌握很大的权力
在这些情况下，联盟会希望减少“最后上车者价值”。通过扩大联盟规模，可以创建出一个具有很高的总价值、同时“最后上车者价值”又足够低的联盟。不断加入新成员，会使现有成员变成“可以放弃的”，从而使“最后上车者价值”趋向于零。

10 网络模型

网络由节点以及连接节点的边（edge）组成。由边连接起来的节点互为邻居。如果沿着边，可以从任何一个节点到达任何其他节点，就将这样的网络称为连接的网络。
在非定向网络中，一个节点的度（degree）等于连接到它的边的数量。
节点的介数得分（betweenness score）等于通过该节点的最小路径的百分比。在社交网络中，介数得分高的人掌握更多信息并且拥有更多权力。
网络统计量度：节点的邻居数（即边数）。路径长度：从一个节点到另一个节点必须遍历的最小边数。介数：经过某个节点连接两个其他节点的最短路径数量。聚类系数：一个节点的邻居对当中，同样也由一条边连接的邻居对所占的百分比。
刻画网络的聚集程度的另一种方法是将节点划分为不同的社区
当然，自发涌现的网络结构都具有鲁棒性这个事实是一个谜。
友谊悖论；事实上，在任何网络上，平均来说，人们确实不可能比他们的朋友拥有更多的朋友。
友谊悖论如果网络中任何两个节点的度不同，那么平均而言，节点的度会低于其相邻节点。换句话说，平均而言，人们的朋友比他们自己更受欢迎。8
我们的弱关系，也就是网络中的随机朋友，由于连接了具有不同兴趣和信息的社区，从而发挥了重要的信息作用。因此，社会学家很强调弱关系的力量。12
缺乏局部聚类的稀疏网络更容易出现故障

11 广播模型、扩散模型和传染模型

就像传染病的传染导致更多的传染病一样，信任的“传染”也可以促成更大的信任。
所有这三类模型都将整个人口划分为两个群组：知道或拥有某种东西的人与不知道或不拥有某种东西的人。
广播模型It+1=It+Pbroad×St其中，Pbroad表示广播概率，It和St分别等于时间t上的感染者（知情者）和易感者的数字初始状态为I0=0，且S0=NPOP。
在每一个时期，知情者的人数都会增加，并且以一个递减的速度增加
我们可以将扩散概率（diffusion probability）定义为接触概率（contact probability）和分享概率（sharing probability）的乘积。我们可以根据扩散概率来构建模型，但是在估计或应用模型时，必须独立地跟踪接触概率和分享概率。
扩散模型[插图]其中，Pdiffuse=Pspread×Pcontact。
对于中心辐射型网络，R0携带的信息量很有限，因为如果中心节点患上了传染病，传染病就会传播开来。流行病学家们将位置在度很高的中心节点上的人称为“超级传播者”（superspreaders）。

12 熵：对不确定性建模

信息是不确定性的解。克劳德·香农（Claude Shannon）
也可以利用熵的概念来区分四类结果：均衡、周期性、复杂性和随机性。
熵是用来度量与结果的概率分布相关的不确定性的。
熵在数学上等于概率与它们的对数之和的相反数。
信息熵给定一个概率分布（p1，p2，…pN），信息熵，H2等于：[插图]注：上面的下标2表示使用的是以2为底的对数。
信息熵就对应着“是或否”问题的期望数量。如果我们不得不提出很多问题，那么分布就是不确定的。而知道了结果，也就揭示了信息。
公理基础：熵，其中，a>0。这种熵测度是唯一满足以下四个公理的测度：对称性：对于任何转置概率，都有连续函数。最大化：对于所有N，处最大化。零性：H（1，0，0，…0）=0。可分解性：如果其中，。
平衡结果没有不确定性，因此其熵等于零。周期性过程具有不随时间变化的低熵。当然，完全随机过程具有最大的熵。复杂性具有中等程度的熵，因为复杂性位于有序性和随机性之间。
如果我们确定了均值和方差（并且允许出现负值），那么最大熵分布则是正态分布。
最大熵分布均匀分布：给定范围［a，b］，使熵最大化。指数分布：给定均值μ，使熵最大化。正态分布：给定均值μ和方差σ2，使熵最大化。

13 随机游走

伯努利瓮模型每一次，从一个装了G个灰球和W个白球的瓮中随机抽取一个球，结果等于抽取出来的球的颜色。在下一次抽取之前，球要先放回瓮中。令[插图]表示灰球的比例。在抽取N次的情况下，可以计算出抽取出来的灰球的期望数量NG，及其标准差[插图]：[插图]
简单随机游走模型Vt+1=Vt+R（-1，1）其中，Vt表示时间t上的随机游走值，V0=0，R（-1，1）是一个可能等于-1或1的随机变量。在任何时间段内，这个随机游走的期望值都等于零，且标准差为[插图]，其中的t等于周期数。7
简单随机游走既是周期性的（会无限次地返回零点），又是无界性的（会超过任何正的或负的阈值）。
因此，要想在轮盘赌中赢，应该做的事情是下一个大赌注而不是下很多个小赌注。
这个模型还提出了一个策略：更强的那支球队应该加快比赛节奏，以创造更多的进攻回合。占有优势的球队应该更频繁地玩“轮盘赌”，因为随机“漂移”对他们有利。
事实已经证明，股票价格接近正态随机游走，带有正漂移，以获得市场收益。
简而言之，正如格罗斯曼和斯蒂格利茨悖论（Grossman and Stiglitz paradox）所强调的，如果投资者相信有效市场假说，他们就会停止分析，从而导致市场效率低下；而如果投资者认为市场效率低下，他们就会应用模型进行分析，从而提高市场效率。
长期资本管理公司给我们的教训是深刻的，也是显而易见的，那就是不要过分相信一个模型。
挑选一些看上去很好的公司出来，列出它们的特征，这并不是模型思维。模型思维的要求是，推导出能够导致成功的那些特征，例如才华横溢的工人，然后再根据数据来检验相关结论。如果可能的话，最好寻找一些自然实验，也就是相关特征随机变化的实例。

14 路径依赖模型

人不能两次踏进同一条河流，因为无论是这个人，还是这条河，都已经不同了。赫拉克利特（Heraclitus）
在任何领域，人们的行为都建立在他人行为的基础上，无论是国际事务、艺术、音乐、体育、商业、宗教、技术还是政治，我们都应该会看到某种程度上的路径依赖。
结果路径依赖是指每一周期的结果都取决于先前的结果
波利亚过程一只瓮里面装着一个白球和一个灰球。每一周期，都随机抽取出一个球并将这个球与和它颜色相同的另一个球一起放回到瓮中。抽取出来的球的颜色表示结果。
均衡过程一个瓮包含一个白球和一个灰球。每一周期都随机抽取出一个球，并将与抽取出来的球颜色相反的球与抽取出来的那个球一起放回到瓮中。球的颜色表示结果。
平衡过程甚至可以用来对努力实现公平的组织行为建模。
具有临界点的过程出现大幅度的转折，而路径依赖的过程则变化缓慢。

15 局部互动模型

每一代人都嘲笑旧时尚，同时又虔诚地追随新时尚。
在局部多数模型中，元胞通过与它的大多数邻居的状态相匹配来更新。而在生命游戏中，元胞的更新规则要更加复杂，它依赖于多个阈值。这两个模型的结果也不同。局部多数模型总是收敛到均衡，生命游戏则取决于其初始条件，可能会产生任何类型的结果：均衡、周期性、复杂性或随机性。
局部多数模型二维方格上的每个单元都处于两种状态之一：开或关。每个单元有8个邻居。2在每个周期中，随机选择一个元胞。3当且仅当其中它的5个或更多邻居处于另一个状态时，这个元胞才会改变自己的状态。
协调的悖论（paradox of coordination）将不同群体之间的差异解释为一种特异性的分歧。
协调的悖论如果人们是在局部进行协调的，那么从全局的角度来看，整体配置将会是斑块状的、多样性的。
当技术和城市化使人与人之间的联系更加紧密之后，协调的力量可以产生更大的同质性行为和信念。

16 李雅普诺夫函数与均衡

如果能够为模型构建一个李雅普诺夫函数，那么模型必定会达到均衡。
一个离散动态系统（discrete dynamical system）由可能的配置空间，以及一个转移规则（transition rule）组成。
李雅普诺夫函数给定一个离散时间动态系统，它的转移规则由xt+1=G（xt）组成。对于实值函数F（xt），如果对于所有的xt，都有F（xt）≥M，而且存在一个A>0，那么下式成立，这个实值函数F（xt）是李雅普诺夫函数：F（xt+1）≤F（xt）-A，如果G（xt）≠xt如果对于G，F是一个李雅普诺夫函数，那么从任何x0开始，必定存在一个t*，使G（xt*）=xt*，即该系统会在有限时间内达到均衡。
逐底竞争博弈有N个博弈参与者，每个博弈参与者在每个时期都要提出一个支持水平，其取值范围为{0，1，…，100}。提出了最接近平均支持水平2/3的博弈参与者可以获得那个期间的奖励。
逐底竞争博弈是否能达到均衡，取决于博弈参与者的行为规则。
在第一个时期，我们假设每个博弈参与者会随机选择一个低于50的支持水平。在以后各期中，每个博弈参与者选择的水平至少等于1且低于上一期平均水平的2/3。如果上一期的平均水平已经小于零，那么每个博弈参与者都会选择零。
自组织活动模型一个城市里，有A种活动可以参加，每一天都由L个时间段组成。在人口规模为M的城市中，每个人都要选定一个日程安排。在这里，日程安排是指这个人在L个时间段内分配L种活动（从一个更大的K种可能性的集合中）。一个人要面对的拥挤水平则设定为等于同时选择同一种活动的其他人的数量。
李雅普诺夫函数在交易环境中是否存在，取决于负外部性的大小。

17 马尔可夫模型

马尔可夫模型用来刻画以一定概率在一组有限的状态之间不断转换的系统。
马尔可夫模型可以应用于很多领域。我们可以用马尔可夫模型来解释动态现象，例如民主转型、战争升级和药物干预，还可以用于对网页、学术期刊和体育运动队进行排名，甚至可以用来辨别书籍和文章的作者身份。
马尔可夫模型由一组状态与这些状态之间的转移概率构成。
任何一个马尔可夫模型，只要状态集是有限的、不同状态之间的转移概率是固定的、在一系列转移后能够从任何一个状态变换为任何其他状态，而且状态之间不存在固定的循环，就必定会收敛到唯一的统计均衡。
它也告诉我们一个基本道理——与其改变当前状态，还不如改变结构因素，而后者更有价值。
马尔可夫模型是通过区分以下两类政策来指导行动的：一类政策能够改变转移概率，而改变转移概率可以产生长期影响；另一类政策只能改变状态，并且只能产生短期影响。如果转移概率无法改变，那么我们必须定期重置状态才能改变结果。沉溺于辛劳工作可能会产生导致好强、自私和压抑的心理状态转移概率，而每天锻炼、冥想或参加宗教活动则可能帮助人们以一个感恩的、富有同情心的、放松的心理状态迎接每一天。周末休息也有类似的功能，已婚夫妇不时过一过约会之夜也有很好的效果。这两者的共同作用是，能够暂时使一个人的状态远离均衡。

18 系统动力学模型

系统动力学模型通常要包括源（source）、汇（sink）、存量（stock）、流量、速率和常数等组成部分。源产生对系统的输入，汇吸收输出，存量跟踪变量的水平，流量刻画各存量水平之间的反馈，速率和常数用于流量，流量可以是随时间变化的，也可以是固定不变的。
任何一个系统动力学模型都由源、汇、存量和流量组成。源产生存量；存量是某个变量的数量或水平；流量描述了存量水平的变化；汇能够捕获来自存量的流量输出；汇和源是不包含在模型中的过程的“占位符”；存量水平会根据源和流量随时间推移而变化。
洛特卡-沃尔泰拉方程假设一个生态系统由H只野兔和F只狐狸构成。野兔的数量以g的速度增长，狐狸的数量则以d的速度减少。当野兔和狐狸相遇时，野兔以a的速度死亡，狐狸以b的速度增长。根据这些假设，可以给出如下微分方程组：3 从这个微分方程组可以推导出两个均衡，一个是灭绝均衡，即F=H=0；一个是内点均衡，即和给出。
对窗口征税能够增加收入；安装防抱死制动器能够挽救生命。但是我们并不一定随时都会考虑到间接影响，也就是各种正反馈和负反馈。这些模型恰恰能帮助我们更清晰、更深入地进行思考。

19 基于阈值的模型

种族、民族以及其他阶层的融合标志着显著的社会不平等，这是民主社会的至关重要的理想。
当外部变量超过或低于特定的阈值时，人们的行为所发生的变化，就是基于阈值的行为（变化）。
骚乱模型假设有N个人（用i来索引），每一个人都有一个“骚乱阈值”（riot threshold），不妨记为T（i）∈{0，1，…，N}。在一开始，骚乱总产值为零，即T（i）=0的那些人都会参加骚乱。令R（t）等于在时间t参加骚乱的人的数量。在时间t上，如果T（i）
阈值的总体分布是非常重要的，而不仅仅只有阈值的均值才重要。因此它也说明，要预测哪些社会活动将会成功有很大的困难。
换句话说，初创企业必须同时制造出两场“骚乱”。
谢林派对模型 N个人参加一个派对，每个人都有一个可观察的类型A或B。每个人随机选择两个房间中的一个。在每个时刻，每个人都有p的概率走到另一个房间去。第i个人的宽容阈值为Ti。对于这个人，如果他所属的类型的人在当前房间内所有人当中所占的比例低于这个阈值，他就离开这个房间。
即使是宽容的人，也会产生隔离的居住模式，这就是托马斯·谢林的开创性名著《微观动机与宏观行为》一书最根本的洞见。
而在研究社会系统的时候，则可能并不存在理想粒度水平。我们可能需要在多个粒度水平上分别进行探索。通过构建多个模型，每个模型都有不同的粒度水平，然后进行跨模型对话。

20 空间竞争模型与享受竞争模型

我们的理论是，如果你需要用户来告诉你，你正在销售的是什么，那么你其实不知道你正在销售的是什么，而且这不可能给客户留下好的体验。
在享受属性上，更多（或者在某些情况下更少）总是意味着更好
这个模型的预测是，拥挤的市场中的价格竞争比稀疏的市场中的价格竞争影响更大；同时，大宗商品[插图]市场上的价格竞争则可以称得上是“极端的竞争”，其影响最大。这个模型还预测，高端时尚商品的价格竞争将很少出现，因为产品的高维性能够创造出一个稀疏的市场，设计师可以维持大幅度的价格加成。
模型本身并不是目的，只是提供了一个框架来构建我们的思维。

21 博弈论模型

演绎推理是从最抽象到最不抽象的推理。它从一套公理开始，运用逻辑定律和数学规律来操纵，形成对世界的预测。
博弈的纳什均衡（Nash equilibrium）是指这样一种策略，它们能够使每个博弈参与者的策略在给定其他博弈参与者策略的情况下是最优的。

22 合作模型

从来没有人因施舍而变得贫穷。
合作可以通过多种机制、在多种环境下涌现出来并维持下去。我们讨论了四种促进合作的机制：重复、声誉、局部聚类和群体选择。
实物标签可以使声誉变成一个公共信息，从而有利于能够维持合作。
我们随机地向每个博弈参与者分配如下五种遵循行为规则的策略中的一种：始终合作（C）、始终背叛（D）、冷酷触发（GRIM）、针锋相对（TFT）、欺负好人（TROLL）

23 与集体行动有关的问题

我们可以把集体行动问题视为一个多人囚徒困境博弈：每个人都有动机去背叛，但是从集体的角度来说，每个人都能够通过合作使自己的境遇得到改善。
集体行动问题在集体行动问题中，N个人中的每个人都要选择是搭便车（f）还是为集体行动做贡献（c）。个人的收益取决于自己的行动和合作者的总数。个人可以通过搭便车获得更高的收益，即，收益（f，C）>收益（c，C+1），但是当每个人都做出贡献时，所有人的收益总和实现最大化。
利他主义者提供的公共物品N人有利他主义偏好，其对总效用的权重为α：[插图]均衡纯粹的利他主义者（α=1）：PUBLIC=N均衡一般解：6[插图]实例：α=1/2：PUBLIC≈N/4

24 与机制设计有关的模型

制度的目的在于改变人类行为。为了保证制度不会随着时间流逝而归于无效，制度必须适应制度所要规范的环境或社会的变化。
这个框架强调了真实制度的如下四个方面：信息，指参与者知道些什么及应该向他们揭示什么；激励，即采取特定行动的利益和成本；集结，个人行为如何转化为集体结果；计算量，这是对参与者认知能力的要求。
一种机制由六个部分组成：一个环境（世界的相关特征）、一个结果集、一个行动集（也称为消息空间），一个行为规则（人们根据这个规则来做出行动）、将行动映射到结果的结果函数，以及将环境映射到一组希望得到的结果的社会选择对应（social choice correspondence）。

25 信号模型

利用发送信号来揭示自己的身份一直都是人性的一个部分。
要让信号发挥作用，它们就必须是昂贵的（有成本的）或可验证的。
这个模型支持三种不同的结果：混同（pooling），所有人都发送相同的信号；分离（separating），每种类型的人各自发送一个独特的信号；部分混同，其中一些类型区分开来了，其他类型则没有区分开来。
为了减少发送信号的社会成本，我们应努力使信号尽可能有效地发挥作用。

26 学习模型

一个人可以养成的最重要的习惯就是对继续学习的渴望。约翰·杜威（John Dewey）
强化学习模型通过更高的奖励来强化行动。随着时间的推移，学习者会学会只采取最优行动。
在社会学习模型中，个体能够从自己的选择和他人的选择中学习。个体会复制最流行的或表现高于平均水平的行动或策略。
个体学习模型：强化学习模型
如果奖励没有采用数值形式（通常情况下都是如此），人们就必须依赖自己的记忆。
强化学习的效果在学会选择最优备选方案模型的框架中，当渴望水平被设定为等于平均获得的奖励时，强化学习（最终）几乎总是会选择最优备选方案。
这些结果突显了个体学习与社会学习之间的关键差异。个体学习会引导人们选择更好的行动，因此人们会学会采取占优行动（如果占优行动存在的话）。而社会学习则引导人们选择相对于其他行为来说表现更好的行动。

27 多臂老虎机问题

伯努利多臂老虎机问题一个备选方案集{A，B，C，D，…，N}中的每一个备选方案都能够产生一个成功的结果，但是各自的概率{PA，PB，PC，PD，…，PN}都是未知的。在每一个时期，决策者选择一个备选方案K，并以概率PK得到一个成功的结果。
第一种启发式是取样并择优启发式（sample-then-greedy），即先对每个备选方案都尝试固定的次数M，然后选择具有最高平均收益的备选方案。
贝叶斯多臂老虎机问题给定备选方案集{A，B，C，D，…，N}，以及对应的收益分布{f（A），f（B），f（C），f（D），…，f（N）}。决策者对每个分布都有先验信念。在每一期，决策者选择一个备选方案，并获得收益，并根据收益计算出新的信念。

28 崎岖景观模型

当你费心去寻找时，就会发现令人惊奇的事情。
因此，崎岖性导致了对初始条件的敏感性和路径依赖的可能性。而这些都意味着，景观的崎岖性有助于结果的多样性。崎岖性也意味着出现次优结果的可能性，在崎岖景观中，次优结果表现为局部高峰。

结语像芒格一样智慧地思考——多模型思维的实际应用

一切都是复杂的；如果不是这样，那么生活、诗歌以及所有一切，都只会成为烦恼和负担。华莱士·史蒂文斯
。在历史上，收入分布曾经被校准为对数正态分布或帕累托分布。最近，颗粒度更细的数据表明，收入分布的尾部长于对数正态分布，但是又不完全符合幂律分布。财富分布也同样是偏斜的。
这种连通性会产生正反馈并导致更大的不平等。
信息和社会影响放大了马太效应。富人变得更加富裕了，而穷人则变得相对更穷了。

译者后记

我们切不可把我们要面对的世界简单化。不要以为在土里插个温度计，就可以测量整个地球的温度了。

模型思维

作者简介

推荐语

序言 这本书是怎样写成的

01 做一个多模型思考者

02 模型的7大用途

03 多模型思维

04 对人类行为者建模

05 正态分布

06 幂律分布

07 线性模型

08 非线性模型

09 与价值和权力有关的模型

10 网络模型

11 广播模型、扩散模型和传染模型

12 熵：对不确定性建模

13 随机游走

14 路径依赖模型

15 局部互动模型

16 李雅普诺夫函数与均衡

17 马尔可夫模型

18 系统动力学模型

19 基于阈值的模型

20 空间竞争模型与享受竞争模型

21 博弈论模型

22 合作模型

23 与集体行动有关的问题

24 与机制设计有关的模型

25 信号模型

26 学习模型

27 多臂老虎机问题

28 崎岖景观模型

结语 像芒格一样智慧地思考——多模型思维的实际应用

译者后记

序言这本书是怎样写成的

结语像芒格一样智慧地思考——多模型思维的实际应用