零和博弈(Zero-sum game)是博弈论中的一个核心概念,起源于数学和经济学领域,广泛用于描述竞争性情境。博弈论是研究具有对抗性或合作性特征的策略决策的数学理论。零和博弈指的是在一个博弈过程中,所有参与者的总收益和总损失相抵,结果总和为零。在这种博弈中,一方的得益总是以另一方的损失为代价。这意味着参与者之间的利益是完全对立,一个参与者的任何收益或损失将被其他参与者的损失或收益完全抵消,使得所有参与者的净收益和为零。作为博弈论的起点,零和博弈应用于数学、经济学、国际关系等领域,是研究决策制定与策略互动的关键理论工具。零和博弈常见于竞争性环境,如赌博、市场竞争和某些类型的政治或军事冲突。
概念
零和博弈描述的是一种特定的竞争情境,其中一个参与者的收益或损失完全由其他参与者的损失或收益来补偿,使得所有参与者的总收益保持不变,通常是零。这意味着一方的利益增加必须以另一方的利益减少为代价,因此被称为“零和”博弈。
零和博弈之于博弈论,就如同十二小节蓝调之于爵士乐。零和博弈是博弈论里的一个极端的例子,一个历史的起点。零和博弈的情境中,(i)玩家中的每个人都有一组可供选择的行动方案/策略;(ii)每种行动方案都有相对应的结果,且这些结果会使得玩家对于不同的行动产生偏好;(iii)玩家知道,并且彼此知道这些偏好。
在双人零和博弈中,两个参与者A和B都有一组有限的策略,而他们的选择偏好可以通过冯·诺伊曼-摩根斯坦效用来表示。偏好结构可以显示在收益矩阵中,其中(i,j)项(uij,vij)分别给出A用第i策略和B使用第j策略时A和B的预期效用或收益。对于所有i,j, uij + vij = 0的这种类型的博弈称为零和矩阵博弈(简称零和博弈)。在零和博弈中,玩家的偏好与策略对完全相反。因此,他们两个人没有合作的余地。零和博弈是非合作博弈,每个参与者都必须在不确定的情况下做出选择。
假设有两个参与者,玩家1和玩家2,玩家1有两种策略(策略A和策略B),玩家2也有两种策略(策略X和策略Y),表1显示了他们的零和博弈收益矩阵。在这个矩阵中,玩家1的收益是矩阵中每个元素的第一个数值(a1, a2, b1, b2);玩家2的收益是矩阵中每个元素的第二个数值(-a1, -a2, -b1, -b2)。每个数值都对应一个策略组合的收益。假设玩家1选择策略A,玩家2选择策略X时,玩家1的收益为a1,而玩家2的收益为-a1。
由于零和博弈的特性,玩家1的收益和玩家2的收益之和始终为零,即 玩家1的收益+玩家2的收益=0。
再如表二所展示的最常见的石头剪刀布游戏的收益矩阵,也是一种零和博弈。规则是博弈双方同时做出决策,若一方反应慢,则为失败。在一个回合中,赢的一方得1分,输的一方减1分,如果双方一致,则为平局,收益均记为0。博弈由玩家1和玩家2组成,每个玩家有3种策略,因此共有9种不同的策略组合。矩阵中的每个元素代表该策略下双方各自的收益。可以发现,每个收益格内的总和为零。在这个博弈中,玩家1出什么策略是建立在对玩家2策略的推测上。假如玩家1推测玩家2出“布”,那么玩家1的最优策略是“剪刀”,而其他的策略(“石头”和“布”)都是下策,玩家2同理。
分类
零和博弈可以根据参与者的数量、策略的复杂度以及信息的可用性进行分类:
按博弈的参与者数量分类
l 双人零和博弈:最常见的零和博弈类型,只有两个玩家参与,其中一个玩家的收益总是等于另一个玩家的损失。典型例子包括棋类游戏(如国际象棋、围棋)和赌博游戏。
l 多玩家零和博弈:在这种博弈中,除了两个玩家外,还有更多的玩家参与。每个玩家的收益与其他所有玩家的损失之和为零。例如,多个国家在进行竞争性外交或经济博弈时,可能会形成一种多方零和博弈。
按博弈的信息结构分类
l 完全信息零和博弈:在这种博弈中,所有玩家在进行决策时都有关于对方策略和收益的完全了解,博弈双方可以完全预测对方的选择。例如,国际象棋就是一个完全信息博弈,双方可以看到整个棋盘,并且对方的所有棋子和位置都可以被观察。
l 不完全信息零和博弈:这种博弈中,玩家对于对方的策略或收益没有完全的了解,可能只有部分信息或者信息是模糊的。例如,一些赌博游戏或军事对抗博弈,玩家可能并不完全了解对方的手牌或部队部署。
按博弈的动态性质分类
l 静态零和博弈:在这种博弈中,所有玩家在同一时刻做出决策,且决策不随时间推移而改变。玩家的决策是一次性的,且在博弈开始时所有信息都是已知的。例如,棋类游戏的一局通常是静态博弈。
l 动态零和博弈:博弈的过程是在一系列时间段内进行的,玩家的决策是顺序进行的,且可能基于之前的决策或结果作出调整。在这种博弈中,后续的决策可以根据之前的动作进行调整。典型例子包括投资博弈、长期竞争博弈等。
主要特点
总和为零
零和博弈的核心特征是参与者之间的总收益和总损失相加等于零。这意味着一个参与者的收益完全等于其他参与者的损失。换句话说,博弈中的一方获得的任何东西都是以另一方失去同等价值为代价的。
对抗性质
由于总和为零,零和博弈具有高度的对抗性。每位参与者的目标都是最大化自己的利益,这通常以牺牲其他参与者的利益为代价。零和博弈的参与者之间没有合作的动机,因为任何对一方有利的情况都会损害另一方的利益。
策略依赖性
在零和博弈中,每个玩家的最佳策略不仅取决于自己的选择,还需要考虑对方的策略。参与者需要预判对方的行为,并根据对方可能的选择来调整自己的策略。
封闭系统
零和博弈通常发生在固定收益总量的封闭环境中,因为资源有限且无法增加,所以这种限制下的参与者之间的竞争更为激烈。
起源
零和博弈的概念在20世纪初开始形成。
约翰·冯·诺伊曼(John von Neumann)是博弈论的先驱之一, 他在1928年发表了一篇名为《博弈论中的极大极小原理》(《Zur Theorie der Gesellschaftsspiele》)[2]的论文,提出了极大极小原理,证明了在某些博弈中,玩家可以通过选择最优策略来最大化他们的收益,前提是对手也在采取最优策略。在有限的零和博弈中,总是存在一个混合策略的均衡点,参与者可以通过最优策略在对手也采取最优策略的情况下最大化自身收益。冯·诺伊曼的研究为零和博弈的形式化奠定了数学基础。
之后,冯·诺伊曼与经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)合作,进一步发展了这一理论。他们在1944年合著的《博弈论和经济行为》一书中,不仅仅全面阐述了零和博弈的理论,还引入了预期效用理论,分析了非零和博弈及其在经济决策中的应用。这本书极大地推动了博弈论作为一个独立学科的发展,并使零和博弈的概念得到了广泛的认识和应用。
案例
零和博弈的示例遍布于各种领域,包括经典的游戏、经济竞争、政治斗争等。
棋类游戏
如国际象棋、中国象棋、围棋等。在这些游戏中,一方吃掉另一方的棋子,就意味着该方赢了一步而对方输掉一步。最后一方的胜利直接意味着另一方的失败。游戏的得分总和为零。
赌博游戏
如扑克牌游戏。在扑克牌中,一位玩家的赢利通常来自其他玩家的损失。总的来说,赌桌上的钱从一个人转移到另一个人,但赌桌上的总金额保持不变。
股票市场
股市零和博弈的定义可以表述为: 输家损失+现金分红=赢家收益+融资+交易成本。股票的价值变化与市场交易参与者的收益亏损之和相等。然而,也有研究者指出,股票投机并非零和博弈。由于股票投机的不完全合作博弈性质、股票价格作为对象的不稳定性和股票投机本身持续不断的过程,股票投机通常是非零和博弈,只有在特定情况下才可能是零和博弈。
体育比赛
比如足球、篮球等比赛,一支队伍的胜利即意味着另一支队伍的失败。在这种情况下,胜利和失败的得分加在一起等于零。
政治选举
在一次选举中,一个候选人的胜利通常意味着其他候选人的失败。虽然政治选举的后果可能更加复杂,但从最基本的角度来看,它可以被视为一个零和博弈。
法律谈判
在诉讼案件中,尤其是涉及金钱赔偿的情况,一个当事人的损失往往直接转化为另一方的获益。
评价
零和博弈的思维方式在某些情况下有助于个体和群体更好地理解竞争的本质,特别是在资源有限且分配存在争议的环境中。比如在某些政治和社会结构中,零和思维帮助人们认识到,某些资源的竞争是不可避免的,并促使参与者更加关注自己的利益最大化。美国政治中的两党分歧就反映了零和思维的应用,保守主义者和自由主义者对社会不平等和经济问题的不同看法揭示了零和博弈思维如何加剧社会冲突。此外,零和思维在某些文化中也加强了人们的竞争意识,例如在中国和美国的外交关系中,零和思维可能被用来解释中美在“一带一路”等议题上的分歧。零和博弈强调的是“赢者全得”原则,适用于那些结果直接对立的情境。
然而,零和博弈在更为复杂的社会和国际环境中,其带来的“损人利己”心态可能导致更多的冲突和对抗。许多研究表明,零和思维往往使人们在追求社会地位和资源时选择强制性、支配性策略,而不是尊重和合作的策略,这加剧了社会的不信任和矛盾。例如,零和思维可能导致政治上的极化,增加社会冲突,特别是在面对具有强烈对立观点的群体时,双方都倾向于认为“生活是零和的”,从而加剧了彼此之间的敌对情绪。
从社会合作的角度来看,零和思维的局限性尤为明显。在经济和国际关系中,零和博弈并不是唯一的模式。全球化进程和跨国合作表明,合作可以带来“共赢”,这与零和博弈的“对立”逻辑相对立。比如,交通资源的合理分配需要合作而非竞争,合理的规则可以避免资源的浪费和冲突,从而达到“非零和”的最优结果。因此,随着社会的发展,越来越多的人认识到,合作、共赢和双赢的思维模式更加符合现代社会的需求。
总的来说,零和博弈在解释某些竞争性局面时是有效的,但在现代社会中,尤其是涉及跨国合作、社会资源分配和长远发展的情境下,双赢思维往往更具可行性和优势。零和思维的负面效应,尤其是其对社会关系和政治环境的影响,需要引起足够的重视,并通过倡导合作与共赢来减少其不良影响。