期成功 =(失败经历 x 学习反馈率)\/ 风险暴露度 + 残存资源储备 x 再博弈次数
其中:
? “失败经历”是变量,不可控;
? “学习反馈率”是策略;
? “风险暴露度”是制度与个体选择;
? “资源储备”决定是否能重来;
? “再博弈次数”取决于环境与制度。
博弈论(Game theory)是研究多个决策者在相互影响下如何作出最优选择的理论体系。在经济学、政治学、心理学、社会学、甚至日常人际交往中都有广泛应用。下面我们将围绕博弈论的基本原理、核心模型与现实应用进行详细讲解。
?
一、博弈论的基本概念
1.1 博弈(Game)
博弈是指**两个或以上参与者(player)**在特定规则下,为实现各自的目标而互动的一种情境。每个参与者有一套策略可选,最终结果由所有人的选择共同决定。
1.2 策略(Strategy)
策略是参与者面对不同情境时的一套应对规则或行为选择。有些博弈只进行一次(一次博弈),有些博弈重复进行(重复博弈)。
1.3 支付(payoff)
每种策略组合下,每个参与者都得到一个结果(效用、得分、利益等),这就是他们的支付函数,也被称为“收益”。
1.4 信息结构
? 完全信息博弈:所有玩家都知道博弈的结构和其他玩家的策略集合及支付函数。
? 不完全信息博弈:某些信息是未知的,比如对方的类型、支付函数等。
?
二、博弈论的基本分类
2.1 按顺序划分:静态 vs 动态
? 静态博弈:玩家同时做出决策,没有人知道别人的选择(如“囚徒困境”)。
? 动态博弈:玩家依次行动,后行动者能观察前者行为(如“价格战”)。
2.2 按合作意愿:合作 vs 非合作
? 合作博弈:玩家可结成联盟,共同制定策略并分配收益。
? 非合作博弈:玩家独立决策,不能达成强制性协议。
?
三、核心博弈模型及原理
3.1 纳什均衡(Nash Equilibrium)
纳什均衡是博弈论中最重要的概念之一,由经济学家约翰·纳什提出。
定义:在一个策略组合中,每个参与者都选择了对自己最优的策略,前提是其他人都不变。此时,没有人有动机单方面改变自己的策略。
举例:囚徒困境
两名嫌疑犯被隔离审讯:
? 都沉默:各判1年;
? 一人坦白:坦白者释放,沉默者判10年;
? 都坦白:各判5年。
最优策略是坦白(尽管结果对双方都不好),这个策略组合就是一个纳什均衡。
3.2 支配策略与支配均衡
? 强支配策略:无论对方怎么选,这个策略始终给自己带来更高的收益。
? 如果所有玩家都有强支配策略,那么组合后的结果就是“支配均衡”。
3.3 混合策略博弈
在有些博弈中,没有纯策略纳什均衡,玩家采用概率策略组合。例如石头剪刀布,每个选择的概率为1\/3 是一个混合策略均衡。
3.4 重复博弈与声誉机制
现实中的很多博弈是反复进行的,比如商业竞争、人际互动。
? 单次博弈容易出现投机行为;
? 重复博弈中,玩家为了长期收益,可能选择合作;
? 声誉机制鼓励“好行为”,惩罚“背叛者”。
这解释了为什么在现实社会中合作比理论中更容易实现。
?
四、博弈论的扩展模型
4.1 不完全信息博弈:贝叶斯博弈
引入信念系统(belief System):
? 玩家不清楚对手的具体类型(比如风险偏好、资金状况),但可以基于概率分布做判断;
? 贝叶斯纳什均衡是在信念给定的前提下,每个人选择对自己最优的策略。
4.2 信号博弈与筛选博
温馨提示:亲爱的读者,为了避免丢失和转马,请勿依赖搜索访问,建议你收藏【笔趣阁】 m.3dddy.com。我们将持续为您更新!
请勿开启浏览器阅读模式,可能将导致章节内容缺失及无法阅读下一章。