博弈论基础

前言

你能在这种网站发现这篇文章说明你和我一样是一个人才。

正文

博弈论是经济学的一个分支。在OI中好像要简单的很多。

1、术语解释

合作与非合作博弈：区别在于相互发生博弈的当事人有没有具体的约束协议，如果有就说明是合作博弈。
静态与动态博弈：区别在于双方在选择中是否知道对方的决策。若不知道就是静态博弈。例:”囚徒困境”
完全信息与不完全信息博弈：区别在于在博弈过程中是否知道对方的特征、决策空间、收益空间。若知道就是完全信息博弈
我们可以将2与3条组合一下，就可以得到四种大分类：
- 完全信息静态博弈，引导出“那什均衡（Nash equilibrium)”
- 完全信息动态博弈，引导出“子博弈精炼那什均衡（subgame perfect Nash equilibrium)”
- 不完全信息静态博弈，引导出”贝叶斯那什均衡（Bayesian Nash equilibrium)”
- 不完全信息动态博弈，引导出“精炼贝叶斯那什均衡（perfect Bayesian Nash equilibrium)”
那什均衡：在策略组合中总有当其他人不改变策略时，他此时的策略时最优的。也就是说，如果他改变策略就会将自己的收益降低。那什均衡相当于博弈双方都在自己最理智的地方选择的决策点。
均衡偶：那什均衡的提出前提就是”博弈均衡偶”。若有一对策略a*（$\in \text{决策} A$)与b*($\in \text{决策} B$)，是在那什均衡（最优策略），则有任意策略a($\in \text{决策} A$),b($\in \text{决策} B$)，满足二元组对（a,b*) \le (a*,b*) \ge (a*,b)

经典模型
1. 智猪模型|那什均衡:假设猪圈中有一头大猪和一头小猪，猪圈的两头有猪槽和链接进食器的开关。按下开关就会有10个单位进入猪槽，但是按下开关需要支付2个单位的成本。如果大猪先到，那么大小猪的收益比就是9 : 1；如果小猪先到那么收益比就是6 : 4。由图可以得到小猪每次行动都是亏的。如果小猪理性他就会选择等待。而这样大猪因为不能挨饿，所以这能行动。但这也就是那什均衡的劣势，没有考虑到对方的心理是否可以做出这样的决策。

7.合作博弈|财产分配，shapley值（夏里普值）：合作博弈强调的是因为集体而产生的集体收益，被称为“联盟”与“分配”。参与者从联盟中得到的收益是各种联盟形式的最大总收益，每个参与者从联盟分配到的收益不小于单独经营所得的收益。举个例子：有一个三人分批财产，假定财产为100，a有50%决定权，b 40%，c 10%。当决定超过50%才能开始分配财产，否则三人一无所获。夏里普提出了这样的分配方式：根据他的理论联盟者先验实力被称为夏里普值。他就是在所有有可能的联盟次序下，参与者的联盟的边际贡献之和除联盟数。我们可以根据此写出上方栗子的夏里普值

所以a = 4/6,b = 1/6,c=1/6。

因此我们也可以根据这样来分配财产。

根据夏里普值，排列的顺序是等可能的。在每一个排列下，每个参与者对这个联盟有一个边际贡献。在投票博弈中这个值反映的是参与者与其他参与者结成联盟的可能性，因此夏里普值反映的是参与者的权利

下载慢，没速度，频繁报错？试试魔法喵VPN！一键提速，跑满带宽！