bitpie安卓版安装|纯策略纳什均衡

作者: bitpie安卓版安装
2024-03-07 23:24:33

关于纳什均衡,请教一下什么是纯策略均衡,什么是混合策略均衡,为什么说硬币正反是混合策略均衡? - 知乎

关于纳什均衡,请教一下什么是纯策略均衡,什么是混合策略均衡,为什么说硬币正反是混合策略均衡? - 知乎首页知乎知学堂发现等你来答​切换模式登录/注册纳什均衡 (Nash Equilibrium)关于纳什均衡,请教一下什么是纯策略均衡,什么是混合策略均衡,为什么说硬币正反是混合策略均衡?关注者26被浏览209,577关注问题​写回答​邀请回答​好问题 5​添加评论​分享​5 个回答默认排序是夏虫啊经济​ 关注(本回答只是经济学学渣的自己的理解,第一次回答问题,如有错误,麻烦指正一下)简单来说,纯策略纳什均衡指的是,参与人选择的策略是确定的。比如,在性别之战中,我们通过每个参与人的最优反应确定了该博弈的两种纯策略,即(拳击,拳击)和(芭蕾,芭蕾)。如下图所示在纯策略纳什均衡的情况下,我们只能知道具体的纳什均衡下每个参与人的收益,并无法求得参与人进行该博弈的整个的期望收益。(暂且称为期望收益吧),因为在参与人做选择时,并不知道对方会做出什么样的选择。假设我们自己为参与人1,我们就会开始想,现在我也不知道对方(参与人2)会做什么样的选择,我先假设他选择芭蕾的概率为p吧,那么他选择拳击的概率就是1-p,那么这个时候,我们自己在两种策略下的收益为如果2p>1-p,我们就会选择芭蕾,如果2p<1-p,我们就会选择拳击。我们可以画出参与人1的最优反应曲线,如下图所示E1是双方都百分百选择拳击,E2是双方都百分百选择芭蕾,也就是我们之前求出的纯策略纳什均衡,而图中的E3就是我们要算的混合策略纳什均衡。在该点U1=4/3由于博弈是对称的,U2=4/3由于参与人1在(拳击,拳击)时的收益1比选择(芭蕾,芭蕾)时的E3的收益4/3低,所以参与人1是肯定不会百分百选择E1作为均衡点的,同理,参与人2也不会百分百选择E2作为均衡点。既然参与人都可以自主选择自己的概率,那么只有在混合策略纳什均衡点E3这一个均衡。即参与人1分别以2/3和1/3的概率选择芭蕾和拳击,参与人2以1/3和2/3的概率选择芭蕾和拳击。所以在这个博弈里,只有一个混合策略纳什均衡,也就是E3点所代表的均衡。只要偏离这个点的概率,那么博弈的结果就会变为E1或者E2,这时总会有一个参与人不愿选择这样的结果,博弈无法达到均衡。所以最终寻找这个严格混合策略纳什均衡点的过程可以陈述为, 给定其他参与人的混合策略,目标参与人在可行行动中的任意随机选择都是无差异的。即令2p=1-p,q=2(1-q),这就是寻找混合策略纳什均衡的解题方式。也可以通过同时假设两个参与人的概率,写出每个参与人在假设概率下的效用,通过让双方同时效用最大化求解。但直接使用上面说的结论会比较简单。最后总结一下,在纯策略纳什均衡时,有两个纳什均衡,但博弈会达到哪个结果并不确定,而参与人总归是要选择一个策略的,在选择策略时,自己选择策略的概率是可以由自己确定的,所以我们有了混合策略纳什均衡。会有一定的预测作用,因为如果性别之战是一个长期重复的博弈,你的之前的选择总会观测到,最终对方也会根据你的习惯选择自己的策略,比如经常比赛的足球队就可以观测到对方球队的数据,并因此做出自己的最优选择,为了使自己的收益最大化,我们必须选择一个概率,让对方随机选择策略。虽然并不知道题主的硬币正反是一个什么样的问题,但混合策略纳什均衡的原理是一样的。编辑于 2022-03-20 11:27​赞同 153​​18 条评论​分享​收藏​喜欢收起​觉醒也醉了Life is an imperfect-info game​ 关注纯策略如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称为纯策略,简称“策略” ,即参与人在其策略空间中选取唯一确定的策略。混合策略如果一个策略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合策略。 参与人采取的不是明确唯一的策略,而是其策略空间上的一种概率分布。一个例子:玩家1有T,B两个动作,玩家2有L,R两个动作。收益表如下:1 \ 2LRT2, 20, 2B1, 23, 3该博弈有两个纯策略均衡和一个混合策略均衡。纯策略均衡(T, L)即玩家1采取动作T,玩家2采取动作L,此时任何一方擅自更改动作都不能使自身收益增加,故达到纳什均衡(B, R)即玩家1采取动作B,玩家2采取动作R,此时任何一方擅自更改动作都不能使自身收益增加,故达到纳什均衡混合策略均衡假设均衡策略时玩家1采取动作(T, B)的概率为(q, 1-q)此时对于玩家2来说,选择两种动作应当是无差别的,即玩家2选择动作L获得的收益2q+2(1-q)与玩家2选择动作R获得的收益2q+3(1-q)二者应当相等故q=1同理假设均衡策略时玩家2采取动作(L,R)的概率为(p, 1-p)则有2p+0(1-p)=p+3(1-p)故p=3/4故纳什均衡为玩家1以概率(1, 0)采取动作(T, B),玩家2以概率(3/4, 1/4)采取动作(L, R)发布于 2021-07-23 00:17​赞同 74​​2 条评论​分享​收藏​喜欢收起​​写回答1 个回答被折叠(为什

纯策略纳什均衡 - MBA智库百科

纯策略纳什均衡 - MBA智库百科

全球专业中文经管百科,由121,994位网友共同编写而成,共计435,710个条目

查看

条目讨论编辑 收藏

简体中文繁体中文

工具箱▼

链入页面

链出更改

上传文件 特殊页面 可打印版

永久链接

纯策略纳什均衡

用手机看条目

扫一扫,手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

纯策略纳什均衡(Pure Strategy Nash Equilibrium)

目录

1 什么是纯策略纳什均衡

2 存在纯策略纳什均衡的有限次重复博弈[1]

3 存在纯策略纳什均衡的无限次重复博弈[1]

4 参考文献

[编辑]什么是纯策略纳什均衡

  纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小。

[编辑]存在纯策略纳什均衡的有限次重复博弈[1]

  如果重复博弈中有惟一纯策略纳什均衡,那么我们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒的困境的博弈的例子:

  我们现在考虑该博弈重复两次的重复博弈,这可以理解成给囚徒两次坦白机会,最后的得益是两个阶段博弈中各自得益之和.在两次博弈过程中,双方知道第一次博弈的结果再进行二次博弈.用逆推归纳法来分析,先分析第二阶段,也就是第二次重复时两博弈方的选择.很明显,这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈,此时前一阶段的结果已成为既成事实,此后又不再有任何的后续阶段,因此实现自身当前的最大利益是两博弈方在该阶段决策中的惟一原则.

  因此我们不难得出结论,不管前一次的博弈得到的结果如何,第二阶段的惟一结果就是原博弈惟一的纳什均衡(坦白,坦白),双方得益(-5,-5).

  现在再回到第一阶段,即第一次博弈.理性的博弈方在第一阶段就对后一阶段的结局非常清楚,知道第二阶段的结果必然是(坦白,坦白),因此不管第一阶段的博弈结果是什么,双方在整个重复博弈中的最终得益,都将是第一阶段的基础上各加-5.因此从第一阶段的选择来看,这个重复博弈与图l中得益矩阵表示的一次性博弈实际上是完全等价的.

  于是我们可以得出惟一纯策略均衡的有限次重复博弈的结果就是重复原博弈惟一的纯策略纳什均衡,这就是这种重复博弈惟一的子博弈完美纳什均衡路径.

  如果重复博弈中有多个纯策略纳什均衡,设某一市场有两个生产同样质量产品的厂商,他们对产品的定价同有高(H)、中(M)、低(L)三种可能.设高价时市场总利润为10个单位,中价时市场总利润为6个单位,低价时市场总利润为2个单位.再假设两厂商同时决定价格,价格不等时低价格者独享利润,价格相等时双方平分利润.这时候两厂商对价格的选择就构成了一个静态博弈问题.我们看一个三价博弈的重复博弈的例子:

  显然,这个得益矩阵有两个纯策略纳什均衡(M,M)和(L,L),我们也可以看出实际上两博弈方最大的得益是策略组合(H,H),但是它并不是纳什均衡.现在考虑重复两次该博弈,我们采用一种触发策略(Trigger Strategy):博弈双方首先试图合作,一旦发觉对方不合作也用不合作相报复的策略.使得在第一阶段采用(H,H)成为子博弈完美纳什均衡,其双方的策略是这样的:

  博弈方1:第一次选H;如果第一次结果为(H,H),则第二次选M,如果第一次结果为任何其他策略组合,则第二次选择L.

  博弈方2:同博弈方1.在上述双方策略组合下,两次重复博弈的路径一定为第一阶段(H,H),第二阶段(M,M),这是一个子博弈完美纳什均衡路径.因为第二阶段是一个原博弈的纳什均衡,因此不可能有哪一方愿意单独偏离;其次,第一阶段的(H,H)虽然不是原来的博弈纳什均衡,但是如果一方单独偏离,采用M能增加1单位得益,这样的后果却是第二阶段至少要损失2单位的得益,因为双方采用的是触发策略,即有报复机制的策略,因此合理的选择是坚持H.这就说明了上述策略组合是这个两次重复博弈的子博弈完美纳什均衡.

  从上述的例子我们可以看出,有多个纯策略纳什均衡的博弈重复两次的子博弈完美纳什均衡路径是,第一阶段采用(H,H),第二阶段采用原博弈的纳什均衡(M,M).

  如果这个重复博弈重复三次,或者更多次,结论也是相似的,仍然用触发策略,它的子博弈完美纳什均衡路径为除了最后一次以外,每次都采用(H,H),最后一次采用原博弈的纳什均衡(M,M).

[编辑]存在纯策略纳什均衡的无限次重复博弈[1]

  与有限次重复博弈一样,无限次重复博弈也是基本博弈的简单重复,但是无限次重复博弈没有最后一次重复,因此无限次重复博弈与有限次有一些不同.

  任何博弈中博弈方策略选择的依据都是得益的大小,这在重复博弈中仍然是成立的.但是重复博弈又与一次性博弈有所不同,因为在重复博弈中,每一阶段都是一个博弈,并且各博弈方都有得益,因此对于重复博弈,我们要计算的就是博弈结束时的一个总的得益.由于前一次博弈和后一次博弈之间会有损失,因此我们采用一种方法,就是将后一阶段的得益折算成当前阶段得益的(现在值)的贴现系数δ.有了贴现系数δ,那么在无限次重复博弈中,某博弈方各阶段得益为π1,π2,...,则该博弈方总得益的现在值为:

  

  对于存在惟一纯策略纳什均衡博弈的无限次重复博弈,我们从下面的例子来看:

  其中博弈方1和博弈方2分别表示两个厂商,H和L分别表示高价和低价.显然,该博弈的一次性博弈有惟一的纯策略纳什均衡(L,L),但是这个纳什均衡并不是最佳策略组合,因为策略组合(H,H)的得益(4,4)比(1,1)要高的多.但是由于(H,H)不是该博弈的纳什均衡,所以在一次性博弈中不会被采用.根据上面的分析,此博弈在有限次重复博弈并不能实现潜在的合作利益,两博弈方在每次重复中都不会采用效率较高的(H,H).为了实现效率较高的合作利益(H,H),假设两博弈方都采用触发策略,也即报复性策略:第一阶段采用H,在第t阶段,如果前t-l阶段的结果都是(H,H),则继续采用L.假设博弈方1已经采用了这种策略,现在我们来确定博弈方2在第一阶段的最优选择.如果博弈方2采用L,那么在第一阶段能得到5,但这样会引起博弈方1一直采用L的报复,自己也只能一直采用L,得益将永远为1,总得益的现在值为

  

  如果博弈方2采用H,则在第一阶段他将得4,下一阶段又面临同样的选择.若记V为博弈方2在该重复博弈中每阶段都采用最佳选择的总得益现在值,那么从第二阶段开始的无限次重复博弈因为与从第一阶段开始的只差一 阶段,因而在无限次重复时可看作相同的,其总得益的现在值折算成第一阶段的得益为,因此当第一阶段的最佳选择是H时,整个无限次重复博弈总得益的现在值为

   或者

  因此,当 解得时,博弈方2会采用H策略,否则会采用L策略.也就是说当时,博弈方2对博弈方1触发策略的最佳反应是第一阶段采用H.这时我们就说双方采用上述触发策略是一个纳什均衡.

  于是我们得出,在有限次重复博弈中,惟一纯策略纳什均衡不能实现最大得益(H,H),而在无限次重复博弈中,通过触发策略却可以实现(H,H)。

[编辑]参考文献

↑ 1.0 1.1 陈敏.不存在纯策略纳什均衡的重复博弈.咸宁学院学报.2005年12月.第25卷第6期

来自"https://wiki.mbalib.com/wiki/%E7%BA%AF%E7%AD%96%E7%95%A5%E7%BA%B3%E4%BB%80%E5%9D%87%E8%A1%A1"

打开MBA智库App, 阅读完整内容

打开App

本条目对我有帮助63

MBA智库APP

扫一扫,下载MBA智库APP

分享到:

温馨提示

复制该内容请前往MBA智库App

立即前往App

  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目或投诉举报。

本条目相关文档

 不存在纯策略纳什均衡的重复博弈 3页 估算转换成本的纳什——伯特兰均衡模型 4页 对等网副本散布问题纯策略纳什均衡研究 4页 策略性博弈与纳什均衡 26页 博弈论及其应用-纯战略纳什均衡的应用 57页 一种n人静态博弈纯策略纳什均衡存在性判别法 5页 “纳什均衡”的启示 3页 进化稳定均衡与纳什均衡 20页 试论药品降价中的纳什均衡与占优策略均衡 2页 第十讲策略性博弈与纳什均衡 85页 更多相关文档

本条目相关课程

本条目由以下用户参与贡献

Dan,Vulture. 页面分类: 博弈论

评论(共7条)提示:评论内容为网友针对条目"纯策略纳什均衡"展开的讨论,与本站观点立场无关。

114.222.228.* 在 2013年4月9日 19:13 发表

晕。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

204.197.183.* 在 2013年4月10日 12:20 发表

114.222.228.* 在 2013年4月9日 19:13 发表

晕。

+1

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

麻吉酱 (Talk | 贡献) 在 2013年6月2日 21:12 发表

我居然看懂了!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

120.236.174.* 在 2016年1月14日 16:23 发表

我想请问一下大神,那个π指的是什么。计算方面没看懂,包括V的那部分

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

202.119.40.* 在 2017年4月8日 10:44 发表

根本看不懂 作业没法写了

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

Zarua (Talk | 贡献) 在 2017年4月18日 17:15 发表

120.236.174.* 在 2016年1月14日 16:23 发表

我想请问一下大神,那个π指的是什么。计算方面没看懂,包括V的那部分

π为某博弈方各阶段得益,V为博弈方在该重复博弈中每阶段都采用最佳选择的总得益现在值

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

180.208.58.* 在 2018年6月6日 01:54 发表

没懂啊 纳什均衡的组合怎么找出来的?

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

发表评论请文明上网,理性发言并遵守有关规定。

首页

文档

百科

课堂

商学院

资讯

知识点

国际MBA

商城

企业服务

问答

首页

专题

管理

营销

经济

金融

人力资源

咨询

财务

品牌

证券

物流

贸易

商学院

法律

人物

分类索引

 

百科VIP

百科VIP会员权益

无广告阅读

免验证复制

开通/续费百科VIP

登录

消息

昵称未设置

百科VIP

未开通

收藏夹

账号安全中心

我的页面

我的贡献

我的讨论页

我的设置

退出登录

打开APP

导航

最新资讯

最新评论

最新推荐

热门推荐

编辑实验

使用帮助

创建条目

随便看看

本周推荐

最多推荐

生产线包装印刷宗庆后消费经济纪梵希第一性原理智能卡批发食品软预算约束

奶头乐理论蘑菇管理定律猴子管理法则情绪ABC理论垃圾人定律100个最流行的管理词汇破窗效应INFPSWOT分析模型21天效应

以上内容根据网友推荐自动排序生成

下载APP

此页面最后修订:12:52,2010年9月14日.

智库首页 -

百科首页 -

关于百科 -

客户端 -

人才招聘 -

广告合作 -

权利通知 -

联系我们 -

免责声明

- 友情链接

©2024 MBAlib.com, All rights reserved.

闽公网安备 35020302032707号

意见反馈

问题分类

类型

反馈内容

添加图片(选填)0/9

联系方式

取消

提交

提交成功

反馈结果请前往 MBA智库App 查看 (我的 > 帮助与反馈 > 我的反馈)

知道了

纯策略纳什均衡_百度百科

什均衡_百度百科 网页新闻贴吧知道网盘图片视频地图文库资讯采购百科百度首页登录注册进入词条全站搜索帮助首页秒懂百科特色百科知识专题加入百科百科团队权威合作下载百科APP个人中心纯策略纳什均衡播报讨论上传视频术语收藏查看我的收藏0有用+10本词条缺少概述图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小。中文名纯策略纳什均衡 [1]外文名Pure Strategy Nash Equilibrium定    义在一个纯策略组合中,如果给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小类    型术语引证解释如果重复博弈中有惟一纯策略纳什均衡,那么我们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒的困境的博弈的例子:我们现在考虑该博弈重复两次的重复博弈,这可以理解成给囚徒两次坦白机会,最后的得益是两个阶段博弈中各自得益之和.在两次博弈过程中,双方知道第一次博弈的结果再进行二次博弈.用逆推归纳法来分析,先分析第二阶段,也就是第二次重复时两博弈方的选择.很明显,这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈,此时前一阶段的结果已成为既成事实,此后又不再有任何的后续阶段,因此实现自身当前的最大利益是两博弈方在该阶段决策中的惟一原则.因此我们不难得出结论,不管前一次的博弈得到的结果如何,第二阶段的惟一结果就是原博弈惟一的纳什均衡(坦白,坦白),双方得益(-5,-5).现在再回到第一阶段,即第一次博弈.理性的博弈方在第一阶段就对后一阶段的结局非常清楚,知道第二阶段的结果必然是(坦白,坦白),因此不管第一阶段的博弈结果是什么,双方在整个重复博弈中的最终得益,都将是第一阶段的基础上各加-5.因此从第一阶段的选择来看,这个重复博弈与图l中得益矩阵表示的一次性博弈实际上是完全等价的. [1]新手上路成长任务编辑入门编辑规则本人编辑我有疑问内容质疑在线客服官方贴吧意见反馈投诉建议举报不良信息未通过词条申诉投诉侵权信息封禁查询与解封©2024 Baidu 使用百度前必读 | 百科协议 | 隐私政策 | 百度百科合作平台 | 京ICP证030173号 京公网安备110000020000

第五章 博弈论(1):纯策略纳什均衡 - 知乎

第五章 博弈论(1):纯策略纳什均衡 - 知乎首发于微观经济学Plus—数理分析切换模式写文章登录/注册第五章 博弈论(1):纯策略纳什均衡君子终日乾乾上海社会科学院从本章开始,我们的研究将不再针对孤立的个体,而是转而考察两个或多个参与人之间的策略互动。博弈论是考察策略互动的基本工具。本章仅对博弈论做简单的介绍,如果想要详细学习,请参阅相关专业书籍。1. 纯策略纳什均衡1.1 博弈的三要素博弈的第一个要素是参与人(players),即参与博弈的每一个决策者。参与人可以是个人、组织(企业、党派),也可以是国家。参与人可以在可行的行动集合中进行选择。本章主要研究两方博弈:即只有参与人1和参与人2的博弈。博弈的第二个要素称作策略(strategy),即参与人在博弈过程中所采取的行动。令 S_i 表示参与人 i(i=1,2,…,n) 的策略集, s_j∈S_i 表示策略集 S_i 中的某一特定策略。博弈的第三个要素是支付(payoff,也称收益、得益),可以用参与人在博弈中获得的效用水平或利润来衡量。在两方博弈中, u_1 (s_1,s_2) 表示参与人1选择策略 s_1 ,参与人2选择策略 s_2 时,参与人1的支付或收益。1.2 纯策略纳什均衡市场均衡是指,市场供给等于市场需求,每一个市场参与者都没有动力改变其行为。博弈论借助了这一概念。博弈论中的纳什均衡(Nash equilibrium)是指:对于每一个参与人,一旦做出了选择,就没有动力再做出改变。换言之,在给定其他参与人的策略后,纳什均衡的策略就是该参与人的最优选择。下面给出了纳什均衡的一个数学定义。在一个两方博弈中,如果给定参与者2的策略为 s_2^* ,参与人1不可能有比现有策略 s_1^* 收益更高的策略 s_1 。即:类似地,如果给定参与者1的策略为 s_1^* ,参与人2不可能有比现有策略 s_2^* 收益更高的策略 s_2 。即:很显然,此时两个参与人都没有动力再改变自己的决策。策略组合 (s_1^*,s_2^* ) 就是该博弈的纳什均衡。[1]下面我们将使用两个例子,告诉读者如何寻找纯策略纳什均衡。对于博弈要素和纯策略纳什均衡的更一般的数学定义如下:一个策略博弈包括:(1)参与人集合N;(2)对每个参与人 i∈N ,都有一个非空集合 S_i 作为其策略集, s_j 为其中的元素,表示某种策略选择,并定义一个行动组合 s=(s_j )_{j∈N} 表示博弈的结果;(3)对每个参与人 i∈N ,都有一个定义在集合 S=×_{j∈N} S_j (表示 S_1,S_2,…S_N 构成的集合组)上的偏好。换言之,参与人i不仅要考虑自己的行动,还要考虑其他参与人的行动。支付函数(或效用函数) u_i (.) 是定义偏好关系的一种映射。综合上述三个要素,一个策略博弈可以表示为 ⟨N,S_i,u_i⟩ 。策略博弈 ⟨N,S_i,u_i⟩ 的纳什均衡是一个行动组合 s^*∈S ,对于每一个参与人 i∈N ,都有其中, s_{-i} 表示除参与人i之外其他参与人的行动策略。也就是说,纳什均衡意味着:给定其他人的行动策略,参与人i没有任何激励去偏离自身的行动 s_i^* 。纳什均衡的另一种定义方法是:对于任一 s_{-i}∈S_{-i} ,定义最优反应函数 B_i (s_{-i}) 为参与人i在给定 s_{-i} 下的最优行动集合:纳什均衡即一个行动组合 s^* ,满足 s_i^*∈B_i (s_{-i}^* ),∀i∈N 。理论上,若 B_i 是一个单值函数,所有人的反应函数可以构成一个N元方程组,这个方程组的解就是纳什均衡。对于若支付函数连续、可微的情形,也可以使用导数方法描述纳什均衡。如果一个行动组合 (s_i^*,s_{-i}^* ) 是博弈 ⟨N,S_i,u_i⟩ 的纳什均衡,则它一定是方程的解。这是判断一个行动组合是否为纳什均衡的必要条件。若 (s_i^*,s_{-i}^* ) 是的唯一解,且 ∀i∈N ,都有那么行动组合 (s_i^*,s_{-i}^* ) 是博弈 ⟨N,S_i,u_i⟩ 的纳什均衡。1.3 囚徒困境假设张三和李四因犯罪而被捕入狱。警察要对他们进行隔离审讯。警察分别审问了张三和李四:“坦白从宽,抗拒从严!如果你老实交代,并且交代同伙,你会被判处1年有期徒刑(假设被判处1年有期徒刑的效用为10),而你的同伙将要面临20年有期徒刑的惩处(假设被判处20年有期徒刑的效用为1)。如果你不承认而你的同伙承认了,你将面临20年有期徒刑。如果你们都承认了,你们将被判处3年有期徒刑(假设被判处3年有期徒刑的效用为5)。如果都不承认,你们将被判处2年有期徒刑(假设被判处2年有期徒刑的效用为8)”假设张三和李四都是完全的利己主义者,只考虑自己的利益。那么他们将如何决策,坦白还是不坦白?很显然,博弈双方的策略集都是{坦白,不坦白}。我们可以将这个问题转化为如下的矩阵形式:其中,括号里的前一个数字表示参与者1(张三)的收益,后一个数字则表示参与者2(李四)的收益。请注意,这个收益矩阵(也称支付矩阵、得益矩阵)和线性代数中的矩阵不同,它实际上是两个参与者的两个“真”收益矩阵的结合:那么该如何找到这个博弈的纳什均衡呢?一种便捷的方法是:在矩阵中最优反映对应的收益下面划线。我们下面以囚徒困境为例,向读者介绍这种方法。我们先从张三的视角观察。假定李四坦白(第一行),那么张三的占优策略(dominant strategy,俗称“上策”)是坦白——因为坦白的收益5大于不坦白的收益1。为此,我们在5下面画一条横线:类似地,假定李四不坦白(第二行),那么张三的占优策略是坦白——坦白的收益是10,大于不坦白的收益8。因此,我们在10下面画一条线:现在从李四的视角观察。假定张三坦白(第一列),那么李四的占优策略是坦白——因为坦白的收益5大于不坦白的收益1。因此,我们在5下面画一条线:假定张三不坦白(第二列),那么李四的占优策略是坦白——因为坦白的收益10大于不坦白的收益8。因此,我们在10下面画一条线:对所有的占优策略划线后,就可以得到纳什均衡——收益下面全部划线的策略组合(坦白,坦白)。(坦白,坦白)是该博弈的唯一纳什均衡。1.4 夫妻博弈夫妻博弈描述了这样一个故事:妻子(参与人1)和丈夫(参与人2)都希望今晚共度良宵。但是两人对于晚上看什么电视节目产生了分歧。妻子更希望欣赏芭蕾舞,而丈夫更希望观看足球比赛。这个博弈的规范型可以用下面这个矩阵表示:我们仍然使用下划线法解出这个博弈的纳什均衡。从妻子的角度来看,如果丈夫选择欣赏芭蕾(第一行),那么妻子的最优选择也是欣赏芭蕾(2>0)。因此我们在2下方画一条横线:如果丈夫选择观看足球(第二行),那么妻子的最优选择是观看足球(0<1)。因此在1下方画一条横线:从丈夫的角度来看,如果妻子欣赏芭蕾(第一列),丈夫的最优选择也是欣赏芭蕾(1>0),因此在1下方画一条线:如果妻子观看足球(第二列),丈夫的最优选择也是观看足球(2>0),因此在2下方画一条线:请注意,夫妻博弈有两个纳什均衡:夫妻都欣赏芭蕾,或者都观看足球,因此我们不能给出有关博弈结果的任何定论。同时也要注意到:这个博弈不存在某种占优策略——一个人的选择是完全跟着另一个人走的。总之,纳什均衡不一定是唯一的:一个博弈有可能有多个纯策略纳什均衡,也有可能没有纯策略纳什均衡。前情提要:点击下方链接,欢迎咨询购书(微观经济学、宏观经济学、微观经济学数理分析)、经济学考研等事宜。初级经济学请关注: 编辑于 2023-06-28 16:05・IP 属地上海博弈论微观经济学尼科尔森《微观经济理论-基本原理与扩展》(第 11 版)课后习题详解(书籍)​赞同 13​​1 条评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录微观经济学Plus—数

第六章:纯策略纳什均衡-CSDN博客

>

第六章:纯策略纳什均衡-CSDN博客

第六章:纯策略纳什均衡

最新推荐文章于 2023-12-24 22:45:55 发布

捌椒

最新推荐文章于 2023-12-24 22:45:55 发布

阅读量1.2w

收藏

26

点赞数

3

分类专栏:

博弈论与机制设计

文章标签:

纯策略纳什均衡

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/qq_40926887/article/details/117154258

版权

博弈论与机制设计

专栏收录该内容

19 篇文章

44 订阅

订阅专栏

这里写目录标题

前言1. 纳什均衡相关概念1.1 纳什均衡1.2 纯策略纳什均衡1.3 最优反应对应1.4 求解最优反应案例1.4.1 案例 一1.4.2 案例二

2. 纯策略纳什均衡案例2.1 案例三2.2 案例四2.3 案例五

3. 不存在纯策略纳什均衡的博弈3.1 案例六

4. 存在多个纳什均衡情况参考

前言

注意:纳什均衡未必是优势策略。

1. 纳什均衡相关概念

1.1 纳什均衡

尺寸纳什均衡是指

n

n

n 个参与人的一个策略组,使得每个参与人的选择对所有其他参与人的纳什均衡策略来说都是最优反应任一参与人单方面偏离纳什均衡策略,都不能使他自己的状况变好,这里的单方面指的是除了他之外,其他所有参与人都不偏离纳什均衡策略。

1.2 纯策略纳什均衡

每个参与人的纳什均衡策略是其他参与人纳什均衡策略的最优反应

1.3 最优反应对应

b

i

(

s

i

)

b_i(s_{-i})

bi​(s−i​)是由参与人 i 的所有最优反应策略组成的集合。

1.4 求解最优反应案例

1.4.1 案例 一

1.4.2 案例二

2. 纯策略纳什均衡案例

2.1 案例三

2.2 案例四

2.3 案例五

3. 不存在纯策略纳什均衡的博弈

3.1 案例六

4. 存在多个纳什均衡情况

在前面,我们已经看到,一些博弈存在多个纳什均衡。如果一个博弈有多个纳什均衡,那么一个基本问题出现了?

哪个均衡将得以实施?

谢林认为,任何能让参与人聚焦到某个均衡的事情,都能使他们预期这个均衡将发生,从而实施这个均衡,这类似自我实现的预言。这样的均衡有着区别千其他所有均衡的性质,它有自己的名称,叫做焦点均衡(focal equilibrium)或谢林点(Schelling point)。

参考

《博弈论与机制设计》中国人民大学出版社,经济科学译丛

优惠劵

捌椒

关注

关注

3

点赞

26

收藏

觉得还不错?

一键收藏

知道了

1

评论

第六章:纯策略纳什均衡

前言1. 纳什均衡概念1.1 纯策略纳什均衡1.2 最优反应对应案例案例二1.3 纯策略纳什均衡案例案例三案例四案例五参考《博弈论与机制设计》中国人民大学出版社,经济科学译丛

复制链接

扫一扫

专栏目录

纯策略纳什均衡.doc

10-07

纯策略纳什均衡.doc

Nash-Equilibrium:查找给定网格的纳什均衡

05-12

纳什均衡

在博弈论中,纳什均衡是具有以下特性的一组策略:给定彼此的玩家策略是恒定的,没有玩家可以为了更高的平均支出而偏离其策略。

该程序可以计算纯策略和混合策略的纳什均衡。 在纯策略中,每个玩家只能玩一招。 在混合策略中,每个玩家可以玩具有不同概率的多个动作。

要运行该程序,请提供一个输入文件作为第一个参数,并选择策略作为第二个参数。 例如

python nash_eq.py file.txt -p

-p打印纯策略纳什均衡。 -m打印混合策略纳什均衡。

输入文件具有以下格式:

1,1 1,2 1,3

2,1 2,2 2,3

3,1 3,2 3,3

行代表玩家1的移动,而列代表玩家2的移动。 每对(行,列)代表玩家相应动作的支出。 第一个值是玩家1的支出,第二个值是玩家2的支出。

该程序需要numpy。

1 条评论

您还未登录,请先

登录

后发表或查看评论

博弈论中:纳什均衡、纯策略纳什均衡、混合策略纳什均衡、占优策略

最新发布

阿齐Archie

12-24

1578

解释博弈论中:纳什均衡、纯策略纳什均衡、混合策略纳什均衡、占优策略

纳什均衡

Anne033的博客

07-23

7187

有效率的纳什均衡、无效率的纳什均衡

第十一章:纳什均衡的计算

捌椒的博客

05-23

2万+

A\∅ 表示集合A除去空集所得到的集合

1. 静态,完全信息下的纳什均衡求解

第一步【严格劣策略删除】

解析:即无论其他玩家 怎么选择策略,玩家 iii 选择的该策略后获得的利益,都比选择其他策略要低。那么这个策略就是严格劣策略的,显然,玩家 iii 不会选

假设玩家 1 选择策略 B ,那么,显然,无论玩家 2 选择任何策略,玩家 1 选择 T 策略都比 B 策略要好,(2>1)(1>0)(4>3)。

这时,对于玩家 1 而言,B 就是 T 的一个严格劣策略,将.

纯策略纳什均衡与混合策略纳什均衡的比较

捌椒的博客

05-22

1万+

纯策略纳什均衡(PSNE)这个核心概念

一个纯策略纳什均衡就是一个策略组 (s1∗,…,sn∗)(s_1^* , …,s_n^*)(s1∗​,…,sn∗​), 它使得任何参与人单方面偏离自己的均衡策略都无利可图(单方面偏离是指仅有某个参与人偏离而其他参与人不偏离他们的均衡策略)。

我们也可将纯策略纳什均衡定义为一个策略组(s1∗,…,sn∗)(s_1^* , …,s_n^*)(s1∗​,…,sn∗​), 它使得每个参与人的策略si∗s_i^*si∗​ 都是对其他参与人均衡策略s−i∗s_{-i}^*s−

纳什均衡定义、举例、分类

不务正业的程序媛的博客

07-08

2万+

纳什均衡

纳什均衡在不同的领域的定义不尽相同,但是中心思想是相同的,即在非合作博弈中,双方为使自己利益最大化,而最终达到的一个均衡状态。在这个状态下,当所有其他人不改变策略,任意一方也不会(没有理由/动力)改变自己的策略。这时的策略组合也就是纳什均衡。

下面是百度百科中有关纳什均衡的定义:

纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任

纳什均衡 (Nash Equilibrium)

12-14

1万+

概念

“纳什均衡“是由美国数学家小约翰·福布斯·纳什(John Forbes Nash Jr),在1950年获得美国普林斯顿大学的博士学位的只有28页的博士论文中提出的一个“博弈论”的概念,根据纳什的说法,“一个纳什平衡点是当其余参与者的策略保持不变时,能够令参与者的混合策略最大化其收益的一个n元组”。[1]

“纳什均衡“广泛运用在经济学、计算机科学、演化生物学、人工智能、会计学、政策和军事理论等方面。1994年,纳什和其他两位博弈论学家约翰·海萨尼和莱因哈德·泽尔腾共同获得了诺贝尔经济学奖。[2]

第六章:纯策略纳什均衡【小结】

捌椒的博客

11-16

849

这里写目录标题1. 最大最小值2. 最小最大值【*注意 iii 是被迫的*】3. 纯策略纳什均衡小结参考

1. 最大最小值

2. 最小最大值【注意 iii 是被迫的】

3. 纯策略纳什均衡小结

参考

《博弈论与机制设计》中国人民大学出版社,经济科学译丛

...

混合策略纳什均衡——附例题及解析

ThePythonFucker的博客

04-13

2万+

目录

引入

混合纳什均衡

例题

求法

引入

假设这样一种对局,甲乙两人抽扑克牌,扑克牌只有两种花色,红和黑,两张牌花色相同算甲胜,反之乙胜,那么甲乙双方应该如何设定自己抽出不同花色的概率呢?

比如,设甲抽红牌的概率P=60%,那么黑牌概率就是1-P=40%,这样显然不合理

因为B会发现甲出红牌的概率明显大于黑牌,干脆B全出黑牌,这样就有60%的情况是B胜,A显然赢不了

根据生活经验我们很容易推测出P应该取50%,这样B全出一种牌最终获胜的概率也是50%,这样对B来说没有任何优势,很符合

首都师范 博弈论 3 1 4纯策略纳什均衡

枫林晚的博客

08-31

257

3 1 4纯策略纳什均衡

纳什均衡计算,纳什均衡计算公式,matlab

09-10

本代码用于求解多方非合作博弈的纳什均衡解

数学建模暑期集训14:博弈论与纳什均衡

兴趣使然的创作者

07-25

6113

前言

博弈论的内容在数学建模中比较少见,但2020年国赛B题确实考到了这一部分,因此掌握一些基本的原理方法还是有所必要。并且,博弈论本身和模糊综合评价类型比较类似,都是难度不高,不太依赖编程的方法,掌握一下性价比很高。

1.博弈概述

1.1博弈的定义:

博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略 (行动),以实现利益最大化的过程。

所谓利益最大化,就是纯粹用理性思维,做一个“精致的利己主义者”,摒弃感性思维。

(当然,这是为了分析问题的方便,生活中还

读书笔记:《MBA 轻松读(第二辑):博弈论》

每一个不曾起舞的日子,都是对人生的辜负。

10-05

1278

基础篇

单阶段博弈

chap1.1 囚徒困境

在被称为"囚徒困境"的一对一单次同时博弈之中,如果各参与者都选择占优策略,就会导致比合作更坏的情况。

使占优策略失效的方法:

对被背叛者施加惩罚

增加博弈(交易)次数

chap1.2 纯策略纳什均衡

纳什均衡指的是所有参与者"在考虑到其他参与者采取策略的前提下选择自己最合适的策略"的状态。这种均衡并非只有一个,往往存在多个。在满足纳什均衡的状态下,任何参与者打破均衡采取其他的策略都会使自身收益受损害,因此这种稳定的状态会一直持续下去。

纳什均衡就是:

纳什均衡(Nash equilibrium)及经典案例

热门推荐

Briwisdom的博客

11-11

6万+

纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。

纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡定存在。

以两家公司的价格大战为例,价格大战存在着两败俱伤的可能,在对方不改变价格的条件下既不能提价,否则会进...

纳什均衡及经典案例(2)

Briwisdom的博客

09-15

5341

问题1, 共享单车的模式赚钱并不快,几百亿的资金投入,到底要多少年能回本?为什么明明投入已经超过了预期回报,各路资金还是疯狂进入这个行业呢?问题2,历史上两个国家即将交战,经常出现一个国家选择和解让步方式收场,偶尔和谈失败导致战争。这种现象有什么规律吗?怎么解释这种现象。

python博弈论_通过几个例子理解博弈论与纳什均衡

weixin_39602005的博客

12-05

1162

喜欢玩德州扑克的人应该都听说过“GTO”这个词。GTO,即 GameTheory Optimal,翻译成中文应该叫做“游戏理论最优化”。直接翻译过来有点拗口,通俗一点的解释可以是:在游戏中,你可以采取一种最优策略,使得自己的损失最小,同时游戏中的对手也必须采取相对应的策略,否则只会扩大你的受益。讲到GTO,就不得不提到博弈论中非常著名的一个理论:纳什均衡(Nash Equilibrium)。该理论...

三十分钟理解博弈论“纳什均衡” -- Nash Equilibrium

weixin_30663391的博客

03-20

4795

欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld。

技术交流QQ群:433250724,欢迎对算法、技术感兴趣的同学加入。

纳什均衡(或者纳什平衡),Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。

约翰·纳什,生于1928年6月13日。著名经济学家、博弈论创始人、《...

两个人玩石头剪刀布,是否存在纯策略纳什均衡?混合策略纳什均衡?

06-05

在石头剪刀布这个游戏中,存在纯策略纳什均衡。纯策略纳什均衡是指在游戏中所有玩家都采取最优策略的情况下,无法通过改变自己的策略来获得更好的收益。

在石头剪刀布中,存在两个纯策略纳什均衡点:玩家1出石头,玩家2出剪刀;玩家1出剪刀,玩家2出布。

而混合策略纳什均衡是指在游戏中,玩家通过以一定的概率选择不同的纯策略,使得对手无法通过改变自己的策略来获得更好的收益。在石头剪刀布中,也存在混合策略纳什均衡。具体来说,玩家1和玩家2都应该以相等的概率出石头、剪刀和布,这样才能达到混合策略纳什均衡。

“相关推荐”对你有帮助么?

非常没帮助

没帮助

一般

有帮助

非常有帮助

提交

捌椒

CSDN认证博客专家

CSDN认证企业博客

码龄6年

暂无认证

201

原创

1万+

周排名

7547

总排名

65万+

访问

等级

3530

积分

3212

粉丝

386

获赞

109

评论

1993

收藏

私信

关注

热门文章

Chrome插件安装办法【手机端】

45893

Word生成插图清单、附表清单

38715

Potplayer固定窗口尺寸【播放下一视频时】

28554

word/ppt 中怎么在数字字母上面加横线、波浪线、箭头等符号

25481

第十一章:纳什均衡的计算

22505

分类专栏

Android

1篇

微服务

11篇

Java基础知识

17篇

数据库

8篇

Linux

29篇

Leetcode

6篇

Redis

4篇

小知识

8篇

强化学习

4篇

深度学习

12篇

机器学习

15篇

数据分析

27篇

Python

19篇

博弈论与机制设计

19篇

office

19篇

智能算法

7篇

Eclipse

10篇

项目源代码

1篇

物联网优化

9篇

最新评论

如何使用visio画网格

久别~:

为啥我按照博主的步骤画,出来的效果怎么感觉像是原来正方形的复制粘贴,组合成的网格,移动时只能一个小网格的移动?

将将 MINLP 问题松弛为 LP 问题的一种方法:McCormick包络【McCormick_envelopes】

lihaochong:

请问一下第一张图上面的convex underestimators为啥是两条折线组成的,这条线是什么意思?

将将 MINLP 问题松弛为 LP 问题的一种方法:McCormick包络【McCormick_envelopes】

黑暗中的彩虹:

想请教一下?如果用Gurobi编写程序,那么还需要添加w=xy这一非凸约束吗?我在建模的时候,没有添加这一约束,在输出结果中发现w并不等于xy

Word生成插图清单、附表清单

weixin_47923246:

你好,最后一张图片中“插图清单”这四个字怎么显示呢,我按照步骤来却不显示

数据分析之Numpy取消numpy科学计数法【详解np.set_printoptions()】

weixin_48416499:

整数部分超过10位数,没有效果

您愿意向朋友推荐“博客详情页”吗?

强烈不推荐

不推荐

一般般

推荐

强烈推荐

提交

最新文章

Android项目结构讲解【超详细】

Word学习笔记之【链接到前一条页眉】

SpringCloud基础知识【Hystrix熔断器】

2024年1篇

2023年1篇

2022年101篇

2021年50篇

2020年58篇

目录

目录

分类专栏

Android

1篇

微服务

11篇

Java基础知识

17篇

数据库

8篇

Linux

29篇

Leetcode

6篇

Redis

4篇

小知识

8篇

强化学习

4篇

深度学习

12篇

机器学习

15篇

数据分析

27篇

Python

19篇

博弈论与机制设计

19篇

office

19篇

智能算法

7篇

Eclipse

10篇

项目源代码

1篇

物联网优化

9篇

目录

评论 1

被折叠的  条评论

为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

祝福语

请填写红包祝福语或标题

红包数量

红包个数最小为10个

红包总金额

红包金额最低5元

余额支付

当前余额3.43元

前往充值 >

需支付:10.00元

取消

确定

下一步

知道了

成就一亿技术人!

领取后你会自动成为博主和红包主的粉丝

规则

hope_wisdom 发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额

0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

三十分钟理解博弈论“纳什均衡” - 知乎

三十分钟理解博弈论“纳什均衡” - 知乎切换模式写文章登录/注册三十分钟理解博弈论“纳什均衡”大蟹科技互联网/通信/经济规律/博弈论/java/区块链本文出自Bin的专栏blog.csdn.net/xbinworld纳什均衡(或者纳什平衡),Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。约翰·纳什,生于1928年6月13日。著名经济学家、博弈论创始人、《美丽心灵》男主角原型。前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家(经济学家,约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。纳什的人生非常曲折,一度学术成果不被认可,甚至换上严重的精神分裂症,在爱的力量下在很多年后奇迹般地恢复,并最终获得诺内尔经济学奖。影片《美丽心灵》(A Beautiful Mind)是一部改编自同名传记而获得奥斯卡金像奖的电影,影片以约翰·纳什与他的妻子艾莉西亚(曾离婚,但2001年复婚)以及普林斯顿的朋友、同事的真实感人故事为题材,艺术地重现了这个爱心呵护天才的传奇故事。纳什均衡定义经济学定义[3]所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。数学定义纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。注:经济学定义从字面上还是相对比较好理解的;这里稍微解释一下数学定义,博弈论也称Game Theory,一场博弈用G表示,Si表示博弈方i的策略,ui表示收益。因此,纳什均衡的意思是:任何一方采取的策略都是对其余所有方采取策略组合下的最佳对策;当所有其他人都不改变策略时,为了让自己的收益最大,任何一方都不会(或者无法)改变自己的策略,这个时候的策略组合就是一个纳什均衡。纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。以两家公司的价格大战为例,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。纳什均衡案例以下介绍几个经典的纳什均衡案例[2][4],因为本文主要是以科普为主,所以案例不会涉及到复杂深奥的经济学问题(事实上,我也不懂,哈~)。(1)囚徒困境假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。此时产生了两个嫌疑人之间的一场博弈:表中的数字表示A,B各自的判刑结果。博弈论分析中一般都用这样的表来表示。该案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。注:亚当·斯密的理论(“看不见的手”原理),在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。(2)智猪博弈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。(3)普通范式博弈GOO公司和SAM公司是某手机产品生态的两大重量级参与者,双方在产业链的不同位置上各司其职且关系暧昧,有时也往往因商业利益和产品影响力的争夺而各怀异心。二者的收益也随着博弈的变化而不断更替。上图表格模拟了两家公司的博弈现状,双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的分数(收益),每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益。博弈是同时进行的,一方参与者必须站在对方的角度上来思考我方的策略选择,以追求收益最大化。这在博弈论里称作Putting yourselves into other people’s shoes。现在我们以GOO公司为第一人称视角来思考应对SAM公司的博弈策略。假如SAM公司选择合作,那么我方也选择合作带来的收益是3,而我方选择背叛带来的收益是5,基于理性的收益最大化考虑,我方应该选择背叛,这叫严格优势策略;假如SAM公司选择背叛,那么我方选择合作带来的收益是-3,而选择背叛带来的收益为-1,为使损失降到最低,我方应该选择背叛。最后,GOO公司的分析结果是,无论SAM公司选择合作还是背叛策略,我方都必须选择背叛策略才能获得最大化的收益。同理,当SAM公司也以严格优势策略来应对GOO公司的策略选择时,我们重复上述分析过程,就能得出结论:无论GOO公司选择合作还是背叛策略,SAM公司都必须选择背叛策略才能获得最大化收益。最后我们发现,本次博弈的双方都采取了背叛策略,各自的收益都为-1,这是一个比较糟糕的结局,尽管对任何一方来说都不是最糟糕的那种。这种局面就是著名的“囚徒困境”。但是,博弈的次数往往不止一次,就像COO与SAM公司双方的商业往来也许会有很多机会。当二者经历了多次背叛策略的博弈之后,发现公式上还有一个(3,3)收益的双赢局面,这比(-1,-1)的收益结果显然要好很多,因此二者在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略。这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。由此可见,随着次数(博弈性质)的变化,纳什均衡点也并非唯一。(4)饿狮博弈假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。推理结果如下图: 但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的答案变成了狮子A敢吃掉绵羊。对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。(5)硬币正反你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是3x + (-2)(1-x)=(-2) * x + 1*( 1-x )——解方程得x=3/8;同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)——解得y也等于3/8。于是,我们就可以算美女每次的期望收益是: (1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是说,双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。比如你用完全随机(1/2,1/2)策略,收益是1/2(3/8 * 3 + 5/8 * (-20)) + 1/2(3/8 * (-2) + 5/8 * 1) = -1/8;实际上,不论你用什么策略,你的收益都是-1/8,也就是说,随便玩一种策略,你都是在纳什均衡状态中的,所以,这个把戏你随便怎么玩,都是亏的。这个例子中是没有纯战略纳什均衡的,因为只出一种策略,肯定有一方要亏钱,所以并不是其均衡状态(明明只要换一边就可以赚钱了,所以不是最佳策略);而混合纳什均衡是纯在的,事实上,Nash告诉我们“每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在”,如果美女出(3/8,5/8)这个方案,另一边任何玩法都是期望收益一样的,也就满足了纳什均衡的条件。参考资料[1] http://baike.baidu.com/view/52630.htm,百度百科:约翰·纳什 [2] http://baike.baidu.com/view/28460.htm,百度百科:纳什均衡 [3] 高鸿业.西方经济学(微观部分)第五版:人民大学出版社,2011:292-296 [4] http://www.vccoo.com/v/7074d4,一般人也能看懂的纳什均衡案例发布于 2018-08-07 13:19​赞同 433​​29 条评论​分享​喜欢​收藏​申请

博弈论笔记(二):混合策略博弈及其纳什均衡 - 知乎

博弈论笔记(二):混合策略博弈及其纳什均衡 - 知乎首发于博弈论笔记切换模式写文章登录/注册博弈论笔记(二):混合策略博弈及其纳什均衡少侠南大AI研究生一、引言前面,我们学习了策略式博弈的纳什均衡。每个玩家可选的策略也叫纯策略。在前面讲的纳什均衡中,每个玩家都要选定一个纯策略。但有的时候并不能找到一个纯策略的纳什均衡,举例如下:没有纯策略纳什均衡还有一个常见的例子:石头剪刀布,就没有纯策略的纳什均衡。这个时候,需要引入新的概念——混合策略。二、混合策略博弈以石头剪刀布为例,无论双方采用哪种策略组合,输的一方总可以改变策略使自己反败为胜,因此没有纯策略的纳什均衡。通过引入“随机性”来解决这个问题。通俗地解释,混合策略就是在纯策略上加上概率,在一次博弈中,玩家随机地选择一种纯策略。1. 混合策略1)纯策略在前面的一节学习了纯策略的表示:玩家i的策略集A_{i}=\left\{a_{i 1}, a_{i 2}, \ldots, a_{i n_{i}}\right\},纯策略a_i \in A_i。2)混合策略混合策略是给每个纯策略分配一个概率,一个玩家的策略集就是一个“样本空间”。用\Delta(A_i)表示A_i上的概率分布,即: \mathbf{\Delta}\left(\boldsymbol{A}_{\boldsymbol{i}}\right)=\left\{p_{i}=\left\{p_{i 1}, p_{i 2}, \ldots, p_{i n_{i}}\right\}, p_{i j} \geq 0, \sum_{j} p_{i j}=1\right\} \\ 那么,混合策略p_{i}=\left(p_{i 1}, p_{i 2}, \ldots, p_{i n_{i}}\right) \in \mathbf{\Delta}\left(A_{i}\right)3)混合策略博弈结果混合策略博弈的博弈结果\boldsymbol{p}=\left(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \ldots, \boldsymbol{p}_{N}\right), p_{i} \in \Delta\left(A_{i}\right)定义p_{-i}=\left(p_{1}, \ldots, p_{i-1}, p_{i+1}, \ldots, p_{N}\right),则p=\left(p_{i}, p_{-i}\right)2. 期望收益在这样一个“随机”的博弈中,收益如何计算呢?这就需要计算期望的收益了。期望的收益就是纯策略的博弈结果的收益乘上这个结果出现的概率,对每个博弈结果进行求和。给定一个策略式博弈G=\left\{N,\left\{A_{i}\right\},\left\{u_{i}\right\}\right\}和一个混合策略博弈结果p=\left(p_{1}, p_{2}, \dots, p_{N}\right),玩家i的期望收益是 \begin{array}{l} U_{i}(p)=\sum_{a \in A} p(a) u_{i}(a) \\ =\sum_{a=\left(a_{1}, \ldots, a_{N}\right) \in A} p_{1}\left(a_{1}\right) \times \cdots \times p_{N}\left(a_{N}\right) u_{i}(a) \end{array} \\(假设每个玩家的决策是独立的,因此是每个玩家的相应策略的概率乘积)3. 形式化——混合策略博弈 G=\left\{N,\left\{\Delta\left(A_{1}\right), \Delta\left(A_{2}\right), \ldots, \Delta\left(A_{N}\right)\right\},\left\{U_{1}, U_{2}, \ldots, U_{N}\right\}\right\} \\4. 例子在下面的博弈中,假设\pi_1=0.4,\pi_2=0.5是策略U和策略L的概率,那么:三、混合策略纳什均衡1. 定义:混合策略纳什均衡(MNE)一个混合策略博弈结果p=\left(p_{1}, p_{2}, \dots, p_{N}\right)是一个混合策略纳什均衡(mixed strategy Nash equilibrium),当对于每个玩家i,都有: U_{i}\left(p_{i}, p_{-i}\right) \geq U_{i}\left(p_{i}^{\prime}, p_{-i}\right) \text { for } p_{i}^{\prime} \in \Delta\left(A_{i}\right) \\ 通俗地解释就是:每个玩家都选择在对手不改变的情况下的最好的分布简写为:MNE2. 最优反应玩家i的最优反应B_{i}\left(p_{-i}\right)=\left\{p_{i}: U_i\left(p_{i}, p_{-i}\right) \geq U_i\left(p_{i}^{\prime}, p_{-i}\right) \text { for all } p_{i}^{\prime} \in \Delta\left(A_{i}\right)\right\}定理:p=\left(p_{1}, p_{2}, \dots, p_{N}\right)是MNE当且仅当对于所有的i,p_{i} \in B_{i}\left(p_{-i}\right)3. 存在性:纳什定理定理:有限的策略式博弈一定存在混合策略纳什均衡有限指:有限的玩家,每个玩家都有有限种纯策略。4、求解混合策略纳什均衡定理:p=\left(p_{1}, p_{2}, \dots, p_{N}\right)是MNE当且仅当玩家i的每个具有正概率的纯策略都是p_{-i}的最优反应。(证明略)也就是说,玩家i选任意一种纯策略的期望收益是相同的。用这个定理来求解MNE例子设玩家1选择U的概率是\pi_1,玩家2选择L的概率是\pi_2由玩家2选L的期望收益等于玩家2选R的期望收益,得式子: 2 \pi_{1}+5\left(1-\pi_{1}\right)=4 \pi_{1}+2\left(1-\pi_{1}\right) \\ 由玩家1选U的期望收益等于玩家1选D的期望收益,得式子: \pi_{2}=3\left(1-\pi_{2}\right) \\ 解得:\pi_1=0.6,\pi_2=0.75因此求得纳什均衡p = \{\{0.6,0.4\},\{0.75,0.25\}\}解释”玩家i选任意一种纯策略的期望收益是相同的“也可以这么想:如果玩家i的纯策略的期望收益不同的话,那么他会一直选期望收益高的那个,也就是选择一个纯策略,而不是混合策略。这样就回到了纯策略博弈的时代,开篇的例子又说明了有些博弈是找不到纯策略的均衡的。因此,如果想保持一种”稳定“的局面,每个玩家都没有动机改变当前的策略(或分布),就要保证它选择每个策略的期望收益都相同。四、小结本篇内容有:混合策略博弈的定义混合策略纳什均衡的定义及求解欢迎提出建议,指正错误,也欢迎一起讨论~编辑于 2021-07-09 14:47纳什均衡 (Nash Equilibrium)博弈论​赞同 436​​59 条评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录博弈论笔记博弈论课

纳什均衡_百度百科

_百度百科 网页新闻贴吧知道网盘图片视频地图文库资讯采购百科百度首页登录注册进入词条全站搜索帮助首页秒懂百科特色百科知识专题加入百科百科团队权威合作下载百科APP个人中心纳什均衡播报讨论上传视频博弈论中一种解的概念收藏查看我的收藏0有用+10纳什均衡是博弈论中一种解的概念,它是指满足下面性质的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。中文名纳什均衡外文名Nash equilibrium别    名非合作博弈均衡解    释策略组合目录1简介2历史背景3分类4经典案例▪囚徒困境▪硬币正反5重要影响简介播报编辑纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。历史背景播报编辑关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上,博弈论的研究起始于1944年约翰·冯·诺依曼(Von Neumann)和奥斯卡·摩根斯特恩(Oscar Morgenstern)合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性 [1],从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。”分类播报编辑纳什均衡可以分成两类:“纯策略纳什均衡”和“混合策略纳什均衡”。要说明纯策略纳什均衡和混合策略纳什均衡,要先说明纯策略和混合策略。所谓纯策略是提供给玩家要如何进行博弈的一个完整的定义。特别地是,纯策略决定在任何一种情况下要做的移动。策略集合是由玩家能够施行的纯策略所组成的集合。而混合策略是对每个纯策略分配一个概率而形成的策略。混合策略允许玩家随机选择一个纯策略。混合策略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现收益最优。因为概率是连续的,所以即使策略集合是有限的,也会有无限多个混合策略。当然,严格来说,每个纯策略都是一个“退化”的混合策略,某一特定纯策略的概率为1,其他的则为0。故“纯策略纳什均衡”,即参与之中的所有玩家都使用纯策略;而相应的“混合策略纳什均衡”,之中至少有一位玩家使用混合策略。并不是每个博弈都会有纯策略纳什均衡,例如“钱币问题"就只有混合策略纳什均衡,而没有纯策略纳什均衡。不过,还是有许多博弈有纯策略纳什均衡(如协调博弈,囚徒困境和猎鹿博弈)。甚至,有些博弈能同时有纯策略和混合策略均衡。 [3]经典案例播报编辑囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。) [2]假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌疑人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。囚徒困境博弈A╲B坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。基于经济学中“理性的经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。硬币正反你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。你\美女美女出正面美女出反面你出正面+3,-3-2,+2你出反面-2,+2+1,-1假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出什么的时候我们的收益都相等(不然在这个游戏中,对方可以改变正反面出现的概率让我们的期望收入减少),由此列出方程就是纳什均衡解方程得y=3/8。同样,美女的收益,列方程解得x也等于3/8,而美女每次的期望收益则是元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。重要影响播报编辑纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的日本经济学家神取道宏(Kandori Michihiro,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。新手上路成长任务编辑入门编辑规则本人编辑我有疑问内容质疑在线客服官方贴吧意见反馈投诉建议举报不良信息未通过词条申诉投诉侵权信息封禁查询与解封©2024 Baidu 使用百度前必读 | 百科协议 | 隐私政策 | 百度百科合作平台 | 京ICP证030173号 京公网安备110000020000

如果博弈中只有唯一纯策略纳什均衡,是否意味着不存在(完全)混合策略均衡? - 知乎

如果博弈中只有唯一纯策略纳什均衡,是否意味着不存在(完全)混合策略均衡? - 知乎首页知乎知学堂发现等你来答​切换模式登录/注册博弈论纳什均衡 (Nash Equilibrium)如果博弈中只有唯一纯策略纳什均衡,是否意味着不存在(完全)混合策略均衡?博弈论关注者334被浏览70,893关注问题​写回答​邀请回答​好问题​4 条评论​分享​9 个回答默认排序晓风残月​经济学等 2 个话题下的优秀答主​ 关注谢@刘锐邀可惜啊,题主的猜想是错误的。存在这样一个博弈,只有一个纯策略纳什均衡,但还存在其它(完全)混合策略纳什均衡。话说我有两个朋友,L和R。在一个阳光明媚的早晨,他们决定来我家玩“Meet Penny”游戏。什么叫“Meet Penny”游戏呢?就是猜硬币,R将一枚一元硬币攒在手里,L猜是正面还是反面,猜对了R给L一元,猜错了L给R一元。聪明的L和R早就知道这个游戏没有纯策略纳什均衡,只存在一个混合策略纳什均衡。且说这天我突发奇想说:“这游戏太无聊了,咱来加点变化。保留原来的游戏规则,咱再来加几条规则。现在R可以在手里什么也不放,L也可以猜R手里是空的。如果R手里什么也不放,而L又猜对的话,作为裁判的我就给你们每人10元。可是如果R手里是空的,L却猜了“正”或“反”的话,你们每个人给我10元。类似的,如果R手里有硬币,L却猜R手里是空的的话,你们也每人给我10元。”学过博弈论的L和R听了觉得新奇,向我借了一张草稿纸,画了个3x3的支付矩阵的草图,发现只有一个纯策略纳什均衡(R手里是空的,L猜对),此外还存在原来Meet Penny的混合策略纳什均衡。本故事并非虚构,有图为证:编辑于 2017-12-10 09:09​赞同 251​​28 条评论​分享​收藏​喜欢收起​刘锐​​经济学话题下的优秀答主​ 关注 这个题目不错。 在对称二人博弈下,如果每个人都只有两个策略,那么这个结论是成立的。比如说有两个人,小明和小红。小明可以选上和下,小红可以选左和右。支付矩阵是a bc d 现在设,(上,左)是唯一的纯策略纳什均衡。于是我们可以推出:a\geq b, a\geq c。 然后,有一个混合策略均衡:小明以p的概率选上,小红以q的概率选左。如果两个混合策略都是退化的,那就退回纯策略了,所以至少有个人不是。因为两个人是对称的,不妨设小明的混合策略是非退化的,即0b。所以(下,右)是纳什均衡,矛盾。 然后考虑其他情形。小明选上得到qa+(1-q)b,选下得到qc+(1-q)d。前面说了,混合策略纳什均衡的性质是这两个要相等。然而a\geq c,要让这两个相等必须有d\geq b。然后再看小红,选左得pa+(1-p)c,选右得pb+(1-p)d。,要让这两个相等必须有d\geq c。所以(下,右)是纳什均衡,矛盾。 证毕。 但是多人博弈就没这么容易推了,应该不成立。如果还是二人博弈,但有人的策略数至少3个呢?显然由这个推理就可知,只要有混合策略以0的概率取纳什均衡策略就行了。这就是 @晓风残月举的反例。编辑于 2017-04-17 23:46​赞同 27​​1 条评论​分享​收藏​喜欢

怎样向非专业人士专业地解释「纳什均衡」? - 知乎

怎样向非专业人士专业地解释「纳什均衡」? - 知乎首页知乎知学堂发现等你来答​切换模式登录/注册经济博弈论纳什均衡 (Nash Equilibrium)怎样向非专业人士专业地解释「纳什均衡」?本题已加入知乎圆桌 » 日常经济学 · 博弈人生 ,更多「博弈论」话题讨论欢迎关注显示全部 ​关注者1,302被浏览708,308关注问题​写回答​邀请回答​好问题 18​2 条评论​分享​75 个回答默认排序刘晓淳哥要是出道,就没德云社什么事儿了​ 关注纳什均衡是这样的一种状态:在博弈中如果玩家A选择了X选项,那么玩家B为了使自己的利益最大话选择了Y选项;相反如果玩家B选择了Y选项,这种情况下X对于玩家A来说也是利益最大话的唯一选项。例子如:A,B两个理性的玩家博弈,规则是两个人各自选择从1到9的任意一个整数,如果两个人选的数字之和不大于10,则A、B玩家各自获得所选数目的奖金,反之双方一分钱也拿不到。在这个例子里面,如果A选择“4”,B为了是利益最大化会选“6”,记为(4,6);相反,如果B选择的是“6”,A为了利益最大化就只能选“4”,因此(4,6)就是一个纳什均衡点。相应地,(1,9)、(2,8)、(3,7)、(5,5)、(6,4)、(7,3)、(8,2)、(9,1)也都是纳什均衡点。但是哪一个纳什均衡是最容易出现的呢?这个答案取决于这个游戏是静态(Static gaming)的还是动态(dynamic gaming)的,彼此知不知道对方的选择。如果游戏是静态的(就像猜拳,彼此同时选择,而且对方不知道彼此的选择),出现哪个结果则取决于A,B双方更愿意相信对方会选择多少。如果是动态的,又分几种情况,信息透明,和信息不透明,和信息不对称。1,如果信息透明,也就是像下象棋一样,A先选,B知道A选择之后再选择,这种情况下,一定是(9,1);2,如果信息不透明,就是A选好了,写下来后放在信封里,然后B做选择,这种情形等同于静态博弈。3,如果信息不对称,就比较复杂了,涉及到有没有bluffing,有没有欺骗等等,所以结果很有可能达不到纳什均衡点。发布于 2012-01-11 12:21​赞同 240​​10 条评论​分享​收藏​喜欢收起​方秋竹Who tells your story​ 关注“不后悔”这是Yale的《博弈论》公开课上给出的一个直观解释,也是我目前看到的最容易理解的解释。不过我以为这个解释还不够严谨。纳什均衡在一些博弈中并非共同最优的结果,如常被拿出来说事的“囚徒困境”中,纳什均衡结果是两人均认罪,而这个结果对两个人而言都是不如两人均不认罪的结果的。如果不对“不后悔”做一点补充,可能会造成歧义。于是解释不得不变得稍微复杂一点:给定其他人的策略不变,每一个参与者对于自己的选择都“不后悔”。而之所以合作结果不能成为均衡结果,正是因为给定一方“合作”(不认罪)时,另一方就会有将策略改为“背叛”(认罪)的激励。即合作结果将会使双方都后悔。对于这样的“不后悔”,有一个专业术语——“最优反应”(best response),于是可以进一步修改对纳什均衡的解释:每个人的策略都是对其他人的策略的最优反应。这个相对规范的表述也不难理解嘛:)补充:1、“囚徒困境”中的背叛结果是一个纯策略纳什均衡的例子,对于混合策略纳什均衡,这个解释也是成立的~2、Dixit的Games of Strategy上更规范的定义:A Nash Equilibrium in a game is a list of strategies, one for each player, such that no player can get a better payoff by switching to some other strategy that is available to her while all other players adhere to the strategies specified for them in the list.编辑于 2016-02-01 17:11​赞同 258​​4 条评论​分享​收藏​喜欢