谁能把纳什均衡给讲清楚点?
的有关信息介绍如下:纳什均衡是博弈论中的一个规律,指的是在一个博弈过程中,博弈双方都没有改变自己策略的动力,因为单方面改变自己的策略都会造成自己收益的减少。纳什均衡点可以理解为个体最优解,但并不一定是集体最有解。
为了解释这个问题,我们举两个最典型的例子:囚徒困境和智猪博弈。
囚徒困境囚徒困境是说:有两个小偷集体作案,然后被警察捉住。
警察对两个人分别审讯,并且告诉他们政策:
如果两个人都交代坦白,就可以定罪,两个人各判八年。
如果一个人交代另一个不交代,那么一样可以定罪。但是交代的人从宽处罚,批评教育就释放。不交代的人从严处罚,判十年。
如果两个人都不交代,没法定罪,每个人判一年意思一下。
两个人的收益情况如下所示:
首先我们考虑A的决策。A会想,我如何才能获得更大收益呢? 如果B坦白了,那么我坦白就会判8年,我抗拒就会判十年,我应该坦白;如果B抗拒了,我坦白会判0年,我抗拒会判1年,我还是应该坦白。所以最终A会选择坦白。同样,B也会这样想,因此最终纳什均衡点在两个人都坦白,各判八年这里。
显然,集体最优解在两个人都抗拒,这样一来每个人都判一年就出来了。但是,纳什均衡点却不在这里。而且,在纳什均衡点上,任何一个人都没有改变自己决策的动力。因为一旦单方面改变决策,那个人的收益就会下降。
这与我国开车夹塞的例子很像。如果大家都不夹塞,是整体的最优解,但是按照纳什均衡理论,任何一个司机都会考虑,无论别人是否夹塞,我夹塞都可以使自己的收益变大。于是最终大家都会夹塞,加剧拥堵,反而不如大家都不加塞走的快。
那么,有没有办法使个人最优变成集体最优呢?方法就是共谋。两个小偷在作案之前可以说好,咱们如果进去了,一定都抗拒。如果你这一次敢反悔,那么以后道上的人再也不会有人跟你一起了。也就是说,在多次博弈过程中,共谋是可能的。但是如果这个小偷想干完这一票就走,共谋就是不牢靠的。
在社会领域,共谋是靠法律完成的。大家约定的共谋结论就是法律,如果有人不按照约定做,就会受到法律的惩罚。通过这种方式保证最终决策从个人最优的纳什均衡点变为集体最优点。
智猪博弈智猪博弈是这样一个例子:有一个食槽中装有十份食物,但是按钮在另一端。需要到另一段按一下按钮食物才能掉下来。大猪和小猪都在食槽一端,他们两个人都可以跑到另一端按按钮然后再回来,速度相同,并且都要消耗一定的体力,并且会造成另一只猪先吃食物。
我们假设每只猪跑去按按钮都要消耗2份食物的体力,并且大猪比小猪吃食物快,所以:
如果大猪先吃食物,二者吃食物的比例为9:1
如果小猪先吃食物,二者吃食物的比例为6:4
如果二者同时吃食物,吃食物的比例为7:3
两只猪都可以选择去按按钮,也可以选择等待。在考虑了两只猪消耗的体力因素后,各种决策对应的收益如下所示:
我们来考虑均衡点。小猪会思考:如果大猪去,我跟着去获得收益1,我等着获得收益4,因此我应该等着。如果大猪不去我去,我获得收益-1,如果我们都等着我收益为0,因此我还是应该等着,这样一来,小猪的决策一定是等待。
在小猪等待的情况下,如果大猪去按按钮,获得收益4,如果大猪不去按按钮,获得收益0,因此大猪会选择去按按钮。这个(4,4)的收益就是纳什均衡点。
这和国家或者公司进行基础研究研发新产品很像。比如一款新的芯片研发需要花很多钱,成功后也能获得更大的收益。在这样的情况下,小国家小公司是没有动力进行研发的,他们会等待大国大公司研发好了之后,直接利用现成的技术获得收益。
我们的芯片产业就是这样一个局面,多年以来我们一直认为自己是发展中国家,没有大力推动半导体产业的基础研究,许多人秉着做不如买,买不如租的观点。现在美国对中国展开贸易战,禁止芯片出口,一下子就卡主我们的脖子了。
约翰纳什是一位传奇人物,前两年出车祸去世了。想了解纳什的一生,可以去看看电影《美丽心灵》
纳什均衡涉及到非合作博弈,这个事情我可以给你解释一下,大致就是用离婚这个事情来说吧。
夫妻2个人,要离婚的时候,一般情况下就是要分割财产。这时候,就是一个博弈过程。如果是合作博弈,也就是两个人好商量,那么就去协议离婚,民政局领离婚证,财产一人一半,谁也不吃亏。
但是,如果走法院起诉离婚的路线,则是非合作博弈,这个时候要请律师,而且财产分割就会有人吃亏有人占优势。
那么,我们假设夫妻财产是100万,如果女方请律师,上法院起诉离婚,那么女方要付出律师费4万,但可以赢得70万,男方如果不请律师,那么男方得到30万。这个情况下,男方其实是吃亏了。所以,这个不是纳什均衡——所谓均衡就是无法再改进了,那么男方应该怎么做?当然是要改进,那就请律师,男方付出律师费4万,这个时候双方上了法院,最后律师势均力敌,双方每人50万,除了律师费用,每人剩46万。这个每个46万就是纳什均衡。
所以,从上面的例子可以看出,两个人不请律师不是纳什均衡,因为女方如果知道男方不请律师,她肯定会请律师,最后得到70万。所以,这个状态不是一个纳什均衡——因为有一方可以通过改进策略多赢钱。最后双方非合作博弈的纳什均衡状态一定是双方都请律师,最后谁也不吃亏——律师赚了钱,所以律师在离婚官司里得到了纳什均衡的好处。
一天一个人喂鸡,对鸡说,好好吃吧,明天就杀你了,第二天,见鸡已自杀,并留下遗书,爷也不好惹的,想吃我,没门。纳什均衡告诉我们,当知道对手的选择时,选择一个最佳应对。纳什均衡就是给定你的选择,我的选择是最好的,给定我的选择,你的选择是最好的
1。这首先得明白为什么会有纳什均衡。
很多人没有接触博弈论的时候。对于复杂的问题会找不到思考的方向。找到了思考方向却有没有权衡标准。这时候纳什均衡会要求你对所有抽象的结果进行数字化的标注。
比如:一个人缺钱。在着急或不着急的情况下他会选择以下哪个策略弄到钱?
没学过的人会这样想:
策略A:偷窃得1万判1年
策略B:抢劫得1万2判6年
策略C:做生意得200
策略D:捡破烂得50
学过的人会这样:
策略A:偷窃得1万判1年 风险 10
策略B:抢劫得1万2判6年 风险 20
策略C:做生意得200 风险 6
策略D:捡破烂得50 风险3
2。为什么要用纳什均衡
纳什均衡是博弈论里最基本的量化后的策略筛选模型,也是最常用的。当你对几组不同的策略进行了成本或者风险量化。接下来就很容易通过纳什均衡的矩阵表得出最优解决方案。
有了上面的风险标注来量化风险。你就可以评估出在紧急情况下。他会采用策略A。不紧急的情况选择策略C。
结论:
纳什均衡就是我们筛选最优解的工具。当你将抽象的没有量化的策略。用数字化表达的时候。他可以帮求出最优解。
股民看过来。
正好结合现在的指数位置的关系,来个大家聊聊博弈论的东西。这个东西,绝对是个好东西,而且是“把人当人”来分析的,主要理论。
纳什不是打篮球的那位,而是一位电影原型,也是一位诺贝尔经济学奖的获得者,1994年的诺贝尔经济学奖就给了他。
约翰·纳什(John Nash,1928年6月13日—2015年5月23日),著名经济学家、博弈论创始人、《美丽心灵》男主角原型,前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。 由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。再来看看纳什均衡,先来看定义哈,然后咱再来举例子。
纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为 1,其他的则为 0。故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。从股民的角度来说说吧,这也是一个典型的纳什均衡的策略问题。所有的参与者都面临着一个博弈的问题,当一方买入或者卖出的时候,我该怎么做才能让我的选择最优。
这是最经典的,散户和主力的关系。当主力卖出的时候,散户跟着卖出是最优的选择,当主力买入的时候,散户跟着买入才是最优选择;而当散户卖出的时候,主力做买入是最优选择,散户买入的时候,主力做卖出才是最优选择。
当然,对于纳什均衡而言,在市场中两个玩家一种理想的状态,当有多个玩家的时候,也就是有多个资金参与的时候,博弈就会变得更加复杂一些。
比如说,现在的市场情况,我们简单的假定有三方,监管层,机构,散户。监管层的目标和需求非常的明确,不要暴涨暴跌,急涨急跌。那么机构的需求是什么呢,在整个去杠杆的背景下,降低资金杠杆,收缩资金,自然要适度的卖出。散户的诉求又是什么呢?解套迎来牛市。
管理层出招了,不能涨太快哈,小心特停,也不能跌太快哈,小心窗口指导,电话通知。那么机构的策略是啥,也就出招了,慢慢卖,不要急于卖出。逢反弹卖,不能把指数砸漏了,偶尔还得抱团取暖维护指数。这是机构的最优策略。那么散户呢?最优策略是,跟着机构的思路,反弹跑路。而这里有相悖的地方,机构的反策略就是吸引散户接盘,要不卖不出去。
这下能看明白了吧。现在的市场也是典型的博弈策略的选择。
多个牛逼的人做出的对自己最优的选择,谁也不想改变。
牛逼的人意思是都足够聪明,对自己最优选择,一样的要考虑到别人的思考,最终谁也不想改变策略了,达到一个平衡,就是纳什均衡。
这个可能有均衡,也可能没有,可能是集体最优解,也可能不是。
所以,纳什推翻了亚当斯密的个人最求利益最大化,集体利益就最大化的理论。得若贝尔经济学奖。
不过现在还是大部分情况下个人在法律范围内追求利益最大化,社会利益就是最大化。
什么是纳什均衡?好问题!
这个改变现代经济学体系和结构的博弈论概念,确实很多人都非常关注。很多人也像你一样很想简单明了知道这个概念的内涵。
那就让科学迷的我用自己亲身经历的一个小故事来分析一下,看看能不能帮大家去掉心中的迷雾。多年前,我是一个乡村中学的语文老师兼班主任。
一天,有学生向我反映班里的男生甲和男生乙两人在数学考试中传递纸条,伙同作弊。我在比对两人的试卷后,确实发现雷同的地方比较多,但是没有实锤,不好给两人定性作弊。
于是我把甲、乙两人各关在一个教师办公室,分别对两人说,如果两个人都坦白自己作弊的经过,就数学成绩都扣30分;如果一人坦白,一人抵赖,作弊的事情坐实后,抵赖的人数学0分处理,坦白的人扣15分。然后,我递给两人各纸一张,笔一支,让他们自己作出选择。
两位学生面临的处境,就是博弈学中所说的囚徒困境。
朋友们,作为旁观者,你来帮我的两位学生分析一下,什么样的选择才是最好的选择?
对!
对两人来说,最好的选择就是两人都不承认自己作弊,这样,我依然没有实锤,不好定性作弊。两人的数学成绩就不会被扣掉分数。这种选择,在经济学上叫帕累托最优。
但实际上,两人在做选择时,往往都会想:如果我死不承认,但是对方坦白了,那不是我的数学成绩要成0分了?怎么才能保证对方不会坦白呢?
所以两人思来想去,往往最后的结果是各自坦白了作弊经过。
他们的这种各自坦白,接受被扣30分的选择,我们在经济学上就称之为“纳什均衡”。在经济学概念上,和纳什均衡对应的,就是静态的帕累托最优。
这样说你明白了吗?
当然,经济生产中的博弈比我两位学生之间的博弈要复杂上百倍,但是实质是一样的,都是一种非合作性博弈状态。你可以把学生的人数变多,变成五个、十个。然后把你自己置身其中,你也是其中一个,你想要矢口否认作弊,但是你自己一人否认无效。所以你最好的策略选择就是不改变自己原来要坦白承认的选择。
在商业竞争中,这样类似的选择很多。你想要改变策略,想要得到好的商议回报。但前提是所有和你一起参与博弈的人都要和你一起改变策略。这样,博弈的结果往往是大家都不愿意改变现状,也就是一直处在“纳什均衡”状态。
最后说说纳什均衡对现代经济学的意义。纳什均衡”对亚当·斯密的“看不见的手”提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。”纳什均衡的重要影响可以概括为以下六个方面:1.改变了经济学的体系和结构。2.扩展了经济学研究经济问题的范围。3.加强了经济学研究的深度。4.形成了基于经典博弈的研究范式体系。5.扩大和加强了经济学与其他社会科学、自然科学的联系。6.改变了经济学的语言和表达方法。
市场上有2家企业A和B,都是卖纸的,纸的成本都是2元钱,A和B都卖5块钱。
有一天A降价到4块钱,于是A销量大增,B销量大减。B看到了后,降价到3块钱,于是B销量大增,A销量大减。
但如果价格战一直这样打下去,对谁也没有好处,于是A也选择降价到3块钱,和B一样。B看到了A降价到3块钱,B既不敢涨价,也不敢降价。涨价了市场就丢了,降价了,就赚不到钱甚至赔钱。所以A和B都不会再去做改变,这就是纳什均衡。
A和B怎样能够获得最大利润呢,就是A和B坐到一起商量,同时把价格提高,这就叫共谋,但法律为了保障消费者利益,禁止共谋。
所以有的企业会打出这样的横幅“我的价格一定不会比B低”,B是指竞争对手。意思是告诉对方,我会和你用同样的价格,所以你尽管定高价。显然这样的横幅也是共谋,也是违法的。
纳什均衡是博弈论的最基础,最重要重要的概念。也是博弈论初学者最先接触的概念,最早理解的均衡。
讲纳什均衡可以不用数学,不用模型,但至少要用图表。不过用图表的话,看起来太枯燥。闲话经济力图提供简单易懂的经济观点,这里试着用文字简要介绍一下。
纳什均衡两个基本假设。一是人是完全自利的,完全从自我利益出发考虑行动策略,争取最有利的决策。二是信息是不对称的,博弈参与人不知道对方会选择哪一个策略,如果彼此知道对方选择什么,纳什均衡可能不存在。
基于以上两个假设,博弈参与人只有在可选策略中选择对自己最有利的策略,而不考虑对方选择什么。简单地说,你有你的千条计,我有我的老主义,反正我只干我最有利的事情。
参与人都这么想,最终进去博弈方都不在改变策略的均衡状态,即纳什均衡。在纳什均衡状态下,博弈方都认为自己有利的策略,不在改变策略。
事实上纳什均衡状态下,每个人选择最有利的策略并非结果对自己最有利。因为私心,最终偏离了共赢,进去多损状态。
不足之处,请批评指正。
只用文字而不用数学形式来解释纳什均衡将是一项挑战。
对于完全信息静态博弈,即所有参与者的策略对所有人来说是共同的知识,且每个参与者在参与博弈前就选定好了策略并且不改变。如此,对于博弈中的每一个参与者,ta在假设其他所有参与者选择了各自最优策略的基础上选择出自己的最优策略,所有参与者的最优策略集便是一个纳什均衡。
简单来说,博弈中所有人都尽可能使自己的收益最大化,当达到纳什均衡时,单独的任何一人不论如何改变,ta想要再获得更高的收益的行动都将是徒劳的。
通常讲博弈论时都会用囚徒困境的例子,在此不展开了,这是一个纯策略的完全信息静态博弈。此外还有混合策略的完全信息静态博弈,要稍微复杂一些。可将纳什均衡从最优纯策略集扩展到最优混合策略集,比如猜拳。
再复杂一些的博弈包括不完全信息静态博弈、完全信息动态博弈、不完全信息动态博弈,其中的纳什均衡概念也更复杂(我也还在学习中)。
对此感兴趣的话,推荐一本教科书《博弈论基础》(吉本斯 著)