在均衡问题上, J. Nash 首先证明了博弈均衡解的存在性, 在纳什平衡理论的基础上, 泽尔腾和海萨尼将Nash 均衡动态化。在SFGDD 协商机制的稳定性问题上, 本节运用对策论中的纳什平衡理论寻求多Agent 系统的协商平衡。纳什平衡定义为: 对于博弈组合G ={S1, …由此可见, 纳什均衡的存在性是纳什均衡概念最重要的性质。这也就是纳什均衡概念及纳什均衡存在性定理是博弈中最主要的理论的原因之所在。......
2023-06-20
1.纳什与纳什均衡
纳什被认为是一位数学天才,他在21岁时就提出了纳什均衡理论,此理论后来成为博弈论的两大基础之一.
1950年7月13日,约翰·纳什在自己生日的那一天获得美国普林斯顿高等研究院的博士学位,他那篇仅仅27页的博士论文中有一个重要发现,这就是后来被称为“纳什均衡”的博弈理论.正确运用这个方法,将能使共同参与一项经济活动却又利益冲突的各方,在不合作前提下做出有利于自己利益的选择,但最终结果可能共同受益.这个发现被认为是纯粹理性思维的胜利,它推动经济学重构基础理论.
1994年纳什才获得诺贝尔经济学奖.诺贝尔经济学奖评奖早在1983年就已经注意到博弈论对现代经济的巨大影响和作用,纳什均衡被实践证明是对社会行为规律的发现,但是由于纳什的健康原因,直到1994年才颁奖.颁奖那天,纳什与始终伴随他走过艰难历程的艾利西亚出现在颁奖大会上,人们为这位天才数学家热烈鼓掌.
2.囚徒困境
话说有一天,一位富翁在家中被杀,财物被盗.警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物.但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西.于是警方将两人隔离,分别关在不同的房间进行审讯.由地方检察官分别和每个人单独谈话.检察官说,“由于你们的偷盗罪已有确凿的证据,因此可以判你们一年刑期.但是,我可以和你做个交易.如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑.如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁.但是,如果你们两人都坦白交代,那么你们都要被判5年刑.”斯卡尔菲丝和那库尔斯该怎么办呢?
博弈矩阵为:
相对优势策略划线法
首先,逐次划线标示局中人相对于对方可能的策略选择(一行或一列)的相对优势策略的位置.双方的优势策略都这样划线后,如果哪个格子里面两个数字下面都被划线,这个格子所对应的(相对优势)策略组合,就是一个纳什均衡.
这两个人都会做这样一个盘算:假如他招了,我不招,得坐10年监狱;他招了,我也招了才5年,所以招了划算.假如他不招、我不招,坐一年监狱;如果他不招,我招了,只坐3个月,也是招了划算.综合以上两种情况考虑,还是招了划算.最终,两个人都选择了招供,结果都被判5年徒刑.
这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡.因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益.也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成.没有人会主动改变自己的策略以便使自己获得更大利益.
这个故事说的是,因为个体为了自己的利益最大,而不愿意改变决策,导致整体利益最小.这样的情景就是个体与环境博弈的结果,这种状态就是博弈论中所谓的“纳什均衡”,又叫作“全局博弈均衡”.纳什均衡是局中人理智选择的结果.在现代经济生活中,纳什均衡的思想经常被应用,如投资、消费和雇佣关系分析,生产、库存和维修关系分析,标价、拍卖和谈判策略制定,自然资源和污染关系分析,委托与代理关系分析等都涉及纳什均衡的概念.
3.美苏争霸的囚徒困境
从军事上看,二三十年前美国和苏联是世界上的两个超级大国,他们相互对垒.假定每一方都有两种策略选择:一个是扩军,发展战略核武器,实施“星球大战”等;另一个是彻底裁军,直至不设军备.如果双方都扩军,则各花费2 000亿美元用于军费.彻底裁军,则军费为零.
在一个弱肉强食的世界上,如果美国裁军不设防,但是苏联扩军,苏联就可以任意欺辱和损害美国;反之亦然.
我们假定,如果双方都裁军,双方在这场实际上没有对峙的军事对峙中的“盈利”都为零.如果双方都扩军,那么在这场真正的均势的军事对峙中,各方的“盈利”都等于-2 000亿美元,双方都花费了军费.如果一方扩军另一方裁军不设防,扩军的一方“赢利”为8 000亿美元,不设防的一方“盈利”为-.
博弈矩阵为:
双方都扩军是争霸博弈唯一的纳什均衡.
20多年前,现实的军备竞赛形式,的确很像左上角格子代表的情形.
4.政治家的囚徒困境
1984年,大多数政治家都明白,美国联邦政府的财政赤字太高了.解决财政问题的基本思路,不外乎“节流”和“开源”.联邦政府的巨额开支每一笔都理据充足,所以裁减开支在政治上并不可行.这样一来,大幅增税应该是不可避免的.不过,谁愿意担当政治领导角色,带头主张这么做呢?政治家以讨好选民为己任,增税是选民最不喜欢的事情.民主党总统候选人沃尔特·蒙代尔想要在自己的竞选活动当中为这个政策转变制造声势,却被罗纳德·里根打得落花流水,因为里根许诺绝不加税.
1985年,这个议题陷入僵局,无论你怎么划分政治派别,无论是民主党还是共和党,无论是众议院还是参议院,也无论是政府还是国会,各方都希望把提出加税的主动权推给对方.(www.chuimin.cn)
从各方角度来看,最好的结果在于,另一方有人提出加税和削减开支,因此他们不得不付出政治代价.反过来,假如自己提出这样的政策,而对方坚守被动局面,并不附和,自己就会落得个最糟糕的下场.双方都知道,与同时坚守被动、眼看巨额赤字上升而无所作为相比,联合起来共同倡议加税和削减开支,共同分享荣誉、分担谴责,显然对整个国家有利,即便对他们自己的政治生涯,从长期而言也会有好处.
这样我们可以画出博弈矩阵:我们把每个结果下各方的收益给出从1到4的排序.
显而易见,对每一方而言,保持被动是一个优势策略.
而这也是真实发生的事情.第99届国会根本没有做出任何加税决定.
第99届国会确实通过了《格拉姆—鲁德曼—霍灵斯法》,这一法案规定以后必须削减财政赤字.不过,这只是一种伪装,好像采取了行动,实际却推迟了做出抉择的时间.这一目的与其说是通过限制财政支出的做法达成,不如说是玩弄会计上的小把戏的结果.
5.修路博弈
设想农村某地有一个只有两户人家的小居民点,道路情况不好,与外界的交通比较困难.如果修一条路出去,每家都能得到“3”那么多的好处,但是修路的成本相当于“4”.要是没有人协调,张三、李四各自打是否修路的小算盘,那么两家博弈的形势如下:如果两家联合修路,每家分摊的成本是“2”,各得好出“3”,两家的纯“赢利”都是“1”;如果一家修路另一家坐享其成,修路的一家付出“4”而得到“3”,“赢利”是“-1”,坐享其成的一家可以白白赢利“3”(这是因为我们假设修路的并没有路的地权,他总不能因为修了路就不让邻居走);如果两家都不修路,结果两家的“赢利”都是“0”.
修路博弈的博弈矩阵如下:
在这个博弈中,纳什均衡是(0,0),即两家都不动手,大家都得零.
这是公共品供给的囚徒困境:如果大家都只从自己得益多少出发考虑问题,大家都只打自己的小算盘,结果就谁也不作为,对局锁定在“三个和尚没水喝”的局面,排除了合作双赢的前景.
所以,公共品问题一定要有人协调和管理.
6.价格大战
可口可乐公司和百事可乐公司几乎垄断了美国的碳酸饮料市场,两个企业都想打垮对手,争取更大的利润.
要增加利润,就要提高商品的价格.东西卖得贵了,钱不就赚得多了吗?
如果只有一家企业垄断了整个市场,提高价格可能会增加利润.现在存在两家相互竞争的企业,消费者可以在两家之间选择.这时候,提价的结果不仅不能增加利润,反而可能使自己企业的利润下降.这里,重要的因素是市场份额.如果你提价,对方没有提价,你的东西贵了,消费者就不买你的东西而买对手的东西了.这样,你的市场份额就会下降很多,利润也会随之下降.对方的价格没有提高,生意比原来好得多,利润就可能大幅度上升.但是,如果两个企业都采取比较高的价格,消费者没有别的选择,贵了也只好买,两个企业的利润都会上升.
假定两个企业都采取比较低的价格,可以各得利润30亿美元;都采取比较高的价格,各得50亿美元利润;而如果一家采取较高的价格而另外一家采取较低的价格,那么价格高的企业的利润为10亿美元,价格低的企业因为多销利润将上升到60亿美元.
究竟是采用较高的价格好还是较低的价格好,两个企业都面临选择.
博弈矩阵为:
很明显,价格博弈的纳什均衡是(30,30),即两个公司都采取低价,各赚30亿美元.
为什么两个企业那么蠢要进行价格大战呢?那是因为每个企业都以对方为敌手,只关心自己一方的利益.在价格博弈中,只要以对方为敌手,那么不管对方的决策怎样,自己总是采取低价策略会占便宜.这就促使双方都采取低价策略.如果清楚这种前景,双方勾结或合作起来,都实行比较高的价格,那么双方都可以因为避免价格大战而获得较高的利润.有人把这种合作叫作“双赢对局”.在上述企业价格大战博弈中,如果双方勾结或联手都不降价,则都将是双赢对局的赢家.
有关数学与生活的文章
在均衡问题上, J. Nash 首先证明了博弈均衡解的存在性, 在纳什平衡理论的基础上, 泽尔腾和海萨尼将Nash 均衡动态化。在SFGDD 协商机制的稳定性问题上, 本节运用对策论中的纳什平衡理论寻求多Agent 系统的协商平衡。纳什平衡定义为: 对于博弈组合G ={S1, …由此可见, 纳什均衡的存在性是纳什均衡概念最重要的性质。这也就是纳什均衡概念及纳什均衡存在性定理是博弈中最主要的理论的原因之所在。......
2023-06-20
理论上来说,链路增益没有最大或最小界限。但是在实际情况中,系统元件的性质参数smd、rd会限制链路增益。在直接调制的光与无线网络系统中,使用的是一般的二极管激光器和PIN光电探测器,且链路中各部分阻抗是匹配的,由于smd、rd不大于1,因此链路的增益也不会大于1。因此,只要提高PI和smz,链路增益就可以大于1,甚至可以无限增大。......
2023-06-19
本节主要通过一个切片的应用实例,来巩固关于切片的运用知识,包括创建切片、设置切片选项和编辑切片等。图12-23 设置“图像”类型切片图12-24 设置“无图像类型”切片单击“确定”按钮退出“切片选项”对话框。图12-25 网页效果在打开的网页中,将鼠标放置在网页顶部的图像上,浏览器的状态栏中则显示出相应的信息,鼠标指针上也显示有替代文本信息。......
2023-10-16
人生如棋,世事如局,谁运筹帷幄,谁策马驰骋.谈笑间,风物依旧,奈何岁月不复往昔.人生本身就是一场博弈,而人永远是博弈中的局中人,或竞争或合作,下出诸多精彩纷呈、变化多端的棋局.本章节用通俗易懂的语言对博弈论的策略思维进行深入浅出的探讨,同时结合大量经典事例使这一深奥、抽象的学问在处世、职场、营销、经商、管理等方面得以生动应用,帮助同学们学会博弈论的原理规则,运用博弈论的策略思维,高效地解决现实生活......
2023-11-20
与西方国家的科学技术相比,中国传统科学技术一开始便具有鲜明的实用性取向。所以,尽管中国古代的科学家们在天文学方面拥有丰富的观测资料,但是却只是为制定历法服务,极少尝试理论构建,自然也就未能形成系统的理论体系。......
2023-08-30
如果这样的行动发生在两个人或者两个其他行为主体之间,无疑就可以被纳入博弈论的分析框架之中。博弈论的引入给多维交换理论体系带来了新变动。......
2023-12-02
可编程序控制器、变频器、伺服电机、人机界面是驱动控制系统中不可缺少的组成部分。通常,纺织机械系统中的电动机普遍采用通用变频器控制,所有的变频器则统一由PLC控制。图解演示例如,图11-35所示变频器在电梯智能控制中的应用。图11-35 变频器在电梯智能控制中的应用5.变频器在民用改善环境中的应用随着人们对生活质量和环境的要求不断提高......
2023-06-24
钢的淬透性与钢的实际淬透层深度是两个不同的概念。使过冷奥氏体转变图右移的元素将提高钢的淬透性,使过冷奥氏体转变图左移的元素将降低钢的淬透性。因此,要用临界直径法来表示钢的淬透性,必须标明淬火冷却介质的冷却能力或淬冷烈度。......
2023-06-24
相关推荐