关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
4 h0 F3 x/ k$ a8 V3 t% @6 a5 I* Q' v/ a
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; b* t9 v/ h$ y) c$ k
  以下三个定义:
; ?' b& w& Q9 X5 u) N  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 z3 W/ A4 U. R
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
  c; E* [$ t3 N& j  y  所谓的双方优势策略则是指双方利益总和最大的策略。  
8 m2 A; `" F+ h  S! @! K) y[编辑本段]严格优势策略举例分析
; k. C& I7 N% @, N% A# V  一、经典的囚徒困境 ( f/ p2 N8 S3 _" X1 f; d
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! p; n3 n' y+ Z8 F4 Z7 g) k& V
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 m3 H1 r& I: n* Y3 A
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 b! D; Q/ ~! d5 `/ j8 |
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / Y) D* s- i5 ]* T/ A* E2 g) K
  若二人都互相检举(互相“背叛”),则二人同样判监2年。. N( w; ^7 w7 u& ~+ ^
  0 t' t3 r0 z2 b8 f
用表格概述如下:( H: G( X4 z5 ?4 o- v  C
3 U. A/ M$ B3 X8 d5 m( M$ `
    甲沉默(合作)  甲认罪(背叛)  $ Z+ u8 h% E7 J$ d
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  0 G' K$ G7 x$ z1 F
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
; d4 H# b( |6 R0 y
3 f" W/ R- @5 W1 g1 W9 z1 z  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 ~, N4 Q9 O6 {* d7 T( o
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* Y7 T# v8 n8 P" e' F) N5 Z  若对方沉默、背叛会让我获释,所以会选择背叛。 : n  E0 @' B5 @) E5 y$ U% u7 s+ j
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 ^9 `" Q, a: r8 P
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 5 E; H2 z) r. N5 _" c
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 f9 B3 ?! |! e
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& E3 @) _3 t. q+ Z; K7 S[编辑本段]二、智猪博弈理论
# p- c, T" C' r' u# p  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。   H! a, W/ _, v. T7 M# e
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( o' c7 I3 |' S  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* U8 {) s& T+ E1 G/ x4 J  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
! X0 t$ _6 J* x2 e# t5 }  ?  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 z# z% ^% Q! S" `* F% l4 `  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) c5 ]0 ^5 L4 a( f' L' d1 q
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。5 v+ d, U" T5 S. t
  
. g- s4 ?2 U) e3 h三、关于企业价格策略
( j& V+ _7 b; _! K" q
7 X/ {4 l7 H+ Y0 \: Z* m  8 O7 V4 h3 n8 v  y7 a/ z# `
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. A. ^  B# @. B9 h  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ L# p& f4 j3 i; P3 d3 @  以下三个定义:
$ r4 H) f; }& i, V( Z+ O  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ W$ `3 `6 z( M5 c$ q: J0 T. i  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* w/ m8 I( f' p: [8 f  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ a" a' O! i0 [" ?: V[编辑本段]严格优势策略举例分析
5 ~8 T- Z/ _% {- D! T' H& U9 m  一、经典的囚徒困境 $ [6 @! q3 w5 X! y
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' |/ P9 v& {: ?( H2 b" I0 ?" I; w  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - M% U. k5 ~1 H1 p
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) |, v5 [7 G- T& q6 g
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
  R& l. k" R2 {! C6 T  若二人都互相检举(互相“背叛”),则二人同样判监2年。
- ]4 ~( w! K3 c$ h! J2 i2 S  
/ P8 ?! `5 z, r  b用表格概述如下:
8 z4 ]$ Z% t/ R" p/ H; T; K6 j- W* W; n. L
    甲沉默(合作)  甲认罪(背叛)  " X7 f! {0 L; ]  c# R9 _: J
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年    \' f/ \3 u- X8 N- s7 o
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
* I! I/ R! @& T8 U* k  r* ?3 @* k4 d1 `0 P& }
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & c' |# ]! q, W# b6 H9 L
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 {8 ^' F8 Y0 S4 S; |  若对方沉默、背叛会让我获释,所以会选择背叛。
( v3 }) ^/ o, N. N" T( p: P  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* K1 A1 L1 K  ]0 v  V8 _4 M! W$ Q  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 H, m0 o2 P& H7 w  P  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 # i" T# X1 A& G/ T/ E
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 _+ Q- o8 C' ]6 S7 ]$ X[编辑本段]二、智猪博弈理论3 Q/ [% v1 q' h% N
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
  G9 R! @' ^8 s" z8 m0 Z  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 H- U/ N) I/ R: S. Z3 w; O
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ! P* \( y/ v) A3 T6 j5 h
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / x0 e' W, h& N( L  N
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 K' b& Z  D$ S4 Y( I6 {  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 * ^8 d9 t0 Q2 g' z- v
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" P5 ?: f- @1 J( s  
3 k* c8 A) D, q+ k三、关于企业价格策略8 `' Z7 y! {. C9 x6 x2 {% m$ g4 u
. i3 \" T# U) d4 E" b* \- }/ R) I: s7 f
  
' k8 `2 J9 h! V6 a$ ?  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( C! V/ e, {3 @) e  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, z; i' U) r3 f9 O& h  以下三个定义:. r1 J! W8 S8 M
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. _* e+ }- Q6 w3 s  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( [7 w( u- X9 \2 h  所谓的双方优势策略则是指双方利益总和最大的策略。  * H- F- E4 W, C/ n# V
[编辑本段]严格优势策略举例分析
" z  l. W# F" Z3 S2 X$ N  一、经典的囚徒困境 & x" F7 W2 @8 h# \! o" \
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
* c4 d. y& j% `" Z1 e  a: k, g; ]0 r  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 p1 d" v: t9 I/ `
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( b" k' y7 G4 t4 d
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , r1 f0 O% _8 o6 \: t& C3 l
  若二人都互相检举(互相“背叛”),则二人同样判监2年。. k1 K, f8 W. O. |3 j. e8 p4 \
  
0 @% T4 E2 C; ?% S用表格概述如下:
! [1 X4 m7 K1 y& o6 q
1 Y; o. r: w% i8 P    甲沉默(合作)  甲认罪(背叛)  8 e# P" |6 }5 n
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
: M0 `% [5 M: @; n% }9 i乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  2 Z0 P* v7 C, _5 z

- N( i0 M7 K# Y, P: o  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ ]# A! W! y) T; [: _
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! v0 B0 P/ M* f; _8 p  H/ a% l  S  若对方沉默、背叛会让我获释,所以会选择背叛。
% _; @* S& J) t" V% O( e  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
: I- V* R6 G8 @9 Y1 B  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 4 d3 E4 g' B/ m+ G; w* U
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & D6 m) `. M3 \
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& l1 @+ D- D/ X+ U6 ^  q% g: z[编辑本段]二、智猪博弈理论, Y+ C$ J9 c- Y8 Q0 I6 R
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; N: e) [) m1 N  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 7 {% ^# S% V5 U- l) v+ V
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 $ z8 _4 C9 A* e5 O/ a& ^
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, s$ J2 [+ f9 v- w  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) K7 C: r/ k) R3 m
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ' s: r: }2 @1 E8 Q) c7 W
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' U' V; V- T# q, ^
  
* e$ ^  R7 V! {+ A% f3 b三、关于企业价格策略
3 Z, K2 p) j9 h' Y! c  T! v1 J. x: e
  
2 G" T+ \, C# `) }+ w  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 L3 Z) j" S) e/ u5 `: l$ w' g  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& E# a7 u; J& U, |- }# ?1 z% u
  以下三个定义:
) f! {! H% K0 W  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " ^: y# _7 v, M! P
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( F  z7 R  d* P+ R  所谓的双方优势策略则是指双方利益总和最大的策略。  
" \( j. ?, h7 d2 M( T4 e8 |[编辑本段]严格优势策略举例分析& a6 v9 a, I, T
  一、经典的囚徒困境
) B- L! `: i% p% m( I% `8 ]  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " Q% V0 C( B7 r' O4 j; r* q! j
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # E  W% o: {' \0 e4 o
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 & s# {! m- w, Y& m  p* R5 d
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
. m3 L4 _5 I5 ~9 Z: R, ]4 l  若二人都互相检举(互相“背叛”),则二人同样判监2年。
, z* R" v4 P; b6 i  7 n/ Y- K" o( D
用表格概述如下:; }, u5 f2 B; |  I( q  y' ~9 u

  B! k6 G$ E/ N1 ]4 D    甲沉默(合作)  甲认罪(背叛)  
) [) ?) C% M; b乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  $ S! @1 Y& z7 i2 Q0 X/ i
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ' H  G. j+ }% B

" i' _9 d. J" U* \1 n  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) ]4 N# D1 N' N7 J  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 z" B! x+ T& o) F  `
  若对方沉默、背叛会让我获释,所以会选择背叛。
6 B6 a/ B0 H) ^4 u4 K3 g  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, h* S) ?6 `1 r5 H+ N9 _3 h9 x  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ k1 ^4 s* A6 c/ U/ o! e  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
/ @) c9 V2 ^0 Z$ k0 p5 F1 o& Y  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' P9 o& d+ p) d. G! ~[编辑本段]二、智猪博弈理论
# ]9 Q/ {5 v! p7 ~  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 A# u% w* i. n' J5 @: C
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 C4 C% v2 W" g$ j  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , b8 }) ]( ?& a9 ^: o- u9 _
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 u+ @4 E$ l: U2 q4 d6 r
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! ?3 T. N0 a$ t$ C- J  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , }6 b0 ~# K6 M* U0 p
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' B1 ?1 ]0 `, _  8 t: K' P  V3 l3 [
三、关于企业价格策略
1 r  \& c6 e7 Q9 A6 i
9 V0 x" F" f! g* z  1 g* ~2 i) x7 w. t
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? * o3 T: ], J  ?
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )