关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 9 g, m" @& o* ~( N

6 e: d0 B3 Q+ E! N7 Q9 v0 e严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' L" n+ }& p6 D1 I
  以下三个定义:
" p3 S, ]" g2 [9 e* V, t  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ) f, x1 x5 y6 ?1 f# f
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! M0 s; H. c6 _# `' @" j7 z$ |  所谓的双方优势策略则是指双方利益总和最大的策略。  & J5 H. ~$ T( f
[编辑本段]严格优势策略举例分析( `8 ^' W  l; {5 p
  一、经典的囚徒困境
4 q9 P. p( x" g' h  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 X) ~/ v( q5 u+ W4 m+ Q; P1 }
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
# [" _& j+ R; ]1 J- X  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ B2 q. [4 Z5 Y, u5 o! i4 {  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ B' P" k; Y1 g: X6 x
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 {4 g+ ~, t1 c0 M  
: f9 |, M. G6 B) w6 o用表格概述如下:
0 i0 n1 B1 |6 |' |: z9 R# l
! a( G& p7 O& c, y. y3 H& B    甲沉默(合作)  甲认罪(背叛)  
3 h6 n7 m2 d# Z( p乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
. @) V6 y' i0 T. v/ B乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
. Q; J2 |+ z/ e( i0 `
1 W. r3 U7 V( X. l; R% X* I  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' h# |" o, D6 g2 x
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 J& j( \4 h, A9 z1 s; {  若对方沉默、背叛会让我获释,所以会选择背叛。 8 A+ o" `8 F1 W/ n: T$ k
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; |& s/ |3 C) c! |
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' c9 `% `4 {3 Z0 g8 M  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 `' ]8 S" @9 ]) I7 p3 M
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; ~* t; i) f6 f' o4 s. _  R[编辑本段]二、智猪博弈理论
* u. C/ _1 T# L0 m: L) `/ k, U  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 , @  s& g5 o( P! m# u
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 3 k6 \( |4 t& o+ I9 T
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 l9 E4 G* a. _, r7 _- a" j) e  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
$ ^& M& C9 \, q) K" V3 P! D  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % U3 v( \- y+ G6 @6 S4 s, C6 ~5 y  m3 A
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 M9 q9 p5 d# s9 j: @# {) m  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ g2 B# r' K; `; ?1 D6 i$ A  2 O9 ]4 |  g7 {
三、关于企业价格策略
; z" d* u8 r! `; M
% L9 Y+ |( N$ I$ I# V  4 u2 {* p  `; V" C7 b3 F
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! ]' [! Q0 R6 I0 ]6 T
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% X; [; {8 b( f5 f6 c3 s/ L  以下三个定义:
  U/ c8 I! h: I8 ], T  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : o0 y: ~8 u7 {" {5 z, h
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 R# Y& V4 A; o5 {' ^. z6 f: I  所谓的双方优势策略则是指双方利益总和最大的策略。  
: o$ M: W  ]" `/ l8 y2 R[编辑本段]严格优势策略举例分析
0 L: A0 d3 X6 Y3 A( K- w  一、经典的囚徒困境
& M) s/ I  W& u, b5 H; A) j  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + {* k( A3 F5 w8 [8 e0 H$ ^/ C( _
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 z# `0 d  x6 F- `  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # d5 [/ ~' e# ^) e3 I: p
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 [3 [5 g4 p" D- J  若二人都互相检举(互相“背叛”),则二人同样判监2年。
0 S) E' L* `/ m8 S/ ?! Y3 Z! I  
$ p2 B% t3 H/ Q& ?7 n4 m' B用表格概述如下:% ^2 i/ A' t2 W4 k
$ T2 D8 R0 S( i
    甲沉默(合作)  甲认罪(背叛)  
8 e8 ^2 P6 \! p- r3 E; b乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ! s9 m" |; y6 D# \+ F0 L+ l5 R! E
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
$ |# _/ U" P# q& R9 _3 R; l. W2 ?( ]9 }; L' _
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. S: d) B& y% B0 x$ A; p# ?4 Z  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % L6 T: M' ]- B
  若对方沉默、背叛会让我获释,所以会选择背叛。
5 O" e. g8 c, X. W" c  D1 t2 ]  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 T7 ~. q5 p$ V, }6 z) R5 @
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # v! \, t5 ], ]/ h8 n7 Q0 [
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: K4 _& c4 g& o" P: w' B" Q  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. K: x1 ?' N5 G( S0 G3 b/ G
[编辑本段]二、智猪博弈理论  q" P% e9 x' P
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* {- O6 a2 Q/ L( N$ Z  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ a4 t7 P; B, c/ A; h# F4 A  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 @8 q8 x+ B& a
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
: r. F- n9 {; d  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 }% r' p4 G8 V% D, C1 B+ Q  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* Z7 _, z5 x6 f7 u  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# J& p; p0 Y$ E0 ?" j  
! Q2 e) t  a2 a% a三、关于企业价格策略) X0 I2 x5 |8 d* {2 m
) P8 ]6 H8 W1 x5 \' @0 C
  - j4 O2 E& f7 Z/ M6 J; N
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) G" G( E3 |. a' f& g) O  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
  Y# p6 G7 U# A6 B2 o) Y% ^3 z' y  以下三个定义:4 ?( N: f: M+ T
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 z' d$ c1 x5 l. c3 r; j: `# y  \
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* o! U, {5 n6 G  C! v1 M$ K, C  所谓的双方优势策略则是指双方利益总和最大的策略。  4 F! I( r7 T" n1 K. x
[编辑本段]严格优势策略举例分析/ w! V! k% {; `" Z3 Y0 ^; f% J
  一、经典的囚徒困境
* D- C0 o; X0 c0 F! S  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % _+ K" G) |, G  t. H
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ! \, e! t2 ]7 ?6 L
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 m( X' K) i( w$ i
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 _, {" `0 D' j/ g6 x& {* v6 ~
  若二人都互相检举(互相“背叛”),则二人同样判监2年。- N' y/ n& K% U1 Q) ]$ P
  + l, M8 N. x2 u& P* G5 ?
用表格概述如下:
( u% }# I1 m* [* Q- [+ Q
( B) b, [$ T# O" f* c8 t    甲沉默(合作)  甲认罪(背叛)  
( I5 W0 b8 G- F0 p% C乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  + H1 _0 r' ^- @
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
" f5 y1 c  \( y# k2 S) q; o- P1 }# H& O$ \# [9 o8 r
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; p0 K" {/ ?% E
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 W4 j# k. E. w# R4 @  若对方沉默、背叛会让我获释,所以会选择背叛。
/ G6 G1 n2 j9 L, A8 b  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 & k: L* \( ]2 m, F" D
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。   B0 ?- A, G0 v2 Z
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 " M/ H5 `8 s! L; }
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 X% n  b' W1 S4 D[编辑本段]二、智猪博弈理论" G* s% H2 _4 r+ a, ~9 H' o; U
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: d& k: o8 c6 A# a7 z' N, l7 v# i  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' j; j$ u) v' l4 f! ?. `2 C
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - b' x; x) |, r# {
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
! }9 I) \+ r9 Y/ _; a8 d' E5 D  [  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 g6 q8 x* X1 O  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- q6 U; D3 m3 Q1 n  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 X* Q  V* |8 G( I; H" s* j& h  
# ?! \$ D5 m2 T* W0 }三、关于企业价格策略- p7 e9 o; w# a& [5 U$ H
% |/ ?  F6 s8 c+ G1 W; j
  
$ }% H% n- |% X) |  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 s% q- H8 I/ g9 B- n6 j  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% W1 ?& Y6 u# N5 w2 _
  以下三个定义:
- C9 D4 I# u: R  y% \! P  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : V2 e7 }/ B% ~% V5 N, M8 b
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
/ _% e0 A" L1 D5 k6 m$ o  所谓的双方优势策略则是指双方利益总和最大的策略。  
2 k4 r5 Q4 j$ g[编辑本段]严格优势策略举例分析, a; o2 B4 x: e9 y
  一、经典的囚徒困境 & ~- G# A) A/ G: l* T4 [
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * G1 A- I* U" z( V; M. z! X& d
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 [8 T" Q2 ~/ i* F% m% }  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) N. `" K, g& u  h8 ], I
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ h; L9 v' y, Z7 d: a/ f# r. v  若二人都互相检举(互相“背叛”),则二人同样判监2年。( ?9 T4 _0 j. p* K( A! ?# ^4 C
  0 T$ g1 S- u2 c; P% G, ^/ J/ J" S
用表格概述如下:+ r1 J2 H1 ?7 V* K$ I

; Z! D/ m0 z+ v6 R    甲沉默(合作)  甲认罪(背叛)  7 p+ W. s6 C2 i+ Z* m9 p: G
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
9 {  R& _. d0 L- E乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
8 i2 C5 K" \$ i7 ?; c6 ?0 G4 U0 j/ Z
. e% H0 i& U" _8 @3 o  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; J2 ]/ M; k2 h& [! J
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 X5 d' C8 T  q  若对方沉默、背叛会让我获释,所以会选择背叛。
& j6 E2 `2 k9 n0 Q& R  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 O% ~/ R& E1 s. E3 ]! |* d
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 F" _3 [# F* H. j" A) u  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- n; b/ g# ^% |9 l1 [  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
8 G+ J0 s  {% f[编辑本段]二、智猪博弈理论' s  h' M/ `0 u9 L* x; h
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 L6 ?9 ^4 g# R2 {  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! g; G; p+ |0 A& a2 U' [
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 [& [$ y6 p) F) @4 b  R
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # G" z2 ?+ n& M5 @6 H6 y
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
/ D% b1 u( M, D0 L4 F  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! J$ R" v( @& l
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ [* l3 F/ u9 g% t3 c/ ]% A( y
  - z* E- Z+ b* M+ f& O7 f7 S( f
三、关于企业价格策略
. A) E+ }1 A9 A2 i: U9 v  n+ ]4 L9 {- d; N5 s
  ( s" @5 u, d4 C5 D; h% s
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 P1 e# O8 n: K3 L# M1 m; @  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )