关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 * r- r5 f# {6 B! z
. }  j4 x, K- p  h6 J. T$ P; {
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ [( O/ M. b. v" {* t" o
  以下三个定义:
2 t1 @% O  F- X( X0 }  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& Z& A4 e% I8 G- P; ]" v  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ k% o# m+ ^1 x) n
  所谓的双方优势策略则是指双方利益总和最大的策略。  ; M3 ]8 c' D6 Y
[编辑本段]严格优势策略举例分析( ]  z! F! u: b8 Y( V4 T
  一、经典的囚徒困境 2 Q/ P' \3 j9 _$ i+ f( A
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: - g3 G8 T! O( j, e- e: D" M+ b: H
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 5 N7 m" q0 m- G4 m9 ?0 e. t
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. l5 U, O# B* t  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 g1 F& e0 m9 T7 V  若二人都互相检举(互相“背叛”),则二人同样判监2年。/ Q1 R# R7 P# Q& B/ k9 l* g* m
  
% m; h6 [. q- R9 H4 c用表格概述如下:
3 e5 J  l# {  h5 O* \. X; d
. g! J6 l4 T9 C/ j: g5 |: r    甲沉默(合作)  甲认罪(背叛)  ! P4 U' P+ V1 {2 r) q: t: `* v
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
1 ~& P) \& b3 e6 @: ^, d, e乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  : [! y- x) t% h$ T+ i1 w1 q" ~; ]  I

0 T* S# ?6 B8 Q) l' q" l  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 ?2 H+ R4 B9 s3 y8 t/ r
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * n7 i" p% J8 E6 p1 {7 ]7 ?2 k
  若对方沉默、背叛会让我获释,所以会选择背叛。
" @+ g7 N; M+ j1 L* M  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 m; `- y) W! o: a9 J' q
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& X4 {; {1 N; h& R, {0 }  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 C6 a& {! ]; P+ e  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' Q; R' g, Z9 J[编辑本段]二、智猪博弈理论
. f+ f* u7 t& `  ^$ U4 H3 N  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ) Q$ i* t) Q5 Q# F0 s' t
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 w7 A5 ]3 B+ }6 v& J; Q
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 n' W3 h) t) }* G  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
5 J  D; ]; z8 a+ N% t) X9 C; Q  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! v. w8 i' s2 Z8 X' x! G1 C
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- e4 r, l5 A6 v- d: z  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 k! X4 S& n0 c8 r4 A% t  # `& @% x6 L' P2 \0 _( B
三、关于企业价格策略* {: L+ ^( F; a' T
' I* t" Q, d; j! U$ M! E
  
3 z9 ?0 z0 @1 v  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) C3 z0 f5 k1 |  d2 O  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% k" w1 l6 [  \8 q  以下三个定义:4 S, _8 G' W6 ?
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 z! l# b3 C1 @1 J( n& }) e  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , j; k* u+ \, U7 J3 `! _) ~' J
  所谓的双方优势策略则是指双方利益总和最大的策略。  
; [0 q- b+ X4 b2 g9 m[编辑本段]严格优势策略举例分析+ b% U0 Y# I, v; ?# ?4 k# z0 t
  一、经典的囚徒困境
, d) _4 O+ S; G4 R  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; _0 S# I1 S# C
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* a' i6 ]5 R' s$ l$ @. e' b  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) A9 H) K" s/ k! _% S  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ; {' D4 h3 B" j/ w9 b8 `
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 M& S  V/ L- R( m: {# Y+ u+ F  5 }8 E; N& G5 j# X, ~
用表格概述如下:
# D4 O/ r7 f% {. Q# A( c! n- F5 i6 Y$ V, _1 Z6 v
    甲沉默(合作)  甲认罪(背叛)  7 H6 s1 ?: V# t9 [$ A3 x! T3 J. X
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  " U3 Y. t7 Q5 o% o
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  $ Z, ^- E# a: o1 b

6 B8 t  L+ Y6 F+ o! k  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- S! V8 a" H. l/ H  c, t  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : G4 U& X4 {. A" n
  若对方沉默、背叛会让我获释,所以会选择背叛。
+ g! l/ ]$ X9 \  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ j2 p( E/ {! g% {  ^  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! A3 \% p/ _4 L( e; S/ O; X$ d. Y
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
  ^3 `& n' F' {2 P, K1 d7 A  ^* m  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ N3 j8 H4 P) K4 X* K' x
[编辑本段]二、智猪博弈理论" _6 T+ \3 d$ a* ~* w: {+ V. O
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; f- j* X2 r$ L* P
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( H3 i8 d. K7 s) J6 T: f/ r0 s  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- t' O0 J" b' R) E$ H  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。   a1 \  j) l! p+ h& {+ @
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % f% B4 f& L( z4 U; s' O
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
# p8 t0 j9 {! I  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, D7 _- Z* \3 w- ]# o  $ _6 h* s: F4 i3 P% l1 E
三、关于企业价格策略
3 u7 |/ y: x; M2 r* h, [8 V7 k5 L" A4 _
  
" T1 p% M3 S1 v  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( {, v& v; p/ Q7 X% b; m
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# Y: M. f$ j6 L  [( Z5 J; M  以下三个定义:
) t2 z: S# F; P; H' k* J4 h5 k  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 7 a% ^" E9 H: u/ j
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 / I; N2 w+ n% C& L# T
  所谓的双方优势策略则是指双方利益总和最大的策略。  
& Y7 n% k. U) Y3 f; |% @[编辑本段]严格优势策略举例分析& L6 i3 H0 _. i; ]8 z7 o4 D% g
  一、经典的囚徒困境
/ j) r/ r6 j% x! I3 l  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 Z/ r$ }4 S" w' U% Z+ u0 S  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 B& l1 m6 ?" O5 F( ^  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ Z, i" \$ h* G( A( i" P. p8 g  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : v. p+ h6 H8 e/ d% M. m8 _
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
. `. g  M  a+ f- u" W5 m  # \1 a, y- l$ X* h5 a
用表格概述如下:
% r0 j% S8 l2 N/ a1 e3 a' a$ g
% U3 G: d8 Z8 T    甲沉默(合作)  甲认罪(背叛)  9 {, F% J$ M0 Y. p6 C& b
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
8 g: `6 ?6 v% T' \乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
. ~& f6 H6 Y$ D6 W) k, z# H4 S1 }# j6 L* d
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 f: B. J. W0 C1 w; @4 S; L$ G
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
% Z8 h" z/ B# i8 Z* B: |  若对方沉默、背叛会让我获释,所以会选择背叛。 5 V1 b0 I; N) W8 l) B! {2 D
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 H" w5 S7 H' L! W) e/ }  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 4 ^$ s" M) V$ s& l2 }! j
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ O; n  n; d! H9 i  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
9 F& \# h2 `/ J0 {) H[编辑本段]二、智猪博弈理论
: _* p4 T  ~% l5 b% P, D  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% [! R) P' y0 O4 ]( k/ ]. F  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
  z3 B6 P9 a9 A9 ]  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) `- W* R  I! s  N) \* a. B  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
5 z# E/ v7 B- y- L' q  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " D6 c; Z  M% B$ y  M) ]5 a3 l# i
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 7 k! Z' N( x! k" R
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 T0 G5 s5 G; j! L
  
4 @+ o) i5 R8 k" M* y三、关于企业价格策略
' j5 l4 F; |/ ]* P, D5 [9 l1 _/ ~3 l
$ n* A, w2 [1 C5 p: q/ E  2 W5 t% p5 a! p& A  K0 Y) Y8 o
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / b+ t( u) g/ L- N
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);( ?+ x0 v. z% ~. z5 E1 x. A- q. ~
  以下三个定义:
* F' D# h9 i& Z  J2 r  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 |: k! J. K" R7 l7 d5 a
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! Z/ Z" c+ g% g% R
  所谓的双方优势策略则是指双方利益总和最大的策略。  
4 O7 Y" J+ p' g[编辑本段]严格优势策略举例分析+ A. N/ u3 T" e
  一、经典的囚徒困境 8 @% T7 b. n8 W: y( i, M
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! a  c# z' x0 O2 u! k! O" r7 j  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   g) h# T1 Y% @4 p; k) C# b7 t
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 _2 C: I+ [3 q* J5 P
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。   K& Z1 y9 T9 Z0 d/ V# X
  若二人都互相检举(互相“背叛”),则二人同样判监2年。8 y6 [1 g' z8 D7 T, [3 K
  ; p% @7 _. `! e/ w/ `/ d
用表格概述如下:9 L4 y# c0 B  P
1 q2 B: N/ \9 q5 l3 b- a
    甲沉默(合作)  甲认罪(背叛)  
# p  Z0 C- }4 b6 {+ ?/ K& _乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; x7 s* _+ ]8 r+ q乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  3 A3 k% ^" p# j

) `# s/ _2 J5 Z" I  X+ ~  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* B( i! q9 Q2 m- ~6 T% z/ R  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 \* _% @7 x6 B5 T0 P1 I: {& E
  若对方沉默、背叛会让我获释,所以会选择背叛。
" g: f" X) m; U  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
: x. q! }: j6 ^' L% h, z  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( u- x" r( I# }7 W9 {  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 H1 w/ z0 m1 y/ I9 R  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ I1 k* N& x5 s3 t9 p7 g[编辑本段]二、智猪博弈理论% Z0 Y5 ?& n( s) u7 d* ?
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( X9 _# F0 ~7 S& F
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # G8 P8 I4 h! v, [4 g+ ~
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , h; E# o* G3 t8 n( A+ U! X: w
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % Q3 P- s  f9 W. ~
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " t5 P( B  t) l' Q! |2 U
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 g$ F( s2 p/ @. {; [. [  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 C: L" B3 |( E9 l7 ]% H& z
  
, P2 I* p+ R9 R. O- T三、关于企业价格策略
0 P1 S) f& f# {4 M
& g* C# y- H6 K( W1 f  # {0 I6 [$ Z% {. s# F# ~% U
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ j1 d8 l/ `8 w3 j# i3 b  m0 D
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )