網路城邦
上一篇 回創作列表 下一篇   字體:
囚徒困局系列:【三】學生與政府的「墨西哥對峙」僵局
2014/03/24 10:55:04瀏覽8899|回應1|推薦6

本來好好一個賽局已經玩到一個穩定狀態 ─ 學生持續佔領立法院政府不敢驅離 ─ 卻把佔上風的「懦夫賽局」變成了雙輸的「囚徒困局」。政府覺得當「傻瓜」的代價已經比鎮壓的代價更大了當然只好鎮壓結果呢?唉!

賽局理論中,參賽兩方對峙而形成僵局的情況可以是所謂「懦夫賽局」 (Chicken Game) 或「囚徒困局」 (Prisoner’s Dilemma)。兩者數學上的差別似乎不大,但理性的參賽者在不同的賽局卻會有很不相同的行為。此次學生運動便見證了兩種賽局的不同,其差異直可以影響到國家及個人的命運。

關於賽局理論的一些重要概念,如參賽者 (player),策略 (strategy),結果 (outcome),收益 (payoff) ,優勝策略 (dominant strategy),納許均衡 (Nash equilibrium),伯瑞多最佳結果 (Pareto-optimal outcome)等,請參考本系列前兩篇文章:

囚徒困局系列:【一】金球的囚徒

http://blog.udn.com/nilnimest/11469490

囚徒困局系列:【二】電影〈史密斯任務〉中婚姻的囚徒

http://blog.udn.com/nilnimest/11636764

下面是「懦夫賽局」和「囚徒困局」的收益矩陣,其中

  • AB參賽者
  • CD策略C=合作 (Cooperate)D=不合作 (Defect)
  • (DC)(CC)(DD)(CD)結果或策略組合
  • T收益,參賽者一方合作另一方不合作時,不合作者的誘惑 (Temptation)
  • R收益,參賽者雙方均合作時,合作者的報酬 (Reward)
  • P收益,參賽者雙方均不合作時,不合作者的懲罰 (Punishment)
  • S收益,參賽者一方合作另一方不合作時,合作者的傻瓜收益 (Sucker’s Payoff)
  • 4=最好收益; 3=次好收益; 2=次壞收益; 1=最壞收益

「囚徒困局」 (Prisoner’s Dilemma)

 

Player B

C

D

Player A

C

R=3R=3

S=1T=4

D

T=4S=1

P=2P=2

T>R>P>S

「懦夫賽局」 (Chicken)

 

Player B

C

D

Player A

C

R=3R=3

S=2T=4

D

T=4S=2

P=1P=1

T>R>S>P

兩個賽局的差異,在於在「囚徒困局」中,S是最壞收益,而在「懦夫賽局」中,P是最壞收益。

在「囚徒困局」中,由於T>R以及P>SD 是優勝策略,(DD) 是納許均衡,但因為 R>P(DD) 不是伯瑞多最佳結果。理性的參賽者會選擇D,但雙方均會因 (CC) (DD) 來得好而懊惱。可是 (DD) 是納許均衡,因此參賽者不會一廂情願地改變。反過來說,雖然雙方都知道 (CC) (DD) 好,(CC)卻不是納許均衡,即使兩人約好共同選擇 (CC),只要承諾沒有約束力,堅持合作的結果只會得到最壞的傻瓜收益。這是此賽局之所以是困局的原因。

在「懦夫賽局」中,由於 T>R 但 S>P,不論CD都不是優勝策略。可是這賽局卻有兩個純粹策略的納許均衡:(CD) (DC)。不論是 (CD) (DC),理性的參賽者在這兩個結果中,都不會一廂情願地改變策略,因單方面改變只能帶來更壞的結果。而且 (DC) (DC) 都是伯瑞多最佳結果,因為不管怎麼改變,都會有參賽者受害,所以這賽局不是一個困局。

「懦夫賽局」的原型故事是兩人開車對撞,如果選擇在相撞前避開,就是合作 (C),否則就是不合作 (D)。因為避開被視為「懦夫」 (Chicken),故賽局俗稱「懦夫賽局」。一般人應該都會同意當懦夫至少比撞死好,所以 T>R>S>P 是成立的。冷戰時期的古巴飛彈危機事件中,美蘇之間核子戰爭一觸即發,但最後關頭蘇聯避開了;賽局的最後結果是理性選擇理論所預測的一個納許均衡的結果。

這次學運,佔領立法院可以看成一個「懦夫賽局」:

 

學生

和平離開立法院

堅持佔領立法院

政府

不驅離

R=3R=3

S=2T=4

驅離

T=4S=2

P=1P=1

對政府,特別是威權性強的政府而言,驅離可以展現維持社會治安的決心,處罰參與行動的學生以警效尤,並讓事件儘早落幕。如果學生面對驅離而和平離開,則政府鐵腕收效,又沒有流血衝突,這是對政府而言的最好結果。如果政府不驅離而任學生佔領數日後自行離開,則政府雖無橫暴的惡名,卻可能因任學生佔領公署拿不出對策而遭無能之譏,不過事件總算和平解決,這是次好的結果。如果政府不驅離而任學生持久佔領,則政府根本是無能解決問題,這是次壞的結果。最後,如果政府驅離而學生抵抗,致造成流血衝突,此結果恐怕政府不願見,而且也會有嚴重的後續效應,恐怕學生及反對政府暴力的社會人士也不能善罷干休,因此這是對政府而言最壞的結果。如果這樣的收益分析可以成立的話,T>R>S>P 對政府是成立的。

對學生而言,如果政府不驅離,能持續佔領立法院至政府在服貿議題上屈服為止,那當然是最好的。如果覺得象徵性訴求已經達成而自動見好就收退場,像洪仲秋事件時的公民1985行動一樣,則也不錯。如果等到政府驅離才乖乖離開,則團體的威信受損,而且恐怕會遭秋後算帳,這是次壞的結果。當然,被暴力驅離是最壞的結果了。這樣的分析顯示:T>R>S>P 對學生也是成立的。

由於T>R>S>P 對參賽者雙方均成立,這幾天在台灣上演的「佔領/驅離」賽局是「懦夫賽局」。政府的立法及行政部門一再宣示不會用武力驅離立法院的學生,可以說政府至少暫時扮演了懦夫的角色,而立法院的學生並無退讓跡象。根據賽局理論,這樣的結果是「懦夫賽局」的兩個納許均衡之一,在雙方不改變策略的情況下,這個結果是穩定的,各界不期望這僵局能夠很快解決。

那麼為什麼23日晚上會發生流血衝突呢?那是因為賽局的收益矩陣改變了。主要是對政府而言,立法院的情形已經使得它蒙受無能處理的惡名,而且立法院的議事受阻問題還不算太嚴重,如果連行政院施政都要受影響,那根本政府不成其為政府了。而且學生佔領立法院,行政院之後,下一步可想而知是總統府,是可忍,孰不可忍?當一個傻瓜 (Sucker) 已經夠糗了,難道還要當兩個,甚至三個?所以學生佔領行政院後,對政府而言,S 已經變成最壞的結果了,

因此,新的情況使得對政府而言,T>R>P>S,驅離變成優勝策略,而且不必等待,當天就採取行動,學生是否退讓已經不重要了。

那麼學生為什麼要進一步佔領行政院?首先,這也許只是一部分學生的誤算。目前的報導無法確定佔領行政院是誰發起的行動,而且沒有證據顯示它與佔領立法院的學生領袖林飛帆等人有關。但手機及網路世代,動員容易;不論是誰發起,群眾不加深思而跟隨,從賽局理論來看,就是非理性的行為。但也許這些發起人認為在馬英九記者會「跳針」似的談話後,持續佔領立法院已於事無補。而進一步升高衝突,甚至流血,或許能夠得到比枯坐立法院更好的結果。這樣的話,賽局就變成如下的囚犯困局了:

 

學生

和平離開行政院

堅持佔領行政院

政府

不驅離

R=3R=3

S=1T=4

驅離

T=4S=1

P=2P=2

如此,雙方對峙就是一種所謂「墨西哥對峙」 (Mexican Standoff) 的囚徒困局了,如吳宇森<喋血雙雄>中有名的這一幕。這種對峙之下,你不開火他開火是最壞的結果,所以理性的參賽者會希圖僥倖而開火,但如果你的火力沒他的大,吃虧的終究是你自己。從支持學運的觀點來看,好好的一個「懦夫賽局」玩成「囚徒困局」,這真是可惜的事。

( 時事評論政治 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=nilnimest&aid=11950762

 回應文章

煙酒生
2014/04/07 12:12
這樣似乎是事後諸葛了
賽局理論用在非理性的政治問題上有些不妥
回到攻佔立院當天,如果今天反服貿的人民是大部份民意
那政府立即驅離就成了專權,若沒有驅離也不會有”無能”之名
更何況”無能”之惡名在這事件上是挺服貿人士冠的,無法說這是大部份的民眾認知;再說,我們自我感覺良好的政府從來不顧無能之說,如此怎能作為決策因素考量。
相對地,攻佔政院一事,政府方若未驅離,也不一定會淪政府非政府的局面,別忘了人也是非理性的,反對學生的聲浪也或許會因政院甚至總統府而進一步高漲激進(voltaickey@yahoo.com.tw)