囚徒困局系列：【三】學生與政府的「墨西哥對峙」僵局 - 林澤民的部落格

字體：小中大

囚徒困局系列：【三】學生與政府的「墨西哥對峙」僵局

2014/03/24 10:55:04瀏覽8899｜回應1｜推薦6

本來好好一個賽局，已經玩到一個穩定狀態 ─ 學生持續佔領立法院，政府不敢驅離 ─ 卻把佔上風的「懦夫賽局」，變成了雙輸的「囚徒困局」。政府覺得當「傻瓜」的代價已經比鎮壓的代價更大了，當然只好鎮壓。結果呢？唉！

賽局理論中，參賽兩方對峙而形成僵局的情況可以是所謂「懦夫賽局」 (Chicken Game) 或「囚徒困局」 (Prisoner’s Dilemma)。兩者數學上的差別似乎不大，但理性的參賽者在不同的賽局卻會有很不相同的行為。此次學生運動便見證了兩種賽局的不同，其差異直可以影響到國家及個人的命運。

關於賽局理論的一些重要概念，如參賽者 (player)，策略 (strategy)，結果 (outcome)，收益 (payoff) ，優勝策略 (dominant strategy)，納許均衡 (Nash equilibrium)，伯瑞多最佳結果 (Pareto-optimal outcome)等，請參考本系列前兩篇文章:

囚徒困局系列：【一】金球的囚徒

http://blog.udn.com/nilnimest/11469490

囚徒困局系列：【二】電影〈史密斯任務〉中婚姻的囚徒

http://blog.udn.com/nilnimest/11636764

下面是「懦夫賽局」和「囚徒困局」的收益矩陣，其中

A，B：參賽者
C，D：策略，C=合作 (Cooperate)，D=不合作 (Defect)
(D，C)，(C，C)，(D，D)，(C，D)：結果或策略組合
T：收益，參賽者一方合作另一方不合作時，不合作者的誘惑 (Temptation)
R：收益，參賽者雙方均合作時，合作者的報酬 (Reward)
P：收益，參賽者雙方均不合作時，不合作者的懲罰 (Punishment)
S：收益，參賽者一方合作另一方不合作時，合作者的傻瓜收益 (Sucker’s Payoff)
4=最好收益; 3=次好收益; 2=次壞收益; 1=最壞收益

「囚徒困局」 (Prisoner’s Dilemma)

		Player B
		C	D
Player A	C	R=3，R=3	S=1，T=4
Player A	D	T=4，S=1	P=2，P=2

T>R>P>S

「懦夫賽局」 (Chicken)

		Player B
		C	D
Player A	C	R=3，R=3	S=2，T=4
Player A	D	T=4，S=2	P=1，P=1

T>R>S>P

兩個賽局的差異，在於在「囚徒困局」中，S是最壞收益，而在「懦夫賽局」中，P是最壞收益。

在「囚徒困局」中，由於T>R以及P>S，D 是優勝策略，(D，D) 是納許均衡，但因為 R>P，(D，D) 不是伯瑞多最佳結果。理性的參賽者會選擇D，但雙方均會因 (C，C) 比 (D，D) 來得好而懊惱。可是 (D，D) 是納許均衡，因此參賽者不會一廂情願地改變。反過來說，雖然雙方都知道 (C，C)比 (D，D) 好，(C，C)卻不是納許均衡，即使兩人約好共同選擇 (C，C)，只要承諾沒有約束力，堅持合作的結果只會得到最壞的傻瓜收益。這是此賽局之所以是困局的原因。

在「懦夫賽局」中，由於 T>R 但 S>P，不論C或D都不是優勝策略。可是這賽局卻有兩個純粹策略的納許均衡：(C，D) 和 (D，C)。不論是 (C，D) 或 (D，C)，理性的參賽者在這兩個結果中，都不會一廂情願地改變策略，因單方面改變只能帶來更壞的結果。而且 (D，C) 和 (D，C) 都是伯瑞多最佳結果，因為不管怎麼改變，都會有參賽者受害，所以這賽局不是一個困局。

「懦夫賽局」的原型故事是兩人開車對撞，如果選擇在相撞前避開，就是合作 (C)，否則就是不合作 (D)。因為避開被視為「懦夫」 (Chicken)，故賽局俗稱「懦夫賽局」。一般人應該都會同意當懦夫至少比撞死好，所以 T>R>S>P 是成立的。冷戰時期的古巴飛彈危機事件中，美蘇之間核子戰爭一觸即發，但最後關頭蘇聯避開了；賽局的最後結果是理性選擇理論所預測的一個納許均衡的結果。

這次學運，佔領立法院可以看成一個「懦夫賽局」：

		學生
		和平離開立法院	堅持佔領立法院
政府	不驅離	R=3，R=3	S=2，T=4
政府	驅離	T=4，S=2	P=1，P=1

對政府，特別是威權性強的政府而言，驅離可以展現維持社會治安的決心，處罰參與行動的學生以警效尤，並讓事件儘早落幕。如果學生面對驅離而和平離開，則政府鐵腕收效，又沒有流血衝突，這是對政府而言的最好結果。如果政府不驅離而任學生佔領數日後自行離開，則政府雖無橫暴的惡名，卻可能因任學生佔領公署拿不出對策而遭無能之譏，不過事件總算和平解決，這是次好的結果。如果政府不驅離而任學生持久佔領，則政府根本是無能解決問題，這是次壞的結果。最後，如果政府驅離而學生抵抗，致造成流血衝突，此結果恐怕政府不願見，而且也會有嚴重的後續效應，恐怕學生及反對政府暴力的社會人士也不能善罷干休，因此這是對政府而言最壞的結果。如果這樣的收益分析可以成立的話，T>R>S>P 對政府是成立的。

對學生而言，如果政府不驅離，能持續佔領立法院至政府在服貿議題上屈服為止，那當然是最好的。如果覺得象徵性訴求已經達成而自動見好就收退場，像洪仲秋事件時的公民1985行動一樣，則也不錯。如果等到政府驅離才乖乖離開，則團體的威信受損，而且恐怕會遭秋後算帳，這是次壞的結果。當然，被暴力驅離是最壞的結果了。這樣的分析顯示：T>R>S>P 對學生也是成立的。

由於T>R>S>P 對參賽者雙方均成立，這幾天在台灣上演的「佔領/驅離」賽局是「懦夫賽局」。政府的立法及行政部門一再宣示不會用武力驅離立法院的學生，可以說政府至少暫時扮演了懦夫的角色，而立法院的學生並無退讓跡象。根據賽局理論，這樣的結果是「懦夫賽局」的兩個納許均衡之一，在雙方不改變策略的情況下，這個結果是穩定的，各界不期望這僵局能夠很快解決。

那麼為什麼23日晚上會發生流血衝突呢？那是因為賽局的收益矩陣改變了。主要是對政府而言，立法院的情形已經使得它蒙受無能處理的惡名，而且立法院的議事受阻問題還不算太嚴重，如果連行政院施政都要受影響，那根本政府不成其為政府了。而且學生佔領立法院，行政院之後，下一步可想而知是總統府，是可忍，孰不可忍？當一個傻瓜 (Sucker) 已經夠糗了，難道還要當兩個，甚至三個？所以學生佔領行政院後，對政府而言，S 已經變成最壞的結果了，

因此，新的情況使得對政府而言，T>R>P>S，驅離變成優勝策略，而且不必等待，當天就採取行動，學生是否退讓已經不重要了。

那麼學生為什麼要進一步佔領行政院？首先，這也許只是一部分學生的誤算。目前的報導無法確定佔領行政院是誰發起的行動，而且沒有證據顯示它與佔領立法院的學生領袖林飛帆等人有關。但手機及網路世代，動員容易；不論是誰發起，群眾不加深思而跟隨，從賽局理論來看，就是非理性的行為。但也許這些發起人認為在馬英九記者會「跳針」似的談話後，持續佔領立法院已於事無補。而進一步升高衝突，甚至流血，或許能夠得到比枯坐立法院更好的結果。這樣的話，賽局就變成如下的囚犯困局了:

		學生
		和平離開行政院	堅持佔領行政院
政府	不驅離	R=3，R=3	S=1，T=4
政府	驅離	T=4，S=1	P=2，P=2

如此，雙方對峙就是一種所謂「墨西哥對峙」 (Mexican Standoff) 的囚徒困局了，如吳宇森<喋血雙雄>中有名的這一幕。這種對峙之下，你不開火他開火是最壞的結果，所以理性的參賽者會希圖僥倖而開火，但如果你的火力沒他的大，吃虧的終究是你自己。從支持學運的觀點來看，好好的一個「懦夫賽局」玩成「囚徒困局」，這真是可惜的事。

( 時事評論｜政治 )


	回應文章