網路城邦
上一篇 回創作列表 下一篇   字體:
【精準預測】讀後感3-用機率思考:貝式推理的應用
2014/06/22 16:28:24瀏覽3367|回應0|推薦0

我們在資訊時代所面對的無所不在的風險,就是即使全世界的知識量正在增加,但是我們所知道的事跟我們以為自己知道的事,兩者之間的差距正在拉開。這個症狀通常跟著看起來精確卻完全不正確的預測有關。華爾街的金融專家們使用的數學模型可以計算到達小數點後兩位─但卻完全脫離現實;駐守珍珠港的美軍將領精心防備從內部發生的攻擊所作的準備─反而讓日軍的轟炸行動更容易瞄準目標。這就像是一個神射手,號稱槍法神準,子彈總是打在差不多的地方,但卻離靶子很遠(預測精確但不正確)

 

金融危機還有其他大部分的預測失誤,都來自於這樣錯誤的信心:精確的預測偽裝成正確的預測。正當我們以為一切都在掌控中,猶如珍珠港事變前的美軍將領,一隻巴西的蝴蝶拍動了翅膀也會造成德州的龍捲風。

 

這本書談的不是我們知道什麼,而是我們所知道的和我們以為自己知道的,這兩者間的差別。作者Nate Silver推薦了一個策略,好讓我們拉近這兩者間的距離。作者稱,這個策略需要躍進一大步,再往前走幾小步。這一大步就是貝氏學派思考預測和機率的方式。

 

甚至,我們在日常生活中,也經常需求做出「貝氏判斷」。

有一部電影,主角是一位律師,他的工作順利,妻子迷人,家庭幸福。他深愛妻子與小孩,卻始終覺得欠缺了什麼。有一晚他在回家的電車上,注意到一間舞蹈社的窗口站著一位美麗的女子,望著窗外沉思。隔天晚上他再次尋找她,再隔一晚又是如此。每天晚上電車經過她的舞蹈社一次,他就更加為她傾倒。終於有一晚,他衝動下了車,報名參加舞蹈課程,希望能碰到那位女子:他發現從前遠望她時那種縈繞心頭的吸引力,在面對面接觸後,卻慢慢凋零了。他的確愛上了什麼,但並非那名女子,而是跳舞。

他並未把這個新的轉變告訴家人及同事,而是不斷找藉口晚歸。他的妻子終於發現他並不如所說的那樣都在加班。她認為,如果老公有外遇的話,那麼說這種謊話的機率,一定比他沒有外遇要來得高,因此她得到這樣的結論:他有外遇。

然而,這位太太不僅結論錯誤,推理方式也有錯誤:她把「假如老公有外遇,因而在外鬼混」的機率,與「假如他在外鬼混,那麼他就是在搞外遇」的機率給混淆了。

貝氏定理與條件機率有關(conditional probability)。也就是說,「假如」或「已知」有些事件發生時,某個事件發生的機率。以前述電影情節為例,正確的邏輯推理如下:

這位太太必須問自己:老公外遇的機率有多少?條件是你發現老公出現了無故晚歸的事實;這時候貝氏定理就能給出答案,前提是這位太太必須知道(或願意評估)三個數字:

.首先,以老公無故晚歸不回家的行為作為假設為真──也就是說,老公確實有出軌的行為──的條件,評估這樣的機率是多少。假設在老公外遇出軌的條件下,無故晚歸的機率有多少?我們給定是百分之五十。

.第二,以老公出現無故晚歸的行為作為假設為偽的條件。如果他沒有不忠,那無故晚歸不回家的行為有沒有什麼合理的解釋(在電影情節中,老公是去參加舞蹈課程)?當然,也許澴有其他的各種理由/事件是有可能發生的。這位太太也許不會滿意這些解釋,我們給定這些事件發生的機率是百分之五。

.第三,也是最重要的,這位太太需要貝氏學派所說的『先驗機率』:這位太太在老公出現了無故晚歸的跡象之前,認為老公可能出軌的機率有多高?當然,既然已經懷疑老公有可能外遇,這點就很難完全客觀了。理想上,應該在開始檢視證據之前就要建立先驗機率了;但有時候仍有可能從經驗上來評估像這樣的數字。例如,假設在本國,研究發現在特定的任何一年,大約有百分之四已婚的夫婦會對另一半不忠,那我們就可以給定先驗機率為百分之四。

 

如果我們估計過這些數值,那麼就可以運用貝氏定理來建立『後驗機率』,這才是我們追尋的答案:根據老公出現了無故晚歸的事實,老公外遇出軌的機率有多高?計算結果仿Nate Silver在書中的例證,以下圖說明:

 

先驗機率

丈夫外遇出軌的可能性初始估計

x

4%

新事件發生:發現老公無故晚歸不回家

以他出軌為條件,出現無故晚歸行為的機率

y

50%

以他沒有出軌為條件,出現無故晚歸行為的機率

z

5%

後驗機率

已知丈夫無故晚歸,修正後他確實出軌的機率

    xy  

xy+z(1-x)

29%

 

結果發現,這個機率並不高:百分之二十九。這個數字主要來自於你指派給他的先驗機率很低。

 

今日,貝氏分析在各個領域廣泛應用。我們可以再舉一個例子,以保險公司決定車險費率的模型為例:現在考慮一個簡化的模型,在這個模型中,所有的人分為兩個群組,一個是高風險群,平均每年發生一次意外;另一個是低風險群,平均每年發生不到一次意外。如果你是個駕駛新手,你應該是屬於哪個風險群呢?

由於保險公司並沒有你的資訊,他們有可能根據一般新手的經驗值,認定你有三分之一的機會屬於高風險群、三分之二的機會屬於低風險群。這種情形下,你的保費就等於三分之一高風險群保費,加上三分之二低風險群保費。

經過一年觀察,保險公司就可以根據這個新數據來重新評估,修正三分之一與三分之二的比例,重新計算保費。隨後幾年,也可以依同樣的方式定期重新評估,來反映應該收取多少才是允當的保費金額。

 

    本書作者Nate Silver認為,貝氏定理的開始和結束,都是用機率的表達式來表現現實世界事件的可能性。它不會要求你相信這個世界本質上是不確定的,但這個定理卻要你接受,你對這個世界的主觀感知就是在趨近真理。

( 知識學習商業管理 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=grayzwill&aid=14422303