網路城邦
上一篇 回創作列表 下一篇   字體:
正確解讀「陽性反應」:《隨機法則─醉漢走路》(20)事前機率 prior probability 和事後機率 posterior probability
2013/11/29 13:10:56瀏覽1951|回應0|推薦0

******************

P.137,我曾提過,貝氏發展條件機率的理論,是想回答那個同樣激發了白努利的問題:如何由觀測結果推論出事件本身的機率?

假如在某次臨床試驗中,某種藥物治癒了60人之中的45人,那麼這種藥物對下一個病人有療效的機會有多大?假如該藥物在100萬人中治好了60萬人,那麼有效的機會極有可能接近60%。但是,如果試驗的人數很少,你又能得到甚麼結論?

貝氏還思考了底下這個問題:假如試驗之前,你有理由相信某個藥物50%有效,那麼新的試驗數據對你未來的評估會有多大的影響?

生活中大部分的經驗是我們只能觀察相當少量的樣本,然後就要由這些觀測結果推論出資訊,並且針對造成這些結果的特性做出判斷。我們究竟該如何進行這些推斷呢?

 

貝氏以一種象徵的手法處理這個問題。

假想有一張方桌和兩顆球,我們以某種方式把第一顆球滾到桌面,使得它在任何一點停止的機會都一樣,我們的任務就是在不經觀看的情形下,決定球在橫軸的何處停下,而工具就是第二顆球,我們要以同樣的方式在球面上多次滾動第二顆球,每滾一次,我們的實驗夥伴就記下這顆球停在第一顆球所在位置的左邊或右邊,最後他會告訴我們她所記錄的次數。

P.138,第一顆球代表我們想得到資訊的未知事件,第二顆球則代表我們蒐集到的證據。如果第二顆球一直都在第一顆球的右邊,我們大概蠻能確定第一顆球在桌面的極左方。如果不都是在右方,我們就不能完全確定這個結論的正確性,或許會猜第一顆球比較靠右。

 

貝氏證明了如何根據第二顆球的數據,去決定第一顆球在橫軸上任何位置的確切機率。他還指出要如何在取得額外數據後,修正最初的估計值。

用貝氏的語言來說,最初的估計值叫做「事前機率」prior probability,修正後的猜測值叫做「事後機率」posterior probability〉。

貝氏設計這個遊戲,是因為它能當作我們平時做的許多決策的模型。在藥物試驗的例子中,第一顆球代表藥物真正的藥效,而第二顆球反映的資訊則代表病人的治療數據。第一顆球的位置也可以代表產品的品質、電影的吸引力、駕駛技術、努力、不屈不撓、才華、能力,或任何可以決定成敗的東西。至於第二顆球的位置則代表我們觀察或蒐集到的數據。……

 

P.142,我與貝葉斯牧師最難忘的相遇,發生在1989年的一個星期五下午,那時候,我的家庭醫生在電話中告訴我,我有千分之九百九十九的機會活不過十年,並且加了一句:「我真的非常遺憾。」〈語氣就好像他對其他病人這樣說時,並不是真心的。〉然後他回答了幾個關於這個疾病的問題,就掛了電話,我猜想他還得向其他病人發布新聞快報。我現在很難描述,甚至記不起來那個週末我是怎麼度過的,只能說我並沒去迪士尼樂園。

既然已宣判我的死刑,我怎麼現在還在這裡告訴各位這件事。……

P.143,我憑直覺去找我的家庭醫生做愛滋病毒HIV篩檢。結果是陽性。

雖然一開始我震驚到忘了質疑他所引述的機率,不過我後來知道,他是這麼得到我有千分之一的機會是健康的:不是愛滋病帶原者,但HIV篩檢結果呈現陽性的機會,是每1000個血液樣本中有1個。

聽起來似乎他是對的,事實卻非如此。

 

我的醫生把「假如我並未感染愛滋,而檢驗為陽性」的機會和「假如我檢驗為陽性,而沒有感染愛滋」的機會混為一談了。

要弄清楚我的醫生哪裡錯了,我們可以運用貝氏方法來分析。第一步,定義樣本空間,我們可以把所有做過HIV篩檢的人都納入樣本空間,但是如果附加一些我個人的資訊,也就是只考慮接受過HIV篩檢的無毒癮白種美國異性戀男,得到的結果或許將更為精確。〈稍後你就可看到這會造成什麼差異。〉

〈三條魚插註:事實上,作者這裡定義的樣本空間,已經呈現上述兩種假設狀況的差異。假如我並未感染愛滋……」的樣本空間應該是沒有感染愛滋的人,「假如我檢驗為陽性……」的樣本空間才是上述做過HIV篩檢的人,並且,不只這樣,還要檢驗為陽性。前者的樣本數量當然比後者大很多。

決定了要把什麼樣的人納入樣本空間之後,就可以將他們分類。

不同於前面例子裡的兒子女兒,現在的類別是:檢驗呈陽性而為愛滋帶原者〈真陽性〉、檢驗呈陽性而非愛滋帶原者〈假陽性〉、檢驗呈陰性而非愛滋帶原者〈真陰性〉、檢驗呈陰性而為愛滋帶原者〈假陰性〉

 

然後我們要問:每一類型各有多少人?

假設我們考慮的初始人數為10000人。根據美國疾病管制中心的數據,在1989年,10000個接受HIV篩檢的無毒癮白種美國異性戀男當中,差不多有1人確實感染愛滋病。假設假陰性的比率幾乎為0,那就表示,每10000人中約有1人士由於愛滋帶原而檢驗結果呈現陽性。〈三條魚插註:「假陰性的比率幾乎為0」,那麼,只要是愛滋帶原者,幾乎不可能檢驗不出來,也就是愛滋帶原者的檢驗結果幾乎一定是陽性。〉

再根據我的醫生所引述的資料,假陽性的比率是千分之一,於是大約有10個人並未帶原、但檢驗仍然呈現陽性,樣本空間裡剩下來的9989人,檢驗結果都呈陰性。

 

P.144,現在我們來修剪樣本空間,只留下檢驗呈陽性的。

〈三條魚插註:這就是上面說的,假如我檢驗為陽性……」的樣本空間是做過HIV篩檢的人,並且,不只這樣,還要檢驗為陽性。前者的樣本數量當然比後者大很多。

修正後的樣本空間裡,有10人是假陽性、1人是真陽性。換句話說,11個檢驗呈陽性的人當中,只有1人真的是愛滋帶原者。我的醫生告訴我,檢驗結果錯誤〈而我根本是健康的〉的機會是千分之一,其實他應該說:

「別擔心,你沒有感染愛滋的機會是10/11。」

******************

( 創作另類創作 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=fishfishfish1967&aid=9681958