甚麼叫做貝式機率? - CMC3242 的部落格

字體：小中大

甚麼叫做貝式機率?

2015/11/10 16:05:19瀏覽2186｜回應57｜推薦12

這是我一個讀者對貝式機率的解釋:貝氏定理的精髓，就是必須根據每一個實際發生的案例，去修正對母群體的估計。

這位讀者甚為推崇貝式機率，覺得是一個偉大的定理(我猜可能是從Vie Science這本雜誌來的，因為他在中國大陸有翻譯版而且做過貝式機率的專輯)，但是因為一般在學校是不會教貝式定理的，如果只是推出術語，實際上只不過是一種賣弄學問的方式，今天正好有空，所以就來說說貝式機率吧!

我們在學校時都教過，如果丟一個硬幣，理論上正反面會出現機率一樣，這種情形叫做零假設，也就是沒有任何預先傾向，我想大家都學過也應該沒有問題，但是大家看看下面情形時，你會怎麼想(F:正面，R:背面):

1:FRRFFRRRFF 2:RFRFRFRRFR 3:FRRRRRRRRR

丟了十次銅板後，請問我再丟一次銅板時，你認為是正面機率有多?如果是零假設成立，那無論哪種情形(1/2/3)機率都應該是0.5，這就大家一般所學的機率。如果是二種情形，大家也應該都沒有爭議，第一種情形時，有些會認為還是0.5，因為出現機率相同(各出現五次)，但有些人可能會遲疑一下，因為好像有重複的模式發生，兩次RR兩次FF，然後三次RRR，那應該也會三次FFF吧!所以F應該比例高一些吧!而如果是第三種情形，我想大部分人會認為R出現機率會比F高吧!(這也在賭場的賭徒賭輪盤時相似的心態)，但是等等，如果你相信銅板是沒有作弊的，那無論何種情形，R和F出現的機率都相同，都應該是0.5啊!連續出現九次R的機率是0.5⁹=0.00195，約為千分之二，雖然很小，但是出現的可能性並不是沒有，這時候重點就來了，這時如果你根據已發生的事實來懷疑銅板根本有問題(作弊)，譬如說你認為R的機率事實是0.9，而F是0.1，那出現第三種情形的機會就是0.9⁹=0.387，那就有接近四成可能性，因此你會猜下次出現R的機率是0.9，這就是所謂依事實來修正母群體的估計。

說到這裡，我想大家應該就會知道問題出在哪裡，而且為什麼學校沒有教你的原因了，因為事實怎麼認定是一件很困難的事?很容易成了個人判斷，這就像剛才我用銅板做的例子，你如何認定銅板有作弊呢?只因為連續出現九次R，因為這很難有效算出和認定。我再舉一個例子，有強盜前科的人，當住家附近發生搶案時，大家都會認定他有嫌疑，這就簡單點出重點，社會學家都會告訴我們，我們不該歧視有前科的人，所以理論上我們應該是零假設(每一個人犯罪機率相同)，但是大家有嗎?而且更重要是大家根據前科這一事實所推斷出的機率也是每一個人不同，有人認為再犯機率是0.3，有人是0.5，有人認為是0。再舉一個例子，一樣的馬習會，也因為綠營和藍營的假設機率不同而導致結論完全不一樣，這就是對母體機率修正(馬英九賣台機率有多高?)每個人不同而導致的問題了!

當然，貝式機率在嚴格的數學條件下已經被證明是對的，我並不是在說此原理有誤，但是當它應用到實際生活時，所謂的基於事實而所做的調整，常常是一種偏見的表現，但是因為裹上一層學術外衣，好像就變成了無懈可擊，但是這根本就不是那麼一回事。看看我那位讀者常常用的概述性和絕對式的命題式發言，這就替我剛剛的說明做下最好的註解。

( 知識學習｜科學百科 )

引用網址：https://classic-blog.udn.com/article/trackback.jsp?uid=CMC3242&aid=35319946


	回應文章	第頁／共 6 頁


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友

真巧！羅輯思維羅胖子最後的總結，怎麼正好就是版主在文章開頭，所引用的我的那句結論？！
	2016/08/18 13:30
①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友


	2016/08/18 08:21
版主，羅輯思維這一期介紹起貝氏定理了，還提到你常常為其申冤的轉基因食品喔https://youtu.be/MueXdnNovQ4?t=2188！建議版主整集看，會有收穫的。其他網友也可以檢驗，看看我在樓下說的對不對，是不是跟羅胖子說的一樣喔！


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友

貝氏定理給人類最大的教訓，就是Seeing is not believing！
	2015/11/17 20:17
版主的文裡的例子，指的是如果出現的樣本空間有偏差，那麼根據已經出現過的樣本來修正預測，這是對的，但是版主有沒有想過，加入這是一個公平的銅板，那麼在大數據之下，出現的樣本會不會趨近於一比一？而貝氏機率正是要根據出現的樣本來修正，這個是動態的過程。沒有人規定所謂的公平的銅板必須每一次都是正反面都是一比一的機率出現，看不出來版主認為因此貝氏定理就比較不適當的原因何在？有取代的更好的做法嗎？這兩個式子的分母其實是相同的。所以這些東西其實都還是在貝氏定理的核心範圍，談不上是超出範圍的應用，那個神經科學的範圍嚴格說來也不算，因為那個是從神經科學的角度來印證貝氏定理確實是比較合乎實證的檢驗。貝氏定理要提醒我們的就是： Seeing is not believing. 我們看到的世界表徵（outlook），還要考慮偽陽性及偽陰性的問題。只有經過偽陽性、偽陰性的校正之後，出來的數值，才是我們真正所要的東西！ ①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友

我衹是一個雜食主義分子，不太挑食的樂知者。
	2015/11/15 03:56
3，我猜你應該是文法科背景，所以沒能區別這其中的真正區別，而只是專注在應用上。 ☞ 這個年代很少人單純背景，至少我自己的大學同學們人數非常多，而其中我估計超過七到八成的人都至少二到三個背景甚至以上，我個人也是一個不太挑食的雜食主義者，對精神食糧又特別地充滿好奇與興趣而樂在其中，所以以此框架來定義一個人，就沒有多大的意義了。解釋完了樓下英文資料的那些部分，再回頭看這則，版主跟之前相比，對於這個符號p（A/X)與p（X/A)，版主有沒有體會出什麼？ A:病人到底有沒有病，才是我們真正關心的目的，而X:這衹是檢驗工具而已。要用什麼工具的選擇，端視我們希望達到什麼目的而定。很多人以為p（X/A)，也就是檢驗結果就是真正的目的p(A/X)，充分混淆了兩者，也就是無視於偽陽性的存在，以為看到的檢查結果，就是真正的答案。 ①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友

繼續回應版主的意見
	2015/11/15 03:25
1，看了你的回文，我只能說，你真的沒有看懂我的文本。貝式機率是很簡單的東西，證明只要一頁就可以了，所以真的不難。但是我最害怕就是堅持依貝式機率算出的東西一定是對的，因為原理和應用題解答是否對是不相關的。 ☞ 樓下那幾則回答班主，這些其實都是貝氏定理，轉個彎換個寫法而已。就是說明驗後機率跟驗前機率是兩回事。這兩個公式看似不同，其實是同一個公式。 2，舉一個點單的例子，LTCM在上世紀末是很出名的公司，創辦人因為發展出債卷的計價公式而得到諾貝爾獎，公司創立後也一帆風順，最後卻是一夕破產，即使預測失效，這道公式到目前許多研究所仍然在教，我要說的重點是:在學術上這道計價公式很合理，但實際運用時卻是悲慘結局。你所謂貝式定理可以趨向真相，但是如果是真的，那些財務公司就用它來計算分析不就萬無一失了嗎(只要時間夠長)?當然沒有。美國次級房貸危機，當時所有的計算結果都認為不可能發生(當時估計發生機率是25個Sigma)，結果呢?這就是我一直在強調的重點。 ☞ 那麼錯用模型與故意說謊呢？ ①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友

不細翻了。不是與直覺相悖離的邏輯就是錯的。而基督教講的原罪，含義就包括指稱，我們人類這種動物的大腦，無法表現得像電腦一樣的冷靜與精準。
	2015/11/15 00:46
上面為了說明方便所述的貝式定理的東西，我們還需要注意，這些事實上是經過簡化的因素我們必須谨记在心。第一，很多的檢查結果不是非黑即白，而是有程度的區別。非黑即白會是我們失掉很多資訊與細節。第二，這些檢驗工具的項目有些是盤根錯節而又互相關聯，並非一如天真的想像是彼此全然獨立的。（後面的專有名詞太麻煩就不翻譯與解釋了，有興趣的人自己再去查）最後，長久以來許多人堅持，靈敏度、特異度這種工具的可靠性，與前驗機率無關（這句話的意思是那個工具會表現的很穩定始終如一）。但是這個說法其實在實際的臨床上是錯誤的。也就是說，一個工具的準確性，要看是用在什麼樣的場合上面。這個工具的鑒別力的表現，是遇強則強，遇弱則弱。例如說祇有一條冠狀動脈疾病，那麼跑運動心電圖的靈敏度就是30%，但是如果是比較嚴重的三條動脈疾病的話，那麼他的疾病的靈敏度就會提高到80%。因此，診斷工具的靈敏度將會視其是用在疾病的什麼階段而定。跟一般門診的病人比起來，住院病人真的有病的機會比較大，尤其是，疾病已經進展得比較嚴重的程度的機會也比較大，住院病人的檢驗敏感度比較大，而一般門診的病人則是特異度比較大。（這句話的意思是說，住院的病人，檢查結果顯示有病，真的有病的機會比較大，而一般門診的病人，檢查結果如果說沒有病，則確實是真的沒有病的機會也會比較大。從這裡，我相信版主可以看得出來：確實很多邏輯上的事情，與意識形態無關。這些邏輯上的事情，跟我們一般的想像與直覺都大不相同，但這才是這個世界邏輯的真面目。衹是，我們都不習慣這個與想像差異太大的邏輯事實，也不喜歡承認並面對這樣的邏輯結果而已。 ①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友


	2015/11/14 13:00
LR值是9的意思就是檢查的結果是陽性，則有這個疾病對沒有這個疾病的比率為9.檢查如果越準確，LR的值就會越高。但是，如果檢查的靈敏度很好，但是特異度沒有那麼好（意思就是雖然有病的人，檢查結果顯示出有異狀的機會很大，但是沒病的人檢查結果卻也跟著容易錯誤地顯示出異常）那麼LR的比值就會大幅降低。（例如靈敏度為90%，但是特異度為60%，則LR的值將只剩下2.25）大多數的醫學檢驗的陽性檢查結果，LR值多介於1.5到20之間。以冠狀動脈疾病的兩項診斷工具運動心電圖以及鉈201心肌灌注掃描檢驗為例。綜合分析（meta-analysis）https://zh.wikipedia.org/wiki/%E5%85%83%E5%88%86%E6%9E%90 的結果顯示，運動心電圖的平均靈敏度約為66%（有CAD的病人約三分之二可以檢查得到異常結果），而特異度大約84%（沒CAD的病人也會有16%，約六分之一的人也會跑出有問題的運動心電圖檢查結果），那麼可能比（LR）就會是4.1『0.66/（1-0.84）』。如果讓一個驗前只有百分之十CAD可能的病人去跑運動心電圖，那麼即使檢查結果顯示異常，驗後機率也不過提高到百分之三十。如果對一個驗前機率有百分之八十CAD的病人去跑心電圖，那麼跑完結果有異常的話，驗後機率就變成了95%。對於診斷CAD的檢驗工具而言，運動鉈SPECT檢查是一個比較精確的檢查工具。為了說明的方便，假設這個檢查的靈敏度為90%，特異度亦為90%，則可能比（LR）就會等於9，因為『90/（1-0.9）』=9。以圖3-1為例，如果一個病人的驗後機率從十趴變五十趴，看起來是增加了，但是如果站在診斷的立場而言，站在治療決策的立場，這樣的提升並無法改變診斷信心而足以改變了治療方式。而事實上，這根本就像是搞了一個大烏龍，將本來蠻有信心只有十趴機會的病人搞成丟銅版，有病沒病的機率變成一半一半無所適從將醫師及病人及其家屬都嚇得半死。而如果這個病人的驗前機率是80趴，鉈SPECT驗後機率變97趴，而運動心電圖驗後機率變95趴。看到嗎？又來了。比較準確的檢驗並無法提升我們足夠驗後診斷機率的信心，來達到足以改變我們的治療方式的選擇的目的，而且這兩種檢查方式都無法大幅地提升我們光是根據臨床數據就可以得到的結果。如果病人的做檢查前看起來真的有病的機率本來就很低，例如小於20趴，那麼就算是很準確的檢查工具也沒有辦法大幅提昇我們對於疾病確實存在的信心（例如到大於百分之八十）。相反地，如果檢查之前看起來已經是很像是真的生病了，那麼就算檢查結果沒異常也沒辦法讓我們足以確信真的沒病。因此，什麼時候來動手檢查呢？最有幫助的就是根據病史及理学检查結果看起來病人生病的可能不高不低的時候，例如30趴到70趴，這個時候花錢花時間付代價來做檢查其實才是CP值最大、最有幫助的時機。 ==== 停一下。看出來了嗎？這個不是我自己亂講的，是有邏輯及實證根據的。所謂的防禦性醫療就在於此。當醫師認為罹病可能很低的時候，病人如果愛亂告，那麼就開立檢查讓病人去做，做出來一半一半怎麼辦？有的病人七上八下甘願了，然後就這樣繼續疑神疑鬼的回家自己嚇自己，有的病人還是不死心，就要求再繼續下去譬如做個心導管什麼的，可是別忘病人把自己累死痛死了，其實醫師也沒好處，是兩敗俱傷的雙輸結果。這就是現實世界與理論世界的不同邏輯所致。重點來了。邏輯世界與現實世界的重大差異就在於此，這就是防禦性醫療被叫做防禦性的來源理由。但是成本誰付呢？版主可以想一想。 ①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友

意譯
	2015/11/14 12:01
LR值是9的意思就是檢查的結果是陽性，則有這個疾病對沒有這個疾病的比率為9.檢查如果越準確，LR的值就會越高。但是，如果檢查的靈敏度很好，但是特異度沒有那麼好（意思就是雖然有病的人，檢查結果顯示出有異狀的機會很大，但是沒病的人檢查結果卻也跟著容易錯誤地顯示出異常）那麼LR的比值就會大幅降低。（例如靈敏度為90%，但是特異度為60%，則LR的值將只剩下2.25）大多數的醫學檢驗的陽性檢查結果，LR值多介於1.5到20之間。以冠狀動脈疾病的兩項診斷工具運動心電圖以及鉈201心肌灌注掃描檢驗為例。綜合分析（meta-analysis）https://zh.wikipedia.org/wiki/%E5%85%83%E5%88%86%E6%9E%90 的結果顯示，運動心電圖的平均靈敏度約為66%（有CAD的病人約三分之二可以檢查得到異常結果），而特異度大約84%（沒CAD的病人也會有16%，約六分之一的人也會跑出有問題的運動心電圖檢查結果），那麼可能比（LR）就會是4.1『0.66/（1-0.84）』。如果讓一個驗前只有百分之十CAD可能的病人去跑運動心電圖，那麼即使檢查結果顯示異常，驗後機率也不過提高到百分之三十。如果對一個驗前機率有百分之八十CAD的病人去跑心電圖，那麼跑完結果有異常的話，驗後機率就變成了95%。對於診斷CAD的檢驗工具而言，運動鉈SPECT檢查是一個比較精確的檢查工具。為了說明的方便，假設這個檢查的靈敏度為90%，特異度亦為90%，則可能比（LR）就會等於9，因為『90/（1-0.9）』=9。以圖3-1為例，如果一個病人的驗後機率從十趴變五十趴，看起來是增加了，但是如果站在診斷的立場而言，站在治療決策的立場，這樣的提升並無法改變診斷信心而足以改變了治療方式。而事實上，這根本就像是搞了一個大烏龍，將本來蠻有信心只有十趴機會的病人搞成丟銅版，有病沒病的機率變成一半一半無所適從將醫師及病人及其家屬都嚇得半死。而如果這個病人的驗前機率是80趴，鉈SPECT驗後機率變97趴，而運動心電圖驗後機率變95趴。又來了，比較準確的檢驗並無法提供驗後診斷機率的信心來足以改變我們的治療方式的選擇，而且這兩種檢查方式都無法大幅的提升光是根據臨床數據就可以得到的結果。（待續） ①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友

高中課本那個叫貝氏定理，並不代表這個不是貝氏定理。就好像學校教了小嬰兒為法律上的人格實體，並不代表幼童就不是人格實體。
	2015/11/14 11:17
為了要了解貝氏定理的效能，可以使用一樣的三個指標，將檢驗前檢驗後的診斷信心的機率變化，拿來與可能比（likely ratio）放在同一個圖表做比較就一目了然。這個可能比（likely ratio）根據定義，是真陽率/偽陽率『sensitivity/（1-specificity』。例如假設有一個檢查項目，這個檢查的靈敏度是0.9，特異度也是0.9，那麼這個檢查的可能比（LR）計算出來就是0.9/（1-0.9）=9。『可能比,LR』算出來的數值等於9的意思，就是假設這個檢查的結果顯示出陽性，那麼這個病人真的有病對上其實沒病的機率比是9倍。圖3-1 貝氏定理的列線圖（nomogram。參https://en.wikipedia.org/wiki/Nomogram）把驗前機率(pretest)跟可能比（LR）連線，就可以對照出驗後機率（posttest），就是當我們用驗前機率，再搭配這個檢查的可能比，就可以得到並且對比出這個檢查做完之後，這個疾病真的存在的機率為何了！這個圖索揭露的兩條線，那條實心線是運動心電圖的LR值為4。另外一條虛線是鉈201心肌灌注掃描檢查（thallium SPECT study）的LR值為9。另外一條線是如果病人的驗前機率為一半（50%），這個圖例示的是一個驗前機率為一半（50%）的病人，對於這兩種檢查的圖示。 NEJM 是全世界醫界排名第一的專業醫學期刊。 ①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


	驅逐低端人口,這樣對嗎？等級：8 留言｜加入好友

不直譯，太累了，重點的精髓到了就好。
	2015/11/14 00:25
很遺憾，沒有什麼完美的檢驗工具，即使把所有的檢查工具都做完了，病人真正的疾病的狀態還是不能百分之百地確定。要如何量化這剩下的不確定性到底有多少呢？那就要靠貝氏定理為工具了。這個定理為求出驗後的機率到底是多少提供了很簡單的數學工具，衹要我們餵給它吃三個東西： 1，檢驗之前的帶病幾率， 2，檢驗工具的敏感度，以及 3，檢驗工具的特異度！驗前機率就是做檢驗前，我們對病人帶病的機率的評估預測。如果沒有更加可靠的數字的話，那麼就是疾病在人群中的疾病盛行率（prevalence）。舉個常見的簡單的例子，以心臟冠狀動脈疾病(CAD，就是讓廖風德的內政部長夢碎的那個心臟病）。我們可以從疾病表現的症狀及理学检查的結果，可以建構出較為準確的驗後（帶病）機率的評估的圖形與模式。那麼我們就可以對病人得病率，做檢驗之前及檢驗之後的變化做評估，而不在衹是接著一般盛行率來瞎猜。（待續） ①美國杜魯門總統丟兩顆原子彈給日本，送蔣介石給臺灣！ ②228事件國民黨警備司令柯遠芬説：『寧可枉殺99個，只要殺死1個真的就可以！』 ③中正廟牌樓正名先總統石崗一郎紀念歌收尾：『反共必勝，建國必成！』 ④如果你是公務員，那能撈就撈，能混就混，拖死政府囉


		第頁／共 6 頁

粉絲團