網路城邦
上一篇 回創作列表 下一篇   字體:
甚麼叫做貝式機率?
2015/11/10 16:05:19瀏覽2342|回應57|推薦12

這是我一個讀者對貝式機率的解釋:貝氏定理的精髓,就是必須根據每一個實際發生的案例,去修正對母群體的估計。 

    這位讀者甚為推崇貝式機率,覺得是一個偉大的定理(我猜可能是從Vie Science這本雜誌來的,因為他在中國大陸有翻譯版而且做過貝式機率的專輯),但是因為一般在學校是不會教貝式定理的,如果只是推出術語,實際上只不過是一種賣弄學問的方式,今天正好有空,所以就來說說貝式機率吧!

    我們在學校時都教過,如果丟一個硬幣,理論上正反面會出現機率一樣,這種情形叫做零假設,也就是沒有任何預先傾向,我想大家都學過也應該沒有問題,但是大家看看下面情形時,你會怎麼想(F:正面,R:背面):

 

            1:FRRFFRRRFF        2:RFRFRFRRFR        3:FRRRRRRRRR

 

丟了十次銅板後,請問我再丟一次銅板時,你認為是正面機率有多?如果是零假設成立,那無論哪種情形(1/2/3)機率都應該是0.5,這就大家一般所學的機率。如果是二種情形,大家也應該都沒有爭議,第一種情形時,有些會認為還是0.5,因為出現機率相同(各出現五次),但有些人可能會遲疑一下,因為好像有重複的模式發生,兩次RR兩次FF,然後三次RRR,那應該也會三次FFF!所以F應該比例高一些吧!而如果是第三種情形,我想大部分人會認為R出現機率會比F高吧!(這也在賭場的賭徒賭輪盤時相似的心態),但是等等,如果你相信銅板是沒有作弊的,那無論何種情形,RF出現的機率都相同,都應該是0.5!連續出現九次R的機率是0.59=0.00195,約為千分之二,雖然很小,但是出現的可能性並不是沒有,這時候重點就來了,這時如果你根據已發生的事實來懷疑銅板根本有問題(作弊),譬如說你認為R的機率事實是0.9,而F0.1,那出現第三種情形的機會就是0.99=0.387,那就有接近四成可能性,因此你會猜下次出現R的機率是0.9,這就是所謂依事實來修正母群體的估計。

    說到這裡,我想大家應該就會知道問題出在哪裡,而且為什麼學校沒有教你的原因了,因為事實怎麼認定是一件很困難的事?很容易成了個人判斷,這就像剛才我用銅板做的例子,你如何認定銅板有作弊呢?只因為連續出現九次R,因為這很難有效算出和認定。我再舉一個例子,有強盜前科的人,當住家附近發生搶案時,大家都會認定他有嫌疑,這就簡單點出重點,社會學家都會告訴我們,我們不該歧視有前科的人,所以理論上我們應該是零假設(每一個人犯罪機率相同),但是大家有嗎?而且更重要是大家根據前科這一事實所推斷出的機率也是每一個人不同,有人認為再犯機率是0.3,有人是0.5,有人認為是0。再舉一個例子,一樣的馬習會,也因為綠營和藍營的假設機率不同而導致結論完全不一樣,這就是對母體機率修正(馬英九賣台機率有多高?)每個人不同而導致的問題了!

    當然,貝式機率在嚴格的數學條件下已經被證明是對的,我並不是在說此原理有誤,但是當它應用到實際生活時,所謂的基於事實而所做的調整,常常是一種偏見的表現,但是因為裹上一層學術外衣,好像就變成了無懈可擊,但是這根本就不是那麼一回事。看看我那位讀者常常用的概述性和絕對式的命題式發言,這就替我剛剛的說明做下最好的註解。

( 知識學習科學百科 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=CMC3242&aid=35319946

 回應文章 頁/共 6 頁  回應文章第一頁 回應文章上一頁 回應文章下一頁 回應文章最後一頁

蜘蛛蝴蝶刀
等級:8
留言加入好友
2015/11/12 00:00
你幹嘛慌亂的用那麼大的字型? 大的字型不代表大數據啊?
蛛織綑龜網 蝶舞天地框 噗嘻無奈天 蛛蝶問冷涼 ccc

驅逐低端人口,這樣對嗎?
等級:8
留言加入好友
雖然這個作者用的是符號,一般人可能不太看的習慣,不過有交代到重點(之一),我相信版主及不特別的人一定都看得懂得。
2015/11/11 23:53

這個也是貝氏定理的其中一個面向,但是我覺得這個作者在這裡解釋得還不夠完整清楚。可是這個就不是統計學的專業書上會講到的東西。像是顏月珠教授的那個應用統計學就完全沒有。這個作者講的東西太精要了,以至於光是看這裡可能還是一知半解,不過至少可以驗證我說的話不是無憑無據,而這個已經成為統計學界的亮點,在統計學相關領域工作的人如果不知道,可能不能再說貝氏定理“沒什麼特別”吧?

這裡開始在解釋什麼是先驗,這部分我覺得這個作者拿出神經生理學的證據來證明先驗是什麼?!

他寫的極好,比很多書上在解釋這個問題,講的更加清楚。這叫用證據說話。是這本書關於貝式定理的大亮點。當然,這本書講話有很多類似的著不證據呈現,是一本很好的書,也極力猛力推薦版主及其他網友,這是一本不可失之交臂的好書。


①美國杜魯門總統丟兩顆原子彈給日本,送蔣介石給臺灣!
②228事件國民黨警備司令柯遠芬説:『寧可枉殺99個,只要殺死1個真的就可以!』
③中正廟牌樓正名先總統石崗一郎紀念歌收尾:『反共必勝,建國必成!』
④如果你是公務員,那能撈就撈,能混就混,拖死政府囉

蜘蛛蝴蝶刀
等級:8
留言加入好友
2015/11/11 23:45

根據貝氏定律鄭捷下次去捷運大屠殺是0%對不對?

根據貝氏定律下一個學鄭捷去捷運大屠殺是?%...?

你就實際運用給大家看看


蛛織綑龜網 蝶舞天地框 噗嘻無奈天 蛛蝶問冷涼 ccc

驅逐低端人口,這樣對嗎?
等級:8
留言加入好友
2015/11/11 23:19
這個先借來用一下。省得打很多字。
他說的衹是貝氏的一個小面向。
他處還有他例也在說明貝式定理是什麽碗膏。

====
http://www.tangsbookclub.com/2013/10/17/2781/

《精準預測》中:您的配偶有否不忠?

posted by 蟬


冷靜,先別嚷分手。

想象以下純屬假設的情景:
SoChun與伴侶同居多年,忽一日出國公幹後回家,竟在衣櫃內發現一件來歷不明,穿著過的男性衣物,當即傷心欲絕,要生要死。好友們均悲觀地認為事不離實,勸他逆來順受,並指伴侶會因內疚而對他更好云云…..

那到底SoChun的伴侶出軌的機率有多少?
阿蟬心裡雖亦明白 “天理循環,報應不爽” 的道理, 但作為一名sense派,任何問題均 “應而且只應” 以sense解拆,便拋出「貝氏定理Bayes’ Princple」證明So伴侶出軌的可能性其實甚低。

貝氏定理針對的問題原型為: 某些事件發生之後,某個理論或假設為真的機率有多少? ***

要找出So伴出軌的機率,先要把問題設定好:

、、、、、



機率是甚麼?

貝氏Thomas Bayes是18世紀英國的牧師,英國皇家學會院士。
他認為上帝是完美的,人類遇到的不完美是出於人的緣故而非上帝。

舉例:阿蟬初次炒股票輸錢,驚嘆原來股票是可以虧錢的。 接著他每天炒股票都輸錢收場。 慢慢地阿蟬越來越認識到:股票是會讓人虧錢的。透過統計推論,他得出未來每天炒股票極大機會虧損,覺得自己越來越接近真理,內心充滿著喜悅。

阿蟬是以「趨近法」去認識股票的,雖然越來越接近真理,但永遠不會找到真理。***

貝氏認為機率的概念是以人認識世界的方法構成的。 而機率之所以存在是因為人類在測量時的不完全與完美的世界產生落差。

*** 科學決定論的支持者Laplace也抱著同樣的信念,他認為機率是無知與知識之間的中途店。
**** 是科學進步的必然條件。

貝氏定理要求人們以機率看待世界,要求人採取 “世界本質上是不確定的” 這種立場。貝氏定理要處理的正是認識論上的不確定:「知識是有限制的。」***

大數據的基礎與問題
上世紀初英國統計學家 費雪Ronald Aylmer Fisher貢獻良多, 統計學用詞「Statistical significance統計顯著性」便是他的發明。

費雪是貝氏定理的反對者,他認為貝氏學派提出的先驗機率過於主觀**,在沒有實驗和數據支持下先斷定事件發生的可能性違反科學客觀的概念。 他曾在文章中指出貝氏學派的想法應該完全被揚棄。

與費雪同年代的學者努力發展一套統計方法,希望藉此去除主觀和偏差對結果的影響。 這類統計今日通常稱為「頻率論Frequentism」或「費氏學派Fisherian」。

費氏學派認為統計問題中的不確定性來自於蒐集資料時只從整體研究對象中抽取一部份,而非對象的整體。
*** 頻率論的目的便是透過分析並量化當中產生的抽樣誤差sampling error。***

舉例:2008年美國民主黨內部總統候選人選舉時,在新罕布夏州調查了一萬五千人(當地人口約為一百三十萬人),抽樣比例高令誤差範圍理論上只有0.8%,但實際誤差卻是8%,誤差大到足以錯誤預測希拉莉會大比數輸給奧巴馬,而實際上希拉莉勝出了這個區選。

頻率論的問題是它無法去除人為誤差,它相信抽樣比例越高,資料越豐富,誤差將趨近零。*** 充足的樣本並不保證預測完美,但樣本不足卻保證誤差會被放大。頻率論實質上需要大量假設去確保統計程序的完美,和偏見的排除。

費氏學派尋求客觀結果的方法:將研究者跟現實世界隔離,不單阻礙研究者考量假設的可信度,而且將研究方向推向尋找相關性correlation多於因果,令研究結果的應用性大大減低。
、、

驅逐低端人口,這樣對嗎?
等級:8
留言加入好友
不同的地方會提到不同的東西,要彼此補充。所以不要急,貝氏定理的浩瀚這個只是最開始。
2015/11/11 21:48

這個是高中程度的東西,純數學。並非我要說的重點,但是還是得交代一下。我相信幾乎所有的讀者都念過高中,所以應該都念過。至於版主,之前應該也有念的,只是年代久遠忘記了要重溫一下而已。

這裡不補充了。

大部分解釋貝氏定理,都會以乳癌為例子當作開始的出發點,來說明貝氏定理如何的與我們的常識大相徑庭,這些意義後面還會陸續慢慢解釋。關於貝氏定理的應用,這個只是初階,後面還有其他,請不要急,先把這部分搞定。

這個圖是別的書上的例子,但是跟上面的例子觀念相同,可以參照著證明。我還會陸續印證其他的補充。

(待續)


①美國杜魯門總統丟兩顆原子彈給日本,送蔣介石給臺灣!
②228事件國民黨警備司令柯遠芬説:『寧可枉殺99個,只要殺死1個真的就可以!』
③中正廟牌樓正名先總統石崗一郎紀念歌收尾:『反共必勝,建國必成!』
④如果你是公務員,那能撈就撈,能混就混,拖死政府囉

驅逐低端人口,這樣對嗎?
等級:8
留言加入好友
一點也不特別
2015/11/11 14:41

好像以前看過,妳是學統計學的樣子?

那麼妳覺得版主寫的東西跟貝氏定理有沒有關係?

還是你覺得版主說的就是貝式定理的東西?

還有,我開始懷疑,你會不會很久沒接觸老本行的新時勢動態了?

稍安勿躁,晚一點我會整理。


我暫時先引述《精准預測》三采文化,裡的幾句話:

『如果貝式定理的哲學基礎豐富的出人意料,那定理的數學則是單純的令人震驚p284』

、、、、、

『然而最近有些備受敬重的統計學家開始主張,不應該在教大學部的學生頻率論的統計。還有些專業正在考慮要在他們的期刊中禁用費雪的假設檢定。事實上如果你去讀過去十年所寫的東西,你很難發现有什麼東西不支持貝氏學派的。p301』


《心智的構建 腦如何創造我們的精神世界》華東師範大學出版社:

『近十年,Thomas Bayes成為一顆超級巨星。多家網站相繼解釋貝葉斯定理,並且向我們宣傳:“重要的是Bayes很酷,如果不瞭解Bayes,你就不酷了。”

如果你不相信互聯網上的言論,那麼2004年1月20日的《紐約時報》呢?

《紐約時報》這樣寫道,在學術界,贝叶氏革命快要成為大眾觀點,這在10年前是難以想像的。”明尼蘇達大學的公共健康教授Bradley P. Carlin如是說p118』



①美國杜魯門總統丟兩顆原子彈給日本,送蔣介石給臺灣!
②228事件國民黨警備司令柯遠芬説:『寧可枉殺99個,只要殺死1個真的就可以!』
③中正廟牌樓正名先總統石崗一郎紀念歌收尾:『反共必勝,建國必成!』
④如果你是公務員,那能撈就撈,能混就混,拖死政府囉

nothing special
等級:8
留言加入好友
2015/11/11 10:35
Bayes' Formula: P(A|B) = \frac{P(A)\, P(B | A)}{P(B)}, 上過機率統計課程的,一定都有教過。我手頭上一本Paul G. Hoel的Introduction To Mathematical Statistcs (5th Edition)的書,上述的 Bayes' Formula 在第20頁就出現,全書加習題解答及索引共435頁,關於Bayes Method 及 Bayes' Solution 要到372 及 274 頁,才有說明,卻連例題都沒有的。

驅逐低端人口,這樣對嗎?
等級:8
留言加入好友
2015/11/11 01:07
呵,你信1997潤八月嗎?你信2012嗎?
我信仰的是邏輯與理性與科學,
社會科學也算科學,

至於像推背圖及易經這類預言及算命的東西,
抱歉,我是不信的,也不瞭解,
我不懂的東西無法comment!
sorry~
其他的再說吧!
good night~

蜘蛛蝴蝶刀
等級:8
留言加入好友
2015/11/11 00:54
請問唐朝推背圖的預測是平行宇宙還是貝氏定律?還是超過你的腦筋理解能力?
蛛織綑龜網 蝶舞天地框 噗嘻無奈天 蛛蝶問冷涼 ccc

蜘蛛蝴蝶刀
等級:8
留言加入好友
2015/11/11 00:22
請問一下推背圖第四十四象跟貝式定律的相關性

日月麗天 是指星國

群陰懾服 這是說陰險小人女人

百靈來朝無解

雙羽四足 習馬


蛛織綑龜網 蝶舞天地框 噗嘻無奈天 蛛蝶問冷涼 ccc
頁/共 6 頁  回應文章第一頁 回應文章上一頁 回應文章下一頁 回應文章最後一頁