字體:小 中 大 | |
|
|
2022/06/13 10:59:26瀏覽371|回應0|推薦0 | |
大學時學習統計學時,你很可能總覺得有什麼東西很奇怪,老是說不清楚。以下就是一個統計學話術的例子。 A. 假設你懷疑有個骰子是不公平的,出現一點的機率比較大。於是你連丟三次,發現三次都出現1。如果這是一個正常的骰子,丟擲了三次都出現1的機率只有1/216,卻偏偏被你遇到了。所以你懷疑這個骰子容易出現一點。這是一個合理的推論。 B. 假設你懷疑一個骰子不正常,但你事先無法確定哪一點不正常。於是丟擲了三次之後,發現三次都出現1,這時候你用如同A的理由判斷這個骰子是不公平的骰子。這樣對不對呢? B 其實是錯的。在做B 的實驗時,你並沒有設定一個目標來決定出現什麼結果算做不正常,於是連續出現三個1 你認為不正常,連續出現三個2你也認為不正常,出現三個偶數你也可能認為不正常,出現三個奇數你也認為不正常,......。於是即使是一個正常的骰子,被你用這種方式判定為不公平骰子的機會很大。這個判斷方式非常不適當。 B 的實驗由於沒有設定好具體實驗目標(pre-specify),造成錯誤判斷的機率相乘相加,這叫做multiplicity。如果目標確定了,要避免因為multiplicity而讓錯誤的機率升高,最好的方式就是增加sample size。譬如你認為有個骰子容易出現連續一樣的點數(e.g., 連續三個六點),那麼你做個實驗丟擲了三次,果然連續出現三次五點。可是即使是個正常的骰子,出現這種情形的機率也有6×(1/6)^3=1/36。如果你認為這個錯誤機率(統計學上稱為 type 1 error rate)太高,可以增加投擲的次數,譬如連丟四次。正常的骰子出現四次一樣數字的機率是1/216。如果你滿意這樣的錯誤機率,那便可以宣稱這個骰子容易連續出現一樣的數字。 但是以上並不一定足以減少Type 2 error。也就是說,如果一個骰子就容易連續出現同樣的點數,這樣的實驗能否容易的把這個現象找出來呢?這是另一個問題,希望以後有機會可以說明。 |
|
( 知識學習|健康 ) |