字體:小 中 大 | |
|
|
2013/12/22 19:05:53瀏覽307|回應0|推薦0 | |
****************** P.165,要了解「量測」,關鍵在於了解「數據本身就會因隨機誤差而變動」。〈三條魚插註:物理有個重要的理論和這裡的觀念相似,那就是海森堡的『測不準理論』。它告訴我們無法經由觀測得到的『真正的數值』。〉 假設我們請15位酒評家來品嚐幾款酒,或者我們請同一位酒評家在不同的日子重複品嚐這些酒,或者我們同時進行這兩種做法。我們可以用評分的平均值和平均數做出清楚的總結。 不過,重要的不只有平均數:如果15位酒評家都給了90分,訊息當然很清楚,如果評分為80、81、82、87、89、89、90、90、90、91、91、94、97、99及100,那麼傳遞的訊息就不同了。兩組數據的平均數一樣,不同的是各個數據與平均數之間的差異;由於數據的分布是很重要的訊息,因此數學家以某個數值來描述這個變異。這一個數值稱為「樣本標準差」,它的平方稱為「樣本變異數」。 樣本標準差描繪數據聚集在離平均數多遠之處,更實際點說,就是描繪數據不確定的程度。樣本標準差很低,表示數據很接近平均數;在所有酒評家都給了90分的例子中,……樣本標準差是6,表示基本上大部分的評分在離平均數6分之處;這種情形下,你只能說該款酒的評分可能在84到96之間。 十八、十九世紀的科學家在判斷量測結果的意義時,就和有疑慮的品酒專家面臨了同樣的問題,…… P.166,第一位認知到變化多端的量測具有共同特性的是雅各‧白努利的姪子丹尼爾。1777年,丹尼爾‧白努利把天文觀測的隨機誤差比喻作弓箭手射箭的偏差,他推論說,在天文觀測和射箭這兩種情況中,目標〈量測值的真確數值,或紅心〉應該在中心附近,觀測到的數值應該集中在中心周圍,在內圈的應該多些,少數幾個離紅心很遠。 丹尼爾‧白努利所提出的分布法則並不正確,不過重要的是他的洞見──弓箭手的失誤分布情形,也許正是天文觀測的誤差分布情形的寫照。 誤差的分布遵循某種普遍的規律,有時稱為「誤差定律」,這是量測理論基礎的中心法則。由此我們可以奇妙的推導出,只要滿足某些很普遍的條件,那麼運用單一的數學分析,就足以由任何量測值決定真確值。 P.167,有了這樣的一般法則,從天文學家的量測來決定天體的真正位置,就相當於從靶面上箭孔的位置來決定靶心的位置,或者由一連串的評分來決定葡萄酒的「品質」。〈三條魚插註:這就是條件機率的理論重點──從事後機率來推斷事前機率。〉 這就是為什麼數理統計是個具一貫性的課題,而不只是一些小花招:不管你的重複量測值是要決定木星在聖誕節清晨四點鐘的位置,或者是由生產線做出來的一條葡萄乾麵包的重量,誤差的分布都是一樣的。 ……懷疑「弓箭手與天文學家、化學家、市場銷售人員遭遇到相同的誤差定律」是一回事,發現誤差定律的特定形式又是另一回事。 P.168,由於必須分析天文數據,十八世紀末的科學家〈譬如丹尼爾‧白努利和拉普拉斯〉提出了一連串有瑕疵的候選形式,他們後來才發現描述誤差定律的正確數學函數,即鐘形曲線,一直都在他們的眼前,…… 有功於揭示鐘形曲線的重要性的三個人之中,真正的發現者棣美弗〈Abraham De Moivre〉得到得歸功卻最少。 棣美弗的突破發生在1733年,那時他已六十好幾,一直到五年後他的《機會論》〈The Doctrine of Chances〉再版時,這項突破才公諸於世。棣美弗是在找尋巴斯卡三角形下面那些巨大的數的近似值,發現這條曲線的──他要找的數可是出現在我截斷的第十列後面幾千幾百列呢!〈三條魚插註:參見《隨機法則─醉漢走路》(12)。〉為了證明自己的大數法則,雅各‧白努利必須和出現在那邊的數搏鬥。 這些數非常之大,例如巴斯卡三角形第兩百列某個數有五十九位,在白努利的時代,事實上在電腦發明之前,這些數是難以計算的。這就是為什麼我說白努力在大數法則的證明中,用了各式各樣的近似,也因此減低了他的結果的實用性。 利用自己發現的這條鐘形曲線,棣美弗可以得到這些數字更好的近似值,也因而大大改善了白努利的估計值。 P.169,……下頁是巴斯卡三角形第10、第100、第1000列系數的長條圖。 如果我們劃一條曲線,連接所有長條的頂部,它會呈現出一種特定的形狀:愈來愈接近鐘形。如果我們把曲線弄得平滑一點,就能寫出一條數學式子來表示它。這條平滑的鐘形曲線,不只是把巴斯卡三角形裡的數給視覺化了,而且還是相當有用的工具,可以幫助我們準確又容易的估計出三角形後面各列中的係數。 這就是棣美弗的發現。 |
|
( 創作|另類創作 ) |