字體:小 中 大 | |
|
|
2013/12/25 13:28:30瀏覽263|回應0|推薦0 | |
****************** P.169,今日這條鐘形曲線通常稱為常態分布,有時候也稱為高斯分布。 常態分佈其實並不是一條固定的曲線,而是一「族」曲線,家族中每條曲線的位置與形狀由兩個參數來決定,第一個參數決定尖峰的位置,……第二個參數決定曲線的延展寬度,這個參數的近代名稱直到1894年才出現,叫做標準差,也就是我前面所說的樣本標準差在理論上的對應概念。粗略說來,這個參數是曲線達到尖峰高度差不多60%的位置時,曲線寬度的一半。 P.171,鐘形曲線用來描述數據的分布,它描繪出當你做了很多次的觀測後,大多數的數值落在平均數附近的情形,而平均數就是曲線的尖峰位置。 此外,由於曲線在尖峰兩側對稱的下滑,因此它也說明了高於與低於平均數的觀測值次數是同樣程度的縮減──先是相當急劇的,然後漸趨平緩。 如果你的觀測數據成常態分佈,表示差不多有68%〈接近三分之二〉落在平均數的1個標準差之內,大約95%在2個標準差之內,而有99.7%在3個標準差之內。 為了要看清楚這點,我們來看看第172頁的圖。圖中方點的數據代表300個學生觀察10次丟銅板結果而做出的猜測,橫軸代表猜對的次數、從0到10次,縱軸代表猜對某個次數的學生人數。 這條曲線是鐘形的,中央落在猜對5次,曲線高度對應的學生人數大約是75名,曲線降到大約最高點的2/3,…… 同一張圖中,還有另一組以圓點標示的數據,這組數據代表300位基金經理人的表現,這時候,橫軸代表的不是猜對銅板丟擲結果的次數,而是在10年內,基金經理人的表現超過整組平均的年數。 P.172,要對常態分佈與隨機誤差之間如何關聯有所感覺,考慮民調或抽樣的過程,不失為一個好方法。……假設兩種人各佔50%。〈三條魚插註:這時,每抽樣調查一個人,就像是丟擲一次銅板。〉我們講過,民調挑選的樣本有可能反映不出剛好50/50的分割,……根據棣美弗的研究結果,如果民調專家抽樣的人數夠多,那麼民調各個不同結果出現的機率就可以用常態分佈來描繪。〈三條魚插註:50%的結果不一定發生,但是只要丟擲次數夠多,它發生的機率就最高。〉換句話說,在95%的時候,民調的支持度會在真正值50%的兩個標準差之內。〈三條魚插註:不知道是譯文、或是原文就這樣?作者有時候的行文很怪,難怪幫兒子寫的作文拿不到高分。──上述應該是『當要求民調的支持度落在真正值50%的兩個標準差之內,發生的機率是95%。』〉 P.173,對很多民調而言,超過5%的誤差範圍是不能接受的,但日常生活中,我們往往必須由相對少量的數據做出判斷。一個人無法打上100年的職業籃球、買進100棟住宅大廈、或開創100加巧克力餅乾工廠,因此當我們判斷一個人在事業上的成就,就只能由少數幾個數據來判斷。 ……當我們觀察到一次的成功或失敗,我們看的是一個數據點,是鐘形曲線下的一個樣本,代表曾經有過的潛力。 我們不知道這個單一的觀察結果是平均數、是差之千里的、是可以放手一搏的,還是不太可能複製的。但是,我們至少要知道,一個樣本點就只是一個樣本點,應該從標準差、或造成這個結果的可能性的脈絡來看,而不是就把它當成實際狀況。 P.179,每個人的壽命長短和人生歷程是難以預料的,但是當我們把群體的數據蒐集起來,並做整體的分析,規律的模式就會顯現。 假設你開了二十年的車,沒發生過一次意外,然後在命中注定的一個下午,你正在魁北克度假,岳母大叫一聲:「小心麋鹿!」害得你方向盤突然一轉,撞上了一個警告牌,上面正寫著這四個大字。 對你而言,這是個偶發的特殊事件。不過,既然有必要設立那個警告牌,正表示在成千上萬的駕駛人當中,有一定的比例注定要撞見麋鹿。 統計群體中的每個人,雖然各自隨機行動,卻往往顯示出一致而可預料的群體行為,看起來像是在有意識地追求同一目標。 正如哲學家康德在1784年所寫的:「每個人都是隨著自己的意向追尋目標,並且通常與其他人的意向相反;然而,個體和人群就像是跟隨著某個引導的繩索,朝著一個相當自然、但對每個人卻都屬於未知的目標邁進;即使當他們意識到這個目標,很少看重它,所有的人卻全都努力去助長這個目標。」 根據美國聯邦公路局的紀錄,全美國有兩億個汽車駕駛人,而根據國家公路交通安全局的統計,最近某一年內他們駕駛的里程達2.86兆英哩,也就是平均每人行駛了14300英哩。 假設這些人突發奇想,決定第二年再度達到相同的總里程。現在讓我們拿兩個可達到這個目標的方法,來做個比較。 P.180,第一個方法是政府制定某種配給制度,利用國家科學基金會的高速電腦,依照個人需求,給兩億駕駛人分配里程數,但保持每人14300英哩的平均里程。 第二個方法是告訴駕駛人別把這件事放在心上,愛開多少就開多少,…… 哪一種方法會使每人的里程數更接近14300英哩的目標?我們無法試驗第一種方法,不過根據曾經發生過的汽油配給經驗,效果恐怕不會太好。 另一方面,第二種方法……那一年美國人行駛的總里程為2.88兆英哩,也就是每人14400英哩,只比目標多出100英哩。…… ****************** |
|
( 創作|另類創作 ) |