網路城邦
上一篇 回創作列表 下一篇   字體:
300個學生猜對丟銅板的比率、300位基金經理人超越平均的比率:《隨機法則─醉漢走路》(26)常態分布,或高斯分布
2013/12/25 13:28:30瀏覽263|回應0|推薦0

******************

P.169,今日這條鐘形曲線通常稱為常態分布,有時候也稱為高斯分布。

常態分佈其實並不是一條固定的曲線,而是一「族」曲線,家族中每條曲線的位置與形狀由兩個參數來決定,第一個參數決定尖峰的位置,……第二個參數決定曲線的延展寬度,這個參數的近代名稱直到1894年才出現,叫做標準差,也就是我前面所說的樣本標準差在理論上的對應概念。粗略說來,這個參數是曲線達到尖峰高度差不多60%的位置時,曲線寬度的一半。

P.171,鐘形曲線用來描述數據的分布,它描繪出當你做了很多次的觀測後,大多數的數值落在平均數附近的情形,而平均數就是曲線的尖峰位置。

此外,由於曲線在尖峰兩側對稱的下滑,因此它也說明了高於與低於平均數的觀測值次數是同樣程度的縮減──先是相當急劇的,然後漸趨平緩。

如果你的觀測數據成常態分佈,表示差不多有68%〈接近三分之二〉落在平均數的1個標準差之內,大約95%2個標準差之內,而有99.7%3個標準差之內。

 

為了要看清楚這點,我們來看看第172頁的圖。圖中方點的數據代表300個學生觀察10次丟銅板結果而做出的猜測,橫軸代表猜對的次數、從010次,縱軸代表猜對某個次數的學生人數。

這條曲線是鐘形的,中央落在猜對5次,曲線高度對應的學生人數大約是75名,曲線降到大約最高點的2/3,……

同一張圖中,還有另一組以圓點標示的數據,這組數據代表300位基金經理人的表現,這時候,橫軸代表的不是猜對銅板丟擲結果的次數,而是在10年內,基金經理人的表現超過整組平均的年數。

 

P.172,要對常態分佈與隨機誤差之間如何關聯有所感覺,考慮民調或抽樣的過程,不失為一個好方法。……假設兩種人各佔50%〈三條魚插註:這時,每抽樣調查一個人,就像是丟擲一次銅板我們講過,民調挑選的樣本有可能反映不出剛好50/50的分割,……根據棣美弗的研究結果,如果民調專家抽樣的人數夠多,那麼民調各個不同結果出現的機率就可以用常態分佈來描繪。〈三條魚插註:50%的結果不一定發生,但是只要丟擲次數夠多,它發生的機率就最高換句話說,在95%的時候,民調的支持度會在真正值50%的兩個標準差之內。〈三條魚插註:不知道是譯文、或是原文就這樣?作者有時候的行文很怪,難怪幫兒子寫的作文拿不到高分。──上述應該是『當要求民調的支持度落在真正值50%的兩個標準差之內,發生的機率是95%。』

 

P.173,對很多民調而言,超過5%的誤差範圍是不能接受的,但日常生活中,我們往往必須由相對少量的數據做出判斷。一個人無法打上100年的職業籃球、買進100棟住宅大廈、或開創100加巧克力餅乾工廠,因此當我們判斷一個人在事業上的成就,就只能由少數幾個數據來判斷。

……當我們觀察到一次的成功或失敗,我們看的是一個數據點,是鐘形曲線下的一個樣本,代表曾經有過的潛力。

我們不知道這個單一的觀察結果是平均數、是差之千里的、是可以放手一搏的,還是不太可能複製的。但是,我們至少要知道,一個樣本點就只是一個樣本點,應該從標準差、或造成這個結果的可能性的脈絡來看,而不是就把它當成實際狀況。

 

P.179,每個人的壽命長短和人生歷程是難以預料的,但是當我們把群體的數據蒐集起來,並做整體的分析,規律的模式就會顯現。

假設你開了二十年的車,沒發生過一次意外,然後在命中注定的一個下午,你正在魁北克度假,岳母大叫一聲:「小心麋鹿!」害得你方向盤突然一轉,撞上了一個警告牌,上面正寫著這四個大字。

對你而言,這是個偶發的特殊事件。不過,既然有必要設立那個警告牌,正表示在成千上萬的駕駛人當中,有一定的比例注定要撞見麋鹿。

統計群體中的每個人,雖然各自隨機行動,卻往往顯示出一致而可預料的群體行為,看起來像是在有意識地追求同一目標。

正如哲學家康德在1784年所寫的:「每個人都是隨著自己的意向追尋目標,並且通常與其他人的意向相反;然而,個體和人群就像是跟隨著某個引導的繩索,朝著一個相當自然、但對每個人卻都屬於未知的目標邁進;即使當他們意識到這個目標,很少看重它,所有的人卻全都努力去助長這個目標。」

 

根據美國聯邦公路局的紀錄,全美國有兩億個汽車駕駛人,而根據國家公路交通安全局的統計,最近某一年內他們駕駛的里程達2.86兆英哩,也就是平均每人行駛了14300英哩。

假設這些人突發奇想,決定第二年再度達到相同的總里程。現在讓我們拿兩個可達到這個目標的方法,來做個比較。

P.180,第一個方法是政府制定某種配給制度,利用國家科學基金會的高速電腦,依照個人需求,給兩億駕駛人分配里程數,但保持每人14300英哩的平均里程。

第二個方法是告訴駕駛人別把這件事放在心上,愛開多少就開多少,……

哪一種方法會使每人的里程數更接近14300英哩的目標?我們無法試驗第一種方法,不過根據曾經發生過的汽油配給經驗,效果恐怕不會太好。

另一方面,第二種方法……那一年美國人行駛的總里程為2.88兆英哩,也就是每人14400英哩,只比目標多出100英哩。……

******************

( 創作另類創作 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=fishfishfish1967&aid=10137015