字體:小 中 大 | |
|
|
2012/08/12 23:45:57瀏覽737|回應0|推薦4 | |
想要重拾一個理論,卻發現怎樣也找不到從前愛讀的一本書,只好空想一些從前就有的感想。 1996年Robert Tibshirani 發表了Regression Selection Shrinkage & Selection via the LASSO這篇文章,誰知到了2003年後才開始紅了起來。多半是因為Machine Learning興起的關係。很多人發現,原來1996年的東西這麼好用。本來Support Vector Machine這些東西突然被束諸高閣,大家回頭來講LASSO。 除了Robert這些早期的作者之外,當時研究LASSO的多半是年輕學者。老一輩的學者請問,為什麼LASSO可做Variable Selection時,通常得到的答案都是:「因為LASSO會在最後結果把某些Variables乘上零成為Estimator啊!」當時我在想,如果我小時候有抓周這回事,拿一些Variables來讓我抓,這樣也可以算是Variable Selection囉!不過,有同樣想法的人應該很少。當時連LASSO的Solution Path也被人算出來了。 誰知後來竟然被發現,原來在許多(大部分)的情形裡,LASSO壓根連Consistent Estimator都不是,要勉強說明它的Consistency,得特地去找很不尋常的情形。當然,這麼高深的理論,很多人連讀都不想讀,所以知道的人大概不多。不過這並不表示LASSO沒有用處,因為當Variable數遠大於樣本數(sample size)時,consistency其實不重要。 如果是常常發表LASSO文章的人,這時候最好小心以前的文章如果只有Simulation沒有理論證明,下結論希望不要跟以上的理論有所牴觸。 2001年上課時,為了在三天之內把一篇報告交出去,在讀文獻時覺得有問題,卻又思考不出來。最後只好在報告時老實說,我實在不懂為什麼這個Power Prior的積分可以這樣做(膽子小不敢說這些大人物做錯了)。這樣說很安全,因為大人物做出來的東西,當時我這種菜鳥不懂是可以理解的。 2010年參加一個conference,台上的教授說,當時研究Power Prior的人弄錯了,被人發現了(雖然我跟這個教授提過,但是他指的應該不是我),因此某人(另一個人,這個人當然就更不是我了)把正確的做法解出來。這位教授把正確做法解釋給大家聽。我只好苦笑。 2011年,我跟別人解釋有些統計理論無法在Clinical Trial研究上應用,因為無法計算False Positive Rate。結果被人嗤之以鼻,要我去看看某人的文章。說這個人提出這麼多理論,怎麼能說沒用呢?首先他跟我說的根本是兩回事,風馬牛不相及。第二他所說得這個人,就是當初把Power Prior搞錯的這個人。現在我對他的文章早就沒興趣了。 大人物當然有值得尊敬的地方,但是就事論事時,還是要保留合理的懷疑才好。 |
|
( 知識學習|隨堂筆記 ) |