台灣新式聯考的盲點所在：教育測驗統計的崇拜與誤用 - 思考者的網誌：成就仁德、智慧、正義、與公理的社會

字體：小中大

台灣新式聯考的盲點所在：教育測驗統計的崇拜與誤用

2007/07/24 02:15:48瀏覽4432｜回應6｜推薦17

在台灣教育部和台灣某些教改人士通力合作下，為了廢除聯考而廢除聯考，聯考其實沒有廢除，只不過改了名字，換了系統，和計分方式。所謂基測、學測、指考等等，是一種類似能力檢定的標準程度測驗(Standarized Test)，不料卻被拿來代替分分計較的聯考，牛頭不對馬嘴的原因，源自於台灣教育學者們對於美國教育測驗方式的盲目崇拜，以及對標準程度測驗(Standarized Test)的錯誤運用。

考過美國ETS (Educational Test Service) 測驗公司所舉辦的TOEFL或ＧＲＥ的人一般會知道，考生所收到的成績，不是原始的成績，而是經過教育學統計處理過的。以前Toefl滿分六百j七十幾分，程度再差的人，即使你只答對一題，也能得到三百多分，但是如果你答對了四分之一的題目，也是三百多分。

之所以會這樣，是因為ＥＴＳ採用了教育測驗統計學的一些理論，如最基本的，像選擇題如果有四個選擇，那麼會有四分之一的機會猜對，因此必須依據這個機率來調整計分；還有如常模分布，百分之六十六左右的人的成績要分布在中間等等，所以成績的安排也要按照這個來調整。

教育測驗統計的學問當然不止於此，不同的測驗統計專家還會在不同的測驗裡依照不同的理論發明不同的公式。舉個例來說，我們知道一個考試裡有不同的題目，在傳統的作法裡，各題配分已經直接寫在試卷上，但是在使用測驗統計的考試裡，測驗統計專家卻可以在考後，才依照每一題的答對情形來決定配分，至於決定配分的理論基礎，那又是另一套值得探討的東西。

以上所說，只是教育測驗統計裡，千千萬萬的玩法裡頭的一小部份，而且只是一個概說而已。

數學不好的學者不少，美國人數學不好，更是舉世通知，尤其是學社會科學（如社會、政治、經濟、教育、歷史等）和語言的，許多人遇到超過二位數的計算就已經大感吃不消。因此在美國學術界，只要你有一點統計的背景，十分吃香，非常好找工作。

統計學本身是一種學問，但是在這些社會科學裡，它卻只是一種應用的工具，有些學者卻玩統計玩到了走火入魔，反客為主，最明顯的是一些經濟學者發表的論文，通篇「不講人話」，只見一些數字在那裡跳躍堆積、反來覆去，好像深奧得不得了，但其實沒有什麼學術價值，說穿了沒有什麼內容，膚淺得很。

依據統計理論，轉換教育測驗的原始分數成為另一種分數，在像TOEFL, GRE, SAT, ACT 這類測驗上，有它的需要。這些測驗都是「標準程度」測驗，它們是一種門檻考試，是為了測定「標準程度」而考。換句話說，它雖然一年考好幾次，每一次出的題目不一樣，但是你在任何一次考試所得的分數，卻是可以適用多年的，有點像考駕駛執照一樣，你不需要每年去考一次。因為這個分數是依照該次考試所有考生的成績，按照公式調整過的。而考試中心假定，每一次考試的全體學生的總和程度都是一樣的。

再說清楚一點，考試中心認定，每一次的考試，雖然試題不同，但是此次考試的考生的程度和別次考試的考生的程度，整體全部相同，所以不管你的原始分數考幾分，一律要按照他們設定的一個公式，放在這次全體考生的成績按照設定等級來分配。所以一個考生如果在這一次考試得了五百分，只要他的程度沒有改變，他參加任何一次考試，都會得五百分。

這就是為什麼考過一次TOEFL，它的成績可以用好幾年的原因。ETS給你規定年限，表面的理由是你的程度會改變（變差？變好？），但更重要的理由是為了要賺錢，你每多參加一次考試，他們就多賺你一次錢。

我們回到台灣的升學聯考，不論是過去的各式聯考和今天的基測、學測、或指考，這些考試的性質都不是「標準」測驗。這些考試的成績，都只是對該次考試有效而已，你不能把去年的成績拿來今年用，也不能把今年的成績拿到明年用。

在這種情形下，轉換原始成績成所謂的等級分，是完全沒有意義的，只是徒然製造問題罷了。原始分數經過數學統計的玩弄之後，已經失了原貌，它只剩下統計學上的意義，卻顯現不出個別學生之間成績的真正差距。譬如說，對一題的和對十題的，得到的是卻是同樣的等級分（請參考下方新聞，以及有關基測考試計分方式的相關報導）。

這些搞新式聯考的人，個個是教育測驗統計的專家，但是卻只會計算，適用對象已經錯了，還繼續錯下去。我們批閱作文時，不論文章內容再好，文藻功力再深，如果文不對題，那也只能給零分。這也像是一個醫術高明的醫生，無論醫術再強，學問再好，如果診斷錯誤，所有的醫術和學問，全盤無用，很可能還有害。

搞新式聯考的教育測驗專家們，你們的學術判斷應用能力是零分！

===================

量尺分數劫貧濟富林妙香果然說對了

【聯合晚報╱記者王彩鸝/台北報導】

2007.07.23 03:10 pm

二次基測不含寫作測驗，平均進步1.71分，但是社會科答對0~17題都只得1分，一次基測則是對0~14題得1分；這次更出現5科答對55題只得5分，也比一次基測對45題得5分更慘，即答對題數進步10題，分數卻原封不動。

「那ㄟ安呢？」有些考生看到二次基測量尺分數對照表，很疑惑的問，「不是平均分數進步嗎？為什麼我答對比上次多，分數卻更低？」

中研院研究員林妙香批評，基測量尺計分方式是「劫貧濟富」，今天公布的二次基測量尺分數表得到印證。社會科全錯和對17題都一樣得1分，五科總分得5分的最多答對題數竟高達55題，也就是說，有考生更努力，比一次基測答對題數大幅進步10題，分數仍然沒進展。

二次基測，國文答對12題、英語對14題、數學6題、社會17題、自然6題，都只能各得1分；分別比一次基測增加2題、3題、1題、3題和1題。

量尺分數對低成就學生是種懲罰？二次基測報考人數只有一次的五成多，最高分群和最低分群考生，因為申請到學校或是放棄升學，幾乎都不再報考二次基測，也就是說，壂底的考生多數都提前出局了，但據二次量尺表，低分群考生答對題數變多，分數沒進步，顯示學習落後的學生報考二次基測，遭受的打擊更大。

【2007/07/23 聯合晚報】

( 時事評論｜教育文化 )

哇新聞	城市
最新討論	最新文章
熱門討論	最新推薦
相簿	部落格
最新相片	最新文章
最新推薦	最新推薦


	引用者清單(1)


	回應文章