網路城邦
上一篇 回創作列表 下一篇  字體:
台灣新式聯考的盲點所在:教育測驗統計的崇拜與誤用
2007/07/24 02:15:48瀏覽4409|回應6|推薦17

在台灣教育部和台灣某些教改人士通力合作下,為了廢除聯考而廢除聯考,聯考其實沒有廢除,只不過改了名字,換了系統,和計分方式。所謂基測、學測、指考等等,是一種類似能力檢定的標準程度測驗(Standarized Test),不料卻被拿來代替分分計較的聯考,牛頭不對馬嘴的原因,源自於台灣教育學者們對於美國教育測驗方式的盲目崇拜,以及對標準程度測驗(Standarized Test)的錯誤運用。

考過美國ETS (Educational Test Service) 測驗公司所舉辦的TOEFL或GRE的人一般會知道,考生所收到的成績,不是原始的成績,而是經過教育學統計處理過的。以前Toefl滿分六百j七十幾分,程度再差的人,即使你只答對一題,也能得到三百多分,但是如果你答對了四分之一的題目,也是三百多分。

之所以會這樣,是因為ETS採用了教育測驗統計學的一些理論,如最基本的,像選擇題如果有四個選擇,那麼會有四分之一的機會猜對,因此必須依據這個機率來調整計分;還有如常模分布,百分之六十六左右的人的成績要分布在中間等等,所以成績的安排也要按照這個來調整。

教育測驗統計的學問當然不止於此,不同的測驗統計專家還會在不同的測驗裡依照不同的理論發明不同的公式。舉個例來說,我們知道一個考試裡有不同的題目,在傳統的作法裡,各題配分已經直接寫在試卷上,但是在使用測驗統計的考試裡,測驗統計專家卻可以在考後,才依照每一題的答對情形來決定配分,至於決定配分的理論基礎,那又是另一套值得探討的東西。

以上所說,只是教育測驗統計裡,千千萬萬的玩法裡頭的一小部份,而且只是一個概說而已。

數學不好的學者不少,美國人數學不好,更是舉世通知,尤其是學社會科學(如社會、政治、經濟、教育、歷史等)和語言的,許多人遇到超過二位數的計算就已經大感吃不消。因此在美國學術界,只要你有一點統計的背景,十分吃香,非常好找工作。

統計學本身是一種學問,但是在這些社會科學裡,它卻只是一種應用的工具,有些學者卻玩統計玩到了走火入魔,反客為主,最明顯的是一些經濟學者發表的論文,通篇「不講人話」,只見一些數字在那裡跳躍堆積、反來覆去,好像深奧得不得了,但其實沒有什麼學術價值,說穿了沒有什麼內容,膚淺得很。

依據統計理論,轉換教育測驗的原始分數成為另一種分數,在像TOEFL, GRE, SAT, ACT 這類測驗上,有它的需要。這些測驗都是「標準程度」測驗,它們是一種門檻考試,是為了測定「標準程度」而考。換句話說,它雖然一年考好幾次,每一次出的題目不一樣,但是你在任何一次考試所得的分數,卻是可以適用多年的,有點像考駕駛執照一樣,你不需要每年去考一次。因為這個分數是依照該次考試所有考生的成績,按照公式調整過的。而考試中心假定,每一次考試的全體學生的總和程度都是一樣的。

再說清楚一點,考試中心認定,每一次的考試,雖然試題不同,但是此次考試的考生的程度和別次考試的考生的程度,整體全部相同,所以不管你的原始分數考幾分,一律要按照他們設定的一個公式,放在這次全體考生的成績按照設定等級來分配。所以一個考生如果在這一次考試得了五百分,只要他的程度沒有改變,他參加任何一次考試,都會得五百分。

這就是為什麼考過一次TOEFL,它的成績可以用好幾年的原因。ETS給你規定年限,表面的理由是你的程度會改變(變差?變好?),但更重要的理由是為了要賺錢,你每多參加一次考試,他們就多賺你一次錢。

我們回到台灣的升學聯考,不論是過去的各式聯考和今天的基測、學測、或指考,這些考試的性質都不是「標準」測驗。這些考試的成績,都只是對該次考試有效而已,你不能把去年的成績拿來今年用,也不能把今年的成績拿到明年用。

在這種情形下,轉換原始成績成所謂的等級分,是完全沒有意義的,只是徒然製造問題罷了。原始分數經過數學統計的玩弄之後,已經失了原貌,它只剩下統計學上的意義,卻顯現不出個別學生之間成績的真正差距。譬如說,對一題的和對十題的,得到的是卻是同樣的等級分(請參考下方新聞,以及有關基測考試計分方式的相關報導)。

這些搞新式聯考的人,個個是教育測驗統計的專家,但是卻只會計算,適用對象已經錯了,還繼續錯下去。我們批閱作文時,不論文章內容再好,文藻功力再深,如果文不對題,那也只能給零分。這也像是一個醫術高明的醫生,無論醫術再強,學問再好,如果診斷錯誤,所有的醫術和學問,全盤無用,很可能還有害。

搞新式聯考的教育測驗專家們,你們的學術判斷應用能力是零分!

===================

量尺分數劫貧濟富 林妙香果然說對了

二次基測不含寫作測驗,平均進步1.71分,但是社會科答對0~17題都只得1分,一次基測則是對0~14題得1分;這次更出現5科答對55題只得5分,也比一次基測對45題得5分更慘,即答對題數進步10題,分數卻原封不動。

「那ㄟ安呢?」有些考生看到二次基測量尺分數對照表,很疑惑的問,「不是平均分數進步嗎?為什麼我答對比上次多,分數卻更低?」

中研院研究員林妙香批評,基測量尺計分方式是「劫貧濟富」,今天公布的二次基測量尺分數表得到印證。社會科全錯和對17題都一樣得1分,五科總分得5分的最多答對題數竟高達55題,也就是說,有考生更努力,比一次基測答對題數大幅進步10題,分數仍然沒進展。

二次基測,國文答對12題、英語對14題、數學6題、社會17題、自然6題,都只能各得1分;分別比一次基測增加2題、3題、1題、3題和1題。

量尺分數對低成就學生是種懲罰?二次基測報考人數只有一次的五成多,最高分群和最低分群考生,因為申請到學校或是放棄升學,幾乎都不再報考二次基測,也就是說,壂底的考生多數都提前出局了,但據二次量尺表,低分群考生答對題數變多,分數沒進步,顯示學習落後的學生報考二次基測,遭受的打擊更大。

【2007/07/23 聯合晚報】

( 時事評論教育文化 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=ubhuang&aid=1110871
 引用者清單(1)  
2007/07/24 03:07 【企鵝爸爸的網誌】 為什麼二次基測的成績差不多?

 回應文章

李家若
等級:8
留言加入好友
不合理?
2010/06/23 14:54
所以基測的算分法做為升學依據並不合理?
時季常(ubhuang) 於 2010-06-23 15:13 回覆:

如果基測是考一次,成績數年有效,那使用那種計分法,就合理了。如果只有當年有效,採用那種算分法,就沒有道理。

這些教育統計專家,會統計,卻不知道那些統計的應用目的和對象。這就像一個法官,法律條文背得滾瓜爛熟,卻不知道那些法律條文的適用對象和範圍一樣。



等級:
留言加入好友
排名是很有用的資訊, 但搞得讓大家看不懂就沒用了.
2008/08/12 12:33
小弟覺得問題在大眾不了解 Normalized 分數的意義.
如果有考過托福應該就曉得了. (但1分的人又怎會有托福經驗呢?)

無論是傳統的給分還是新的 "正常化" 的分數,
都可以拿來當作客觀的實力評量.
沒事改成這個系統, 還要重新宣導, 有點多此一舉.

但小弟很贊成在成績單上的絕對分數後面加上一個 Ranking.
譬如說: 80 (5/100), 90 (12/100).
前者是 80 分, 一百個人中間排第五.
後者是 90 分, 但一百個人中間只排第十二.
如此一來就可以破解各校, 各考試給分寬鬆不一的情況.
考生也就清楚知道, 自己的成積相較其他人有沒有進步了.
時季常(ubhuang) 於 2010-06-23 15:15 回覆:

我也贊同,可以拿來做為學校成績評比使用。

這樣我們就知道,到底建中和附中的學生,聯考的成績表現到底差多少。



等級:
留言加入好友
2008/04/29 20:32

哀 我們就是這樣一路這樣被壓迫著長大

我覺得改來改去 改的都只是表面

這個社會"重視成績"的性格  卻是一直無法改變

父母都只希望小孩成績好  補習班才會越來越多

真是無奈


時季常(ubhuang) 於 2008-04-30 00:39 回覆:
不是很懂你的意思。

孟宗
等級:6
留言加入好友
說得好
2007/07/26 23:22

「文不對題」、「錯誤診斷」,形容得入木「十」分!


時和
等級:8
留言加入好友
搞懂了
2007/07/24 10:05
時和的老大明年參加基測,總算搞懂了計分方式。謝謝時季常教育博士的解說。
時季常(ubhuang) 於 2007-07-26 02:52 回覆:

真的不需要在意考上了那一個學校,台灣的公立高中都差不多,都有明確的課程以及有系統的教學,因為同學的平均程度與排名較前的高中較低,所造成的影響並不大。只要自己肯用功,上那一個學校其實差不多。

過程當然很重要,但是比賽是看結果的。