在「國中基測量尺及等化程序缺失」研究報告中,中研院統計科學研究所林妙香教授對國民中學學生基本學力測驗提出許多質疑。讀完這篇報告,我發現基測不僅違背了最初的理念,測驗品質也不佳。這麼多測驗專家發展出來的大型教育測驗只有這種品質,當然會失去民眾的信任。當測驗專業不再被信任,基測就不可能再有改善的機會了。
我始終認為,導致基測品質不佳的元兇,是歷次測驗實施後公佈試題。公布標準化測驗的試題是很荒謬的事。你不需要博士學位,只要修過大學二年級的心理測驗,就知道標準化測驗的試題不能公開。你看過 ACT 與 ETS 等大型測驗機構公布歷次測驗的試題嗎?試題不公開,才能根據測驗結果準確估計每個試題的難度、鑑別度與猜測度等參數,並建立題庫。
事實上,基測在規畫之初的確是打算藉由不公布試題以建立題庫的。這就是為什麼我說基測違背了最初的理念。教育部的「國中基本學力測驗、技專統一入學測驗、大學學科能力測驗、指定科目考試、全國各研究所考試等考試相關問題檢討與規劃專案報告」中有如下說明:
「基本學力測驗的運作方式不同於以往的考試形式,是採取事前命題,經過多次修題、審題、事前測試(預試)與試題分析,以得到試題的相關訊息(稱為試題參數),然後再將合乎要求的優良試題納入嚴格保密控管的題庫中。未來正式施測時,會依據事前公布的測驗目標,從題庫中抽取試題組成正式測驗進行考試。那些存放優良試題以及試題參數的資料庫就稱為題庫。由於該測驗攸關全國國中生進入下一教育階段的選擇依據,故試題研發及題庫管理之安全性受到各界矚目。」
我能想像,基測施行之初,學生家長和老師一定會要求公布試題。我也能理解,來自家長與老師的壓力有多大。我不能理解的是,為何心測中心的專家要屈服於這樣的壓力。公布試題,順了家長與老師的意,卻毀了一個測驗,失去民眾的信任,也帶給孩子們無盡的苦難。
是的,現行的基測仍會估計試題的參數。根據林教授報告中的說明,心測中心會在基測前將試題交給隨機抽樣的 240 至 320 位國中生預試,並以預試結果估計試題參數。你不用修過心理測驗也應該看得出來,究竟是以全國考生的測驗結果估計出來的參數比較準確,還是以兩三百位預試學生的測驗結果估計出來的參數比較準確。所以林教授會說:
「問:心測中心真的有建構題庫嗎?
答:題庫若有建構,充其量也是試題參數不精準的資料庫。」
基測還有一點讓我最百思不解,就是人工調整量尺分數。既然已經有良好的測驗理論與統計模型,何需再以人工調整量尺分數?根據《聯合新聞網》報導,心測中心表示人工調整量尺分數是配合教育部政策,在原始分數出來後,由心理測驗專家開會決定「錯一題扣幾分」。測驗分數的計算不是依據測驗理論,而是依據開會討論;這還叫標準化測驗嗎?
公平性的問題,倒不在測驗本身,而在登記分發制度。任何測量都有誤差,以前的聯考有誤差,現在的基測也有誤差。在誤差範圍內的不同分數,其實並不代表不同的能力。不論是以前的聯考或現在的基測,只要拿測驗成績來登記分發,就必須「分分必較」。這是絕對不公平的。
教育部日前宣布,一百學年度起,基測將只作升學門檻而非入學分發的依據。事實上,基測原本就不是為了考試分發設計的。如果要考試分發,舊式聯考就夠用了,不必再搞個基測。當初開始實施基測時,就應該同步廢除考試分發的制度。2001 年就該做的事,拖到 2011 年。這些年來,教育部的官員們腦子裡都在想些什麼?
如果心測中心當初堅持走正確的路,不因為來自外界壓力而退讓,就不會有今天的這些問題。專業妥協了,做了太多不專業的決定,結果設計出品質不佳的測驗,也制定了不公平的分發制度。家長與老師基測發展之初就不信任測驗專業,現在只會更不信任。一開始就沒能堅持立場把基測設計好,現在再想要做,就難上加難了。
延伸閱讀:高中、大學聯考亟須標準化的測試。