華倫埃斯迪:分數(shù)膨脹:大學(xué)教育的危機

發(fā)布時間:2020-05-24 來源: 美文摘抄 點擊:

  

  考試分數(shù),學(xué)生的學(xué)習(xí),教師的效率,學(xué)生對老師的評價之間有什么關(guān)系嗎?院系不同,給學(xué)生打分的標準一樣嗎?打分寬松的課程或院系是否會影響學(xué)生選課,甚至影響他們選專業(yè)?

  

  密執(zhí)安大學(xué)生物統(tǒng)計學(xué)教授瓦倫•約翰遜(Valen Johnson)用統(tǒng)計學(xué)方法研究了這些問題,并給出了無可挑剔的回答。約翰遜曾經(jīng)是杜克大學(xué)統(tǒng)計學(xué)和決策論教授,美國統(tǒng)計學(xué)協(xié)會理事。

  

  約翰遜的目的是研究現(xiàn)行分數(shù)評定制度對學(xué)生和老師的影響,并不是要說明“分數(shù)膨脹”已經(jīng)存在的事實。但是當他提出有些名牌學(xué)校像達特茅斯,哈佛,杜克中有44-46%的分數(shù)都是A或Aˉ,他當然期待讀者認為這些分數(shù)太高了。雖然約翰遜認為讀者應(yīng)該知道成績\"C\"表示“一般”,但沒有提出證據(jù)說明反映了事實,甚至沒有說分數(shù)在被拔高,因為過去不在他的研究范圍之內(nèi)。讓45%的學(xué)生得A或Aˉ畢竟和平均值不協(xié)調(diào),確實和膨脹有些關(guān)系,所以,他的標題并不是在誤導(dǎo)讀者。不管怎樣,它會吸引讀者的注意---我們簡單地說的高分數(shù)的問題。

  

  約翰遜關(guān)注的不是高分數(shù),而是現(xiàn)行的分數(shù)評定制度對學(xué)生和對老師產(chǎn)生的不同的影響。所以不妨稱為“分數(shù)懸殊。”分數(shù)影響學(xué)生選課、選專業(yè),影響找工作,或讀研究生。分數(shù)影響老師在學(xué)生評教中的得分和課程選修的人數(shù),導(dǎo)致給分偏低的老師在評職稱,晉級,提高工資等方面吃虧。在分析了分數(shù)懸殊的文獻研究的有效性之后,約翰遜將影響進行了量化,并發(fā)現(xiàn)了令人吃驚的結(jié)果。他說“分數(shù)懸殊現(xiàn)象造成美國高等教育質(zhì)量的普遍下降。不一致的分數(shù)評定標準造成對學(xué)生和老師的不公平評價,打擊學(xué)生選修那些對他們最有益處的課程! (239) 難怪他的副標題是“大學(xué)教育的危機!

  

  約翰遜緊接著承認“在大學(xué)里面關(guān)于分數(shù)的意義和目的存在著的深刻的哲學(xué)分歧! (3)他引用了別人指責高分數(shù)的說法!昂芏嗾n程的老師給一般學(xué)生甚至差學(xué)生很高的分數(shù)! (4) “分數(shù)膨脹擠壓高分學(xué)生、使得最好的學(xué)生和一般學(xué)生區(qū)分不開! (4)有些教師給不配得到的高分數(shù),就是想讓學(xué)生給他們評教分數(shù)打高些(49)。有些課程的一般水平學(xué)生的平均成績實際上比另外課程的優(yōu)秀學(xué)生的平均成績還高(199)。這樣的批評可以一直羅列下去。

  

  另一方面,每一次批評都能引來相應(yīng)的反擊!耙话銓W(xué)生現(xiàn)在得到B而不是C并沒有本能地破壞我們教育制度的價值。分數(shù)C只是表明一個等級而已! (196) “對單一模式評分標準的普遍質(zhì)疑使得大批的學(xué)生可以用多樣化的方式合理、適當?shù)乇憩F(xiàn)對日益增加的內(nèi)容的掌握! (8)。給高的分數(shù)并不能影響學(xué)生對老師的評價,相反,高質(zhì)量的教學(xué)才是產(chǎn)生學(xué)生和老師分數(shù)都高的結(jié)果。(10) “專業(yè)相關(guān)能力不同造成不同院系之間分數(shù)評定上的差異。” (205) “學(xué)生得高分的專業(yè)可能因為他們更勤奮,更有創(chuàng)造性,或擁有更多高考成績無法測量出的優(yōu)秀素質(zhì)。” (201)不可否認的是有些學(xué)校招收的學(xué)生就是好。(6)

  

  約翰遜一個接一個考察了這些哲學(xué)觀念分歧和對高分數(shù)的批評和辯護。作者盡量詳細地引用原話,讓為高分數(shù)辯護的觀點清楚可見。約翰遜注意到所有的辯護都依賴這樣或那樣的假設(shè),或想當然的事實上面,如果這些事實不存在,這些辯護就沒有說服力了。下面來看一下為高分數(shù)辯護所依賴的5個基本事實。經(jīng)過統(tǒng)計數(shù)據(jù)的檢驗后發(fā)現(xiàn),這些根本不是事實而是“神話!边@些神話包括:

  •學(xué)生的成績并沒有影響學(xué)生對老師評教的結(jié)果。

  •學(xué)生評教結(jié)果可靠地反映了教學(xué)的效果

  •分數(shù)高表明學(xué)生取得的成績大

  •學(xué)生選課決定不受他們可能遇到的評分標準的影響。

  •大學(xué)里沒有約束的評分在不同班級,不同院系,不同學(xué)校有一致的和客觀的意義。

  

  從統(tǒng)計學(xué)的角度看,這些神話確實不是事實。因為各項調(diào)查結(jié)果包括他自己的研究在內(nèi)都證明了這些說法與事實不符。調(diào)查結(jié)果不僅是統(tǒng)計學(xué)上差異的問題,而是實際上非常大。

  

  我認為沒有哪個統(tǒng)計學(xué)研究能夠說服批評家們,因為有太多的潛在的反對意見。也許高分數(shù)確實對學(xué)生有好處,也許學(xué)生確實勤奮理應(yīng)得到高分數(shù),也許現(xiàn)代評分制度容易產(chǎn)生高分數(shù)。但是,約翰遜并不是為我們提供了又一份研究報告而已。和以前的研究者設(shè)計實驗、檢驗假設(shè)一樣,分析為什么高分數(shù)合理或不合理的原因。約翰遜研究了這方面的實驗,分析實驗設(shè)計,檢驗實驗是否達到設(shè)定的目標,并匯報實驗的結(jié)果。

  

  在杜克大學(xué),他設(shè)計了一個大型的延續(xù)三年的研究項目,收集足夠的數(shù)據(jù)、探討所有這些有爭議的問題,特別關(guān)注分數(shù)和學(xué)生評教和學(xué)生選課之間的關(guān)系。在注冊的時候,允許學(xué)生在電腦上查看學(xué)生評教資料和老師給出的學(xué)生分數(shù)資料,決定這些數(shù)據(jù)是否對他們選課有影響。多數(shù)的資料收集有侵犯隱私的情況,學(xué)生在網(wǎng)上進行對老師的評價,這樣方便結(jié)合學(xué)生的其他資料。電腦創(chuàng)造了龐大的數(shù)據(jù)庫,記錄每個學(xué)生訪問的每個網(wǎng)頁以及他們后來的選課結(jié)果,以及注冊者的情況如學(xué)生的性別,種族和課程記錄。

  

  當然,也有老師并不想知道學(xué)生評教的內(nèi)容,從前的班級總平均成績(GPAs)對學(xué)生(在蒙大拿州立大學(xué)得不到)只進行了一年后,由于學(xué)生的抗議,他的項目無法進行下去。數(shù)學(xué)老師抗議聲最大,可能是因為部分老師的評教分數(shù)偏低,也可能因為擔心分數(shù)偏低的消息可能嚇跑選課的學(xué)生。約翰遜說“他們好像很天真地認為他們并沒有承受同樣的問題。”然而,這個因故縮短的實驗提供了足夠的數(shù)據(jù)來區(qū)分真正的原因和簡單的統(tǒng)計學(xué)上的相關(guān)關(guān)系。

  

  比如,對比不同院系個別學(xué)生的分數(shù)來斷定哪個系給分嚴格,哪個系給分寬松,并得出具體數(shù)據(jù)是完全可能的。如果某大學(xué)兩個系X and Y所有學(xué)生中,X 系的平均分數(shù)明顯比Y系平均成績高出很多,就可以證明X 系的分數(shù)更寬松。但是有沒有別的因素來解釋這個差距?有可能。這就是“實驗設(shè)計”要做的事---就是要保證能在“所有別的因素都相同的情況下”得出結(jié)論。

  

  老師普遍感興趣的是在不同學(xué)校進行的三個研究的結(jié)果對比表格,包括院系、數(shù)據(jù)、平均分數(shù)以及和常模的差距等。(203)。按照系評分標準,在其他因素都一樣的情況下,這個影響大得足夠讓一個中等學(xué)生的GPA從班級排名中間轉(zhuǎn)移到前25名或后25名。一個值得注意的現(xiàn)象是越是吸引好學(xué)生的院系給分越是嚴格,而學(xué)生相對較差的院系給分反而比較寬松。

  

  約翰遜的數(shù)據(jù)往往和一般常識相吻合。比如,對于一門課程,如果知道第一章得分比第2章得分高,學(xué)生很可能選擇第一章。雖然不能完全肯定,這至少表明:如果院系之間給分政策相似,學(xué)生選修自然科學(xué)課程的機會就多些。(理科分數(shù)一般比較嚴格)我有個女兒在蒙大拿州立大學(xué)學(xué)習(xí)數(shù)學(xué),我聽到她的朋友說選哪些課程純粹是看它們難度如何。一個學(xué)生就說因為擔心某門課的老師給分過分嚴格,準備調(diào)換專業(yè)。我承認自己上大學(xué)的時候根本就沒有這樣的想法,老師或系給高分或低分的影響有這么大。約翰遜估計杜克大學(xué)本科生將選修超過40%的自然科學(xué)課程,這個影響將等于在全部500名老師中,增加20多專職科學(xué)老師。這只是選修課的選擇,還沒有考慮寬松的給分政策將吸引到的額外的專業(yè)學(xué)生。

  

  緒論引人入勝。他首先注意到在幾所名牌高校分數(shù)有多么的高。(我最近在玩棋盤知識問答游戲(Trivial Pursuit),其中一個問題是“哈佛大學(xué)2002級每10學(xué)生里面有多少在畢業(yè)的時候是優(yōu)等生?答案是9個)接著他大量引用支持高分數(shù)的老師的觀點,意圖就是設(shè)計一個實驗,看看這些觀點是否符合真實情況。讀者肯定不會覺得驚訝,如果發(fā)現(xiàn)老師給學(xué)生打的分數(shù)和學(xué)生在評教時給老師打的分數(shù)呈正相關(guān)關(guān)系。雖然這個事實沒有爭議,但是究竟怎樣解釋是非常有爭議的。比如,教學(xué)好導(dǎo)致學(xué)生好分數(shù)和老師好評教成績(老師教學(xué)效果理論)。另一方面,眾所周知人們覺得別人給你好處你肯定得還人家人情(Influence: The Psychology of Persuasion, Robert B. Cialdini, 1993)。高老師評教成績被看作老師給學(xué)生好分數(shù)的正當?shù)幕貓?the \"grade-leniency theory\")。

  

  可以通過事實來檢驗這些理論。心理學(xué)家和統(tǒng)計學(xué)家已經(jīng)花了幾十年時間考慮類似問題,并設(shè)計實驗以便能區(qū)分因果關(guān)系或相關(guān)關(guān)系。比如評教往往在學(xué)生得到他們的分數(shù)之前進行。那樣的話,評教只能依賴估計的分數(shù),而不是分數(shù)本身。這就可能出現(xiàn)操縱期待的空間(沒有真正操縱分數(shù))為實驗?zāi)康膩砜丛u教是否受到影響。這就是我們的做法。還有學(xué)生評教進行兩次的情形,一次在得到自己分數(shù)之前,一次在知道自己分數(shù)之后。統(tǒng)計學(xué)設(shè)計是約翰遜的專長,他想讓讀者意識到支持評分制度的觀點同樣得到認真對待。在研究結(jié)束的時候,批評他的人找不到任何遺漏的地方。

  

  雖然約翰遜對過去這些年的分數(shù)上的變化不是很感興趣,但是他確實擔心這個事實:現(xiàn)在已經(jīng)無法用高分數(shù)獎賞出類拔萃的學(xué)生了,如果這個學(xué)校多數(shù)分數(shù)都很高的話,低分數(shù)甚至可能損害一個好學(xué)生的總成績(GPA)。一個蒙大拿高中老師曾對我說在過去10年中他教過的最好的學(xué)生并不是以班上前10名的成績畢業(yè)的,因為他曾經(jīng)得了B-plus in Band,而超過10%的班上同學(xué)畢業(yè)的時候成績是perfect 4.0。

  

  本書在第二章描寫他在杜克大學(xué)復(fù)雜實驗設(shè)計陷入僵局。里面細節(jié)性東西太多,普通讀者會覺得不好理解,除非受過統(tǒng)計學(xué)的訓(xùn)練或有強烈的動機。讀者不妨跳過去相信我的話統(tǒng)計學(xué)的工作做的不錯,實驗設(shè)計和目標以及標準的統(tǒng)計學(xué)因素和對沒有反應(yīng)的反對都處理的非常得當。

  

  但是到了第三章分數(shù)和學(xué)生評教關(guān)系的有趣內(nèi)容又出現(xiàn)了。約翰遜討論了這些調(diào)查的有趣的歷史,和社會學(xué)趨勢。他的目的是再次考慮實驗的設(shè)計和實驗?zāi)芑蛘卟荒芡茢嗟慕Y(jié)果。他探討了被稱為 “偏見”調(diào)查的因素,考慮了過去幾十年對為什么是正相關(guān)關(guān)系或負相關(guān)關(guān)系的解釋。過去70年進行的數(shù)百項研究和他們的解釋涵蓋內(nèi)容廣泛,遠遠超過“教師教學(xué)效率”和“分數(shù)寬大”理論。約翰遜討論了什么形式的設(shè)計能回答什么問題,挑選了三打“觀察性”研究,他發(fā)現(xiàn)接近正確設(shè)計的,來找出偏見對分數(shù)的影響。引人注目的正相關(guān)關(guān)系系數(shù)0.21完全支持分數(shù)影響評教的說法。

  

  然而,約翰遜注意到“在某種意義上,所有的觀察性研究都是有毛病的” (71)因而認為“實驗性”研究能真正設(shè)計得“解開學(xué)生分數(shù)和對老師評教成績之間的因果關(guān)系! (75)文章還分析了幾個發(fā)表的分數(shù)操縱實驗,接下來一章顯示他的杜克大學(xué)實驗是如何設(shè)計的來處理剩下未解決的問題。班級平均成績在學(xué)生評教項目反應(yīng)上的指標性作用遠遠低于學(xué)生個人分數(shù)或?qū)W生從前的興趣,這個事實和“教師效率理論指導(dǎo)下作出的預(yù)測相矛盾”,甚至還“比較支持分數(shù)寬松理論” (117)。他發(fā)現(xiàn)“分數(shù)歸因”理論最有用:“學(xué)生把學(xué)習(xí)上的成功歸因于自己的努力,把學(xué)習(xí)上的失敗歸因于外來因素。” (96)不管什么原因,分析提供了“確定性的證據(jù)說明學(xué)生分數(shù)影響學(xué)生對評教成績的評定。” (118)

  

  學(xué)界對高分數(shù)和不公平的分數(shù)的擔心表現(xiàn)在否認分數(shù)的客觀有效性,因而認為分數(shù)和其他因素的相關(guān)關(guān)系沒有意義。(\"The dangerous Myth of Grade Inflation,\" Alfie Kohn, Chronicle of Higher Education, 8 Nov. 2002) 對高分數(shù)的追求是真正學(xué)習(xí)的障礙,所以分數(shù)是問題而不是解決問題的辦法。約翰遜不失時機地痛斥這個后現(xiàn)代觀點“荒唐絕倫”。

  

  不管分數(shù)是否有客觀意義,它們肯定有影響,約翰遜竭力探索這個影響是非常有效的。該研究指出了常識性關(guān)系并提供了堅實的證據(jù)。從現(xiàn)在不公平的分數(shù)評定制度中得到好處的人將很難批駁這個研究成果。(他們唯一能做的就是簡單地貶低它或忽視它。)統(tǒng)計學(xué)不是新興學(xué)科,統(tǒng)計學(xué)家實際上能夠設(shè)計實驗區(qū)分因果關(guān)系和相關(guān)關(guān)系。這個研究牽涉太多的相互聯(lián)系的問題,所以自始至終都非常有趣吸引人。只是一旦他戴上統(tǒng)計學(xué)家的帽子,就不好讀了,他想向同行證明自己是業(yè)內(nèi)人士,就好像寫學(xué)術(shù)論文。

  

  但更多的時候,是非常有趣的。比如“狐貍效應(yīng)”是個注釋詳盡的漂亮的實驗,將數(shù)學(xué)應(yīng)用于研究人類行為的權(quán)威Dr.(點擊此處閱讀下一頁)

   Fox博士為不同領(lǐng)域的專業(yè)人士和研究生做關(guān)于“物理教育中的數(shù)學(xué)游戲理論” 的報告。他們給予這個報告高度的評價,盡管Dr. Fox博士實際上是個演員講了些沒有任何實質(zhì)內(nèi)容的東西。但是,他的報告熱情洋溢,詼諧幽默,明顯足夠讓聽眾欣賞,用最初的實驗者的話說“似是而非,新名詞,不和邏輯的推論,和矛盾百出的命題!

  

  文獻里面充滿了表明這種“誘惑”的文章導(dǎo)致學(xué)生對評教成績產(chǎn)生影響。總而言之,約翰遜得出結(jié)論說“準確評價教師教學(xué)效果和學(xué)生學(xué)習(xí)成績的工具還是令人困惑的,現(xiàn)行的評價工具在決定晉升,評職稱,工資分配等時,為學(xué)校當局提供的指導(dǎo)非常有限,而且其合法性讓人懷疑。(165)

  

  我們都知道好的愿望可能產(chǎn)生意料之外的后果。在我看來,這本書的重要貢獻就是講清楚了現(xiàn)在有些分數(shù)評定制度的負面后果。我非常喜歡本書的總論,包括對前文提出的關(guān)于分數(shù),評教,成績,學(xué)生選課決定等在統(tǒng)計學(xué)上的關(guān)系的解釋。其中許多內(nèi)容我自己從來就沒有想過,認為荒謬愚蠢。相信讀者看完本書會明白不公平的分數(shù)以及它的可怕影響。

  

  但是,究竟該怎么辦呢?約翰遜考慮了可能的分數(shù)調(diào)整機制及哲學(xué)理論基礎(chǔ),既有支持的也有反對的。大學(xué)足球隊電腦評級體系(BCS computer-ranking)爭議非常大。只要想象一下就知道取得共識多么困難,確保任何一個數(shù)學(xué)上的分數(shù)調(diào)整公式絕對公平根本不可能。

  

  所以,有什么激勵措施讓老師將高分數(shù)拉下來?我發(fā)現(xiàn)一個有趣的建議是設(shè)定一個班級里面優(yōu)等生比例的目標,如果超過了這個百分比,將高于這個百分比的好學(xué)生的評教去掉在計算他們的總結(jié)性統(tǒng)計數(shù)據(jù)。

  

  約翰遜支持對平均分數(shù)分布的限制,他說在研究生和專業(yè)學(xué)校里并不罕見的做法。他認為對各種限制的反對聲音,注意到它們在實際上能否行得通。比如,如果中數(shù)限制在某個分數(shù)或其以下,有些老師可能給51%的分數(shù)就在這個分數(shù)后其以下,49%的學(xué)生都是好分數(shù)。從哲學(xué)上來說,有人可能辯護說學(xué)生需要高分數(shù)以便進入好的研究生院,因為別人給的分數(shù)都很高。

  

  我覺得評定分數(shù)已經(jīng)走調(diào)了,因為他們在損失共同利益的情況下給個別人好成績(學(xué)生或老師)。我對打分數(shù)的抽象理論的忠誠讓我難以對同樣的表現(xiàn)給出過高的分數(shù)。我注意到給高分數(shù)的好處,但是不給高分數(shù)的好處在哪里?甚至大學(xué)都被迫考慮自己在大學(xué)的海洋里作為個體的存在問題,每個大學(xué)都在獎勵自己的學(xué)生高分數(shù)。好像只有全國性的行動才能遏制這個勢頭的進行。很明顯,哈佛最近決定限制優(yōu)秀畢業(yè)生的數(shù)量到班級學(xué)生總數(shù)的60%。值得慶賀。

  

  約翰遜提供了令人信服的證據(jù)說明學(xué)生所得分數(shù)對他們給老師教學(xué)效果評價時打分產(chǎn)生的影響。學(xué)生評教并不能可靠地評價教學(xué)效果,同樣的,高分數(shù)并不能表明學(xué)生成就更大,分數(shù)在不同的班級,院系,學(xué)校并沒有一致的意義。而且,學(xué)生選課和選專業(yè)受到可能得到的分數(shù)的影響非常大。同樣注目的是,他表明這些影響對大學(xué)整體造成破壞?杀氖,他不能顯示如何重新喚起老師對共同利益的責任。毫無疑問,這必須成為學(xué)界關(guān)心的重大問題。

  

  然而,我期待很少有哪個校長會承認約翰遜指出的這個危機。承認危機就意味著承認需要采取措施,而這看來在近期政治上是不可能的。如果大部分都是高分數(shù)有多大關(guān)系呢?某些老師或院系給的分數(shù)比其他高些有什么大不了?老師的晉升或評定職稱建立在學(xué)生評教(非常不可靠)基礎(chǔ)上有什么關(guān)系呢?約翰遜表明了對每個問題的答案都是肯定的。但是有哪個人愿意做些什么來改變嗎?恐怕沒有。

  

  譯自:Warren Esty’s review on Grade Inflation: a Crisis in College Education by Valen E. Johnson New York: Springer-Verlag, 2003 262 pages, $34.95 hc

   [The Montana Professor 14.2, Spring 2004 ]

  http://mtprof.msun.edu/Spr2004/estyrev.html

相關(guān)熱詞搜索:膨脹 華倫 分數(shù) 危機 埃斯

版權(quán)所有 蒲公英文摘 m.serialtips.com
谁有黄色毛片黄色网站,天天操美女的逼干,美女131湿影院,完美伴侣电视剧