SAT改革白皮書(一)新SAT改革細(xì)則
5402 2017-02-15
一、改革的歷史
SAT考試從1926年成立,經(jīng)歷了大小十次改革,其中不免出現(xiàn)某些內(nèi)容取消后再恢復(fù)的現(xiàn)象,比如1928年數(shù)學(xué)部分取消,1930年數(shù)學(xué)部分恢復(fù);1974年設(shè)立寫作部分,1994年取消寫作部分,2005年再恢復(fù)寫作部分;分?jǐn)?shù)方面,2005年由1600改為2400,這次2016年改革再將總分改回至1600。SAT考試內(nèi)容翻來覆去的改革是College Board基于美國中學(xué)生和大學(xué)生的考試成績和在校表現(xiàn),同時回應(yīng)外界壓力做出的決定。例如2005年的改革,當(dāng)時因為College Board在美國西海岸的主要合作伙伴——加州大學(xué)經(jīng)過數(shù)據(jù)研究,證明SAT成績對于考生在大學(xué)表現(xiàn)的預(yù)估作用有限,宣稱可能不再把SAT成績作為加州大學(xué)系統(tǒng)的入學(xué)申請條件,College Board迫于外界壓力,進(jìn)行了改革,就產(chǎn)生了持續(xù)十年的現(xiàn)行SAT。
二、現(xiàn)行SAT的效度
效度(Validity)這個概念是測試學(xué)領(lǐng)域的基本概念,也是決定測試質(zhì)量的更重要標(biāo)準(zhǔn)。效度指的是考試結(jié)果在多大程度上反映出所測試的能力。對于SAT考試而言,效度意味著SAT成績在多大程度上反映出考生具備讀大學(xué)本科的能力。為了證明SAT考試的高效度,College Board建立了全國高校學(xué)生表現(xiàn)數(shù)據(jù)庫,根據(jù)歷屆高中畢業(yè)生參加完SAT后在大學(xué)一年級的表現(xiàn),通過線性回歸等數(shù)據(jù)統(tǒng)計方法,展開對于SAT預(yù)測效度(Predicative Validity)的研究。所謂預(yù)測效度,指的是考試成績能夠在多大程度上預(yù)測考生將來的能力或表現(xiàn)。表格一是基于2006年至2009年高中畢業(yè)的學(xué)生(2010-2013年大學(xué)畢業(yè))在大學(xué)一年級的成績和SAT各科目、高中平均分?jǐn)?shù)。
表格一:SAT各科目,高中平均分和大學(xué)一年級平均分的相關(guān)系數(shù)
年份 | 寫作 | 閱讀 | 數(shù)學(xué) | 閱讀和數(shù)學(xué) | SAT總分 | 高中平均分 | SAT總分和高中平均分 |
2009 | 0.52 | 0.48 | 0.48 | 0.52 | 0.54 | 0.54 | 0.62 |
2008 | 0.52 | 0.48 | 0.48 | 0.52 | 0.54 | 0.56 | 0.63 |
2007 | 0.53 | 0.50 | 0.49 | 0.54 | 0.56 | 0.56 | 0.64 |
2006 | 0.51 | 0.48 | 0.47 | 0.51 | 0.53 | 0.54 | 0.62 |
相關(guān)系數(shù)指的是兩個變量之間的相關(guān)程度,相關(guān)系數(shù)低、中、高分別對應(yīng)的數(shù)值是0.1,0.3,0.5,所以SAT各科目成績與大學(xué)一年級平均分相關(guān)性非常高,尤其是寫作部分??梢钥闯?閱讀和數(shù)學(xué)合并在一起,才和寫作成績對于大學(xué)表現(xiàn)的相關(guān)性持平。另外,SAT總分和高中平均分預(yù)測學(xué)生在大一表現(xiàn)的強度是一樣的。
為了進(jìn)一步證明SAT的高效度不僅體現(xiàn)在大學(xué)一年級的表現(xiàn),College Board利用相同的數(shù)據(jù)統(tǒng)計方法,研究SAT各科目、高中平均分對大三、大四學(xué)生的平均分以及累積平均分的預(yù)測效果,研究結(jié)果請見表格二。研究結(jié)果和表格一規(guī)律一致,不再贅述。值得一提的是,兩個表格中相對應(yīng)的單元格數(shù)據(jù),在表格普遍略小,原因是隨著在大學(xué)年級的提升,學(xué)生的學(xué)習(xí)成績由學(xué)生在大學(xué)的學(xué)習(xí)影響很大,SAT成績的預(yù)測效果就會相應(yīng)當(dāng)教學(xué)生降低,但即便如此,整個表格中所有相關(guān)系數(shù)都是大于0.3的,相關(guān)強度仍然是中等甚至高等。
表格二:SAT各科目,高中平均分和大學(xué)三、四年級平均分的相關(guān)系數(shù)
寫作 | 閱讀 | 數(shù)學(xué) | 閱讀和數(shù)學(xué) | SAT總分 | 高中平均分 | SAT總分和高中平均分 | |
3rd GPA | 0.43 | 0.40 | 0.38 | 0.42 | 0.45 | 0.46 | 0.52 |
3 cum GPA | 0.56 | 0.52 | 0.50 | 0.55 | 0.58 | 0.57 | 0.66 |
4th GPA | 0.39 | 0.35 | 0.33 | 0.37 | 0.40 | 0.43 | 0.47 |
4 cum GPA | 0.54 | 0.51 | 0.48 | 0.54 | 0.56 | 0.56 | 0.64 |
三、改革的動力
以上研究雖然規(guī)模大、數(shù)據(jù)量大,但都是由College Board自身執(zhí)行的。以下是全美國針對SAT的第二大規(guī)模的研究,加州大學(xué)對78000名大一學(xué)生進(jìn)行數(shù)據(jù)分析后,發(fā)現(xiàn)現(xiàn)行SAT在預(yù)測學(xué)生大學(xué)成績時不如SATⅡ。美國很多名校招生時需要或者建議考生提供SATⅡ的成績很好的驗證了這個發(fā)現(xiàn),用來彌補現(xiàn)行SAT的預(yù)測效度。SATⅡ是知識性測試,所以更和美國高中課程內(nèi)容相符。雖然現(xiàn)行SAT一直鼓吹基于美國高中課程,可凡是對現(xiàn)行SAT考試內(nèi)容熟悉的考生或家長很清楚,除了簡單的數(shù)學(xué)部分外,現(xiàn)行SAT和美國高中教學(xué)內(nèi)容沒有知識和內(nèi)容上的直接關(guān)聯(lián),反而其測試的很多能力是大學(xué)生活所必需的,在高中并沒有經(jīng)過充分的訓(xùn)練。早在2002年,Atkinson就指出,當(dāng)時的SATⅠ(和現(xiàn)行SAT差別不大,主要是沒有語法題和作文)測試了獨立于高中課程內(nèi)容的能力,然而SATⅡ測試了高中科目的知識和技能掌握情況。
加利福尼亞大學(xué)的這次研究還發(fā)現(xiàn),比起SATⅡ,現(xiàn)行SAT成績更受到社會經(jīng)濟變量的影響。簡單說,家庭條件、父母受教育程度以及初高中學(xué)校水平等都在很大程度上影響著現(xiàn)行SAT的考試成績,這就構(gòu)成了測試偏見問題,使得SAT考試對經(jīng)濟條件好的考生更有利。其實這個問題在能力型測試中并不罕見,全球規(guī)模的PISA測試成績就充分表明,社會經(jīng)濟變量很大程度地影響著考生成績。出現(xiàn)這個現(xiàn)象的一個重要原因就是社會經(jīng)濟變量很大程度上影響著SAT的備考和表現(xiàn),因為備考SAT所需的備考資料和培訓(xùn)課程價格不菲,對于低收入家庭是筆不小的開支,相比之下,SATⅡ基于高中課程,所以考生在準(zhǔn)備起來,不需要太多額外的資金投入。針對這一點,College Board和Khan Academy(可汗學(xué)院)合作,在可汗學(xué)院網(wǎng)站上將發(fā)布新SAT練習(xí)題等資料,盡量削弱社會經(jīng)濟變量對新SAT成績的影響。
College Board新總裁David Coleman來自教育世家,畢業(yè)于耶魯大學(xué),隨后憑借羅氏獎學(xué)金先后在牛津和劍橋大學(xué)研究英語文學(xué)和古典教育哲學(xué)??茽柭壬?007年合伙創(chuàng)辦非盈利機構(gòu) — 學(xué)生成就伙伴,該機構(gòu)專注于制定和推廣全美統(tǒng)一的數(shù)學(xué)和英語基礎(chǔ)教育大綱(Common Core State Standard)。到目前為止,全美已經(jīng)有46個州采用該課程大綱,而在此之前美國沒有一個能為大多數(shù)州通用的基礎(chǔ)教育階段的課程大綱。在2012年10月,科爾曼先生離開創(chuàng)立五年之久的學(xué)生成就伙伴機構(gòu),正式加入美國大學(xué)理事會。就在科爾曼上任卓絕年,SAT考生人數(shù)被ACT超越,雖然科爾曼說這并不重要,但是ACT作為另一個美國高考(有時被稱作美國會考)被越來越多的大學(xué)接受,這對College Board來說,是前所未有的挑戰(zhàn)。科爾曼充分基于自己創(chuàng)立的極具影響力的美國課程大綱,對SAT進(jìn)行了大刀闊斧的改革。
美國課程大綱是基于2009年創(chuàng)立的College and career readiness standards(大學(xué)和就業(yè)預(yù)備標(biāo)準(zhǔn)),該標(biāo)準(zhǔn)針對高中生進(jìn)入大學(xué)和職場所需的知識和能力,這個美國課程標(biāo)準(zhǔn)和新SAT宗旨完全一致。美國課程大綱進(jìn)行了國際化的分級,使得美國學(xué)生在于全世界學(xué)生競爭時有據(jù)可依。該大綱于2010年創(chuàng)立,在短短的2年內(nèi)已經(jīng)得到美國46個州的采用。新SAT基于美國課程大綱,考試內(nèi)容和高中課程沒有脫節(jié),這對ACT也將是重重的一擊。相比之下,ACT雖然一直在與課程結(jié)合方面做大力推廣,比如中國的GAC課程,但是其影響力無法和新SAT所依靠的全美課程標(biāo)準(zhǔn)相比。
由于課程大綱內(nèi)容繁多,本文僅節(jié)選和新SAT考試內(nèi)容更為相關(guān)的部分。
Literacy.RL.11-12.5a
Interpret figures of speech (e.g., hyperbole, paradox) in context and analyze their role in the text.
Literacy.RL.11-12.6
Analyze a case in which grasping point of view requires distinguishing what is directly stated in a text from what is really meant (e.g., satire, sarcasm, irony, or understatement).
要求學(xué)生掌握修辭手法,區(qū)分文章字面意思和作者真正的意圖或態(tài)度,這在現(xiàn)行SAT和新SAT中都是閱讀題中的重點題型(如目的/功能題,態(tài)度/語氣題,修辭手法題)所考察的能力。
Literacy.RL.11-12.9
Demonstrate knowledge of eighteenth-, nineteenth- and early-twentieth-century foundational works of American literature, including how two or more texts from the same period treat similar themes or topics.
要求學(xué)生了解18、19世紀(jì)以及20世紀(jì)早期的美國文學(xué),了解同一時代的不同文章怎樣討論同一話題,這在現(xiàn)行SAT和新SAT中表現(xiàn)為小說和對比類文章,尤其是長對比。
Literacy.RL.11-12.5b
Analyze nuances in the meaning of words with similar denotations.
新SAT語法部分加入了區(qū)分近義詞的題目。
Reading RI.11-12.7
Integrate and evaluate multiple sources of information presented in different media or formats (e.g., visually, quantitatively) as well as in words in order to address a question or solve a problem.
這是新SAT的特色,不論閱讀、語法還是數(shù)學(xué),都加入了大量的圖表和數(shù)據(jù)分析元素,實用性更強。
Reading RI.11-12.8
Delineate and evaluate the reasoning in seminal U.S. texts, including the application of constitutional principles and use of legal reasoning (e.g., in U.S. Supreme Court majority opinions and dissents) and the premises, purposes, and arguments in works of public advocacy (e.g., The Federalist, presidential addresses).
Reading RI.11-12.9
Analyze seventeenth-, eighteenth-, and nineteenth-century foundational U.S. documents of historical and literary significance (including The Declaration of Independence, the Preamble to the Constitution, the Bill of Rights, and Lincoln’s Second Inaugural Address) for their themes, purposes, and rhetorical features.
這兩條標(biāo)準(zhǔn)是新SAT的另一特色,就是每次考試必然會有一篇文章是美國建國文獻(xiàn)或重要演講。
Writing W.11-12.8
Assess the strengths and limitations of each source in terms of the task, purpose, and audience; integrate information into the text selectively to maintain the flow of ideas.
這可以說是新SAT的更大亮點,新SAT丟棄了現(xiàn)行SAT的作文(議論文),采用了分析性寫作的形式。
四、改革內(nèi)容
1. 分?jǐn)?shù)和時間
數(shù)學(xué) | 閱讀 | 寫作 | 總計 | ||
現(xiàn)行SAT | 200-800分 | 200-800分 | 200-800分 | 600-2400分 | |
70分鐘 54題 | 70分鐘 67題 | 35分鐘 49題 | 25分鐘 1篇作文 | 200分鐘(不含加試) 170題 1篇作文 |
新SAT | 數(shù)學(xué) | 實證閱讀和寫作 | 作文(可選) | 總計 | |
200-800分 | 200-800分 | 滿分8分 | 400分-1600分 | ||
80分鐘 57題 | 65分鐘 | 35分鐘 | 50分鐘 1篇 | 230分鐘(不含加試) | |
52題 | 44題 | 153題 1篇作文 |
總分由2400回歸到2005年之前的1600分,這些都是標(biāo)準(zhǔn)分,并非原始分,原始分是由做對題目和做錯題目的數(shù)量決定的,而標(biāo)準(zhǔn)分是由原始分經(jīng)過復(fù)雜函數(shù)換算的,標(biāo)準(zhǔn)分的目的非常明確,能夠直觀反映出獲得某個分?jǐn)?shù)的考生在整個考生群體中的排名。單科800分意味著在所有考生中排名卓絕,200分意味著倒數(shù)卓絕,500分意味著更中間排名,所以考生即使所有題目全部做錯,在現(xiàn)行SAT中由于倒扣分制度導(dǎo)致原始分為負(fù)數(shù),他也能拿到200分。總分同理。這也能很好的解釋為什么每套試卷的評分表不一樣,這是由試卷難度決定的。如果某套題難度特別大,雖然考生錯題個數(shù)多,但是因為所有考生都面臨同樣的困難,導(dǎo)致整體錯誤率都高,為了保證每個標(biāo)準(zhǔn)分?jǐn)?shù)段有固定比例的考生(正態(tài)分布),評分標(biāo)準(zhǔn)必然會寬松,考生反而考的不差。所以考生不論考現(xiàn)行SAT還是新SAT,都不需要糾結(jié)試卷的難度。同樣,這也能解釋為什么閱讀有容錯率,一般來說,閱讀部分錯1個,2個,甚至3個題都能拿到800分,這是因為做全對的考生比例太小,即使某考生錯了3個,排名仍然十分靠前,仍然能拿到800分。當(dāng)然,也能解釋為什么錯一個數(shù)學(xué)題目經(jīng)常只能拿得到770或者760分。
很明顯,數(shù)學(xué)的分值比例明顯增加,由30%上升到50%,因為中國考生數(shù)學(xué)較強,所以該比例上升是利好消息;閱讀分值比例由30%下降為27%,變化很小,同時考慮到現(xiàn)行SAT占分比例為9.5%的句子填空題屬于閱讀部分,所以單論閱讀題,實際上分值比例由24%上升到27%;語法分值保持23%不變;作文由原來的10%改為選考,不參與總分,單獨計分??傊?數(shù)學(xué)的重要性在增加,作文計分方式改動,句子填空題取消。
從解題時間上看,數(shù)學(xué)由每題的1.3分鐘增加到1.4分鐘,增加了6秒鐘,主要原因是新SAT數(shù)學(xué)題目閱讀量明顯變大,很多題目閱讀量是現(xiàn)行SAT的2-3倍,所以在數(shù)學(xué)科目上,考生一定要專門訓(xùn)練解題速度。閱讀方面,平均每題做題時間由63秒增加至75秒,增加了12秒,但是現(xiàn)行SAT是有19道句子填空題,該題型做題時間本來就很短,所以假設(shè)每道句子填空題用時30秒(大多數(shù)同學(xué)都能做到),現(xiàn)行SAT閱讀題每題做題時間是75.6秒,和新SAT幾乎完全一樣。語法題每題做題時間有43秒增加到48秒,原因是新SAT語法題是分散在文章中的,不是孤立的一個句子一道題。50分鐘的寫作時間比較充分。
2. 取消倒扣分制度
現(xiàn)行SAT的倒扣分制度目的是消除猜題的影響,每題如果選錯要倒扣0.25分,但是其不科學(xué)的地方在于分?jǐn)?shù)的“零頭”,比如原始分29.5, 29.75, 30, 30.25都?xì)w為30分,但29.5和30.25之間相差0.75,幾乎是一個題目的分?jǐn)?shù)。所以取消倒扣分制度更加科學(xué),這樣所有考生都不會空題,在“蒙答案”方面,如果隨機選擇,就看運氣了,但如果是在排除干擾選項的前提下蒙答案,那么也能體現(xiàn)考生之間的水平差異,干擾選項排除的越多越準(zhǔn)確,蒙對的幾率就越高。
3. 選項個數(shù)改變
每個題目選項數(shù)量由5個變?yōu)?個。雖然干擾性很高的選項仍然存在,但是選項數(shù)量減少為考生減輕了閱讀負(fù)擔(dān),有更多的時間和精力分析正確答案和強干擾選項。另外由于選錯答案不倒扣分,得分的幾率就更高了。
4. 數(shù)學(xué)部分的變化
4.1 形式變化
改革后的數(shù)學(xué)題型和現(xiàn)在一致:選擇題和填空題;對應(yīng)的題目數(shù)量也基本一致:選擇題由44增加到45個,填空題由10增加到12個。計算器的使用規(guī)則有改變:由現(xiàn)在的數(shù)學(xué)部分都可使用計算器到改革后的部分可使用計算器。這對中國學(xué)生影響不大,因為大部分學(xué)生很擅長紙算或心算。
4.2 內(nèi)容變化
(1)現(xiàn)在大綱中的考察部分“基礎(chǔ)數(shù)論與運算”在新出的考綱中將被平均分配到“代數(shù)”“數(shù)據(jù)分析”“高等數(shù)學(xué)”“其他”中去?!捌渌边@一部分會新增如“復(fù)數(shù)”的考點。
(2)幾何的考察比例由現(xiàn)在的25%-30%,將被縮減為不到10%??臻g幾何的內(nèi)容將被刪除。
(3)“數(shù)表分析”的考察比例(28%),較之現(xiàn)在(約15%)有較大提升。內(nèi)容與現(xiàn)在的大綱基本一致,但是考察方式有所改變,除了繼續(xù)考察圖表數(shù)據(jù)分析外,還加強了對圖像的特征進(jìn)行文字描述的考察。
(4)新SAT將新增“高等數(shù)學(xué)”這一部分,其中考試的知識點,如多項式的因子,根等,是現(xiàn)行SATⅠ考試大綱中不做要求的,但SATⅡ數(shù)學(xué)要求。
4.3 閱讀部分的變化
a 題材
考試大綱明確規(guī)定,美國及世界文學(xué)出1篇,歷史及社會研究出2篇,科學(xué)出2篇。和現(xiàn)行SAT相比,科學(xué)類文章的比例有提升。歷史及社會研究的這2篇中,有一篇必定是美國建國文獻(xiàn)或者知名演講。取消了短文章(包括單短和雙短)。
b題型
句子填空題全部取消;修辭類題型的比例在上升??疾煸~義辨析、文章結(jié)構(gòu)、目的解讀、論證過程的題型比例比現(xiàn)行SAT要大;官方所特別強調(diào)的‘用原文合適的語句來支撐特定的觀點’的題型,是新SAT特色題型,體現(xiàn)出基于證據(jù)的閱讀宗旨;另一種新題型是圖表題,要求考生將圖表中的信息與對應(yīng)的原文文本信息合成在一起,選一個答案。
4.4 語法部分的變化
a 題型
取消現(xiàn)行SAT中以單個句子為考察單位的題型:句子改進(jìn)題(Improving Sentences)和句子找錯題(Identifying Errors)。新SAT將所有題目嵌入文章中,需要考生結(jié)合上下文改進(jìn)句子。與閱讀一樣,語法部分也加入了圖表題。此類題目的本質(zhì),是“看圖選正確的描述句”,考察“對這個圖形來說,哪個選項的描述更準(zhǔn)確、更全面?!?nbsp;
b 考點
語法考點范圍變化不大,但是標(biāo)點符號考察的比例明顯增加。此外,出現(xiàn)了近義詞選擇題,考察學(xué)生的選詞能力,比如vacate(空出)、evacuate(撤出)和depart(分離)的區(qū)別。
c 題材
考試大綱顯示,語法部分會有1篇職業(yè)類文章(如職位描述與分析)、1篇歷史與社會研究、1篇人文、1篇科學(xué)。其中職業(yè)類文章是新SAT的特色文章。
4.5 作文部分的變化
a 形式
新SAT作文是分析性寫作,要求考生針對一篇文章(650-750詞)寫一篇評論性文章??忌缶V明確規(guī)定,考生評價的方面有三:作者在論證自己論點時使用的證據(jù)好不好;在組織整體論證時,論證過程是否合理、嚴(yán)密;在完成論證目標(biāo)時,采用了哪些風(fēng)格上及說服上的元素。
b 評分標(biāo)準(zhǔn)
新SAT作文評分標(biāo)準(zhǔn)分3個部分:閱讀文章理解的準(zhǔn)確性與全面性;評價分析的點找的好不好、準(zhǔn)不準(zhǔn)、多不多;考生所用的語言質(zhì)量及前后的銜接程度。這三個部分是分別判分的,滿分為8分。
掃一掃
獲取更多福利
獵學(xué)網(wǎng)企業(yè)微信
獵學(xué)網(wǎng)訂閱號
獵學(xué)網(wǎng)服務(wù)號