關鍵詞:物理學業評價;課程標準;一致性;一致性分析模式。
隨著 “基于課程標準的教育改革”在國際上的深入開展,學業評價與課程標準的一致性研究引起全球范圍內的廣泛關注。學業評價的設計與實施均需以學科課程標準中的相應要求為依據。課程標準的嚴謹性、明確性、可操作性和挑戰性等特征是基于標準的教育改革取得成功的前提條件,而學業評價與相應課程標準具備一致性則是教育改革取得成功的關鍵要素。[1]學業評價與相應課程標準一致時,可以有效激發并引導教師和學生開展高效而合理的教育實踐活動,促進教育朝著預期的方向良性發展;而兩者不一致時,則會產生不準確的評價結果,導致不合理的決定,引發不恰當的教育實踐行為,并最終將教育指向不正確的方向。[2]作為基于課程標準的教育評價,物理學業評價理應與課程標準保持一致。研究物理學業評價與課程標準一致性問題具有重要意義。在深入分析國內外一致性研究現狀基礎上,筆者對已有研究進行深度反思,梳理已有研究取得的成就及可能存在的局限性,并對未來研究趨勢進行預測。
一、物理學業評價與課程標準一致性研究現狀。
國內外研究者對物理學業評價與課程標準一致性開展了豐富的研究。已有研究主要分為兩大類,第一類是物理學業評價與課程標準一致性分析模式研究,第二類是物理學業評價試題與內容標準的一致性研究。相關研究對全球范圍內物理課程改革的順利進行和深入發展發揮了重要作用。
(一)物理學業評價與課程標準一致性分析模式研究現狀。
國內外影響力較大的學業評價與課程標準一致 性 分 析 模 式 主 要 包 括 韋 伯 模 式 (WebbModel)、 實 施 課 程 調 查 模 式 (Surveys ofEnacted Curriculum Model)、 成 就 公 司 模 式(Achieve Inc.Model)等。韋伯模式確定知識深度、知識種類、知識樣本平衡性、知識廣度 “四維度”為一致性分析的具體標準,并為每一標準界定了可接受的水平。[3]實施課程調查模式確定認知水平和內容主題 “兩維度”為一致性分析的具體標準,并界定了一致性指數的臨界值。[4]成就公司模式確定挑戰性、平衡性和范圍、內容一致性、表現一致性 “四維度”為一致性分析的具體標準,并給出判定標準。[5]其他一致性分析模式包括評價、課程標準及學生測試研究中心模式(CRESST Model),巴 羅 斯 中 心 模 式 (BurosCentre Model),威克森模式 (Karen K.WixsonModel),2061計劃模式 (Project 2061Model),斯坦 福 國 際 研 究 所 模 式 (SRI InternationalModel),基礎教育協會模式 (Council for BasicEducation Model)等。不同的一致性分析模式關注的維度存在差異,各有所側重??傮w來看,共涉及以下維度:認知要求、測試內容、難度、范圍、題量、價值取向、教學引導。[6]
國內外研究者開展物理學業評價與課程標準的一致性研究時,較多采用實施課程調查模式。安德魯·帕特 (Andrew Porter)等人在建構實施課程調查模式過程中,借鑒、吸納并改造了韋伯模式。[7]他們認為,衡量一致性最核心的標準是知識深度一致性標準,最直接的標準是知識種類一致性標準,最終確定認知水平和內容主題兩個維度。實施課程調查模式一致性分析步驟為:首先需要將物理內容標準和物理學業評價試卷分別轉化成相同結構的二維編碼矩陣表格;其次將編碼矩陣表格中所有數據進行歸一化處理,形成兩個比率表格,對兩個比率表格中一一對應的單元格值的一致性進行比較;最后將兩個比率表格中的單元格值代入帕特一致性系數公式進行計算,將得出的一致性系數與臨界值比較,即可判斷物理學業評價與課程標準的一致性程度。[4][8]
(二)物理學業評價試題與內容標準一致性研究現狀。
國內外研究者多是借鑒實施課程調查模式對物理學業評價試題與內容標準一致性進行了實證研究。開展試題與內容標準一致性分析時涉及的一致性分析維度主要為物理內容主題和認知水平,不同研究對物理內容主題和認知水平的劃分詳見表1.
綜觀國內外物理學業評價試題與內容標準一致性研究,對物理內容主題的分類主要包括三大類:第一類是依據本國物理課程內容標準中內容主題的分類 (如美國的表述為陳述句,中國的表述為名詞短語),第二類是依據美國州首席教育官 員 理 事 會 (Council of Chief State SchoolOfficers)對物理學內容的分類 (包括物質的屬性、運動和力、能量、電、波五大部分),[9]第三類是依據特定的標準對物理內容重新分類。已有研究對認知水平的分類主要包括三大類:第一類是依據本國物理課程標準中認知水平的分類,第二類是依據修訂的布魯姆認知目標分類 (包括記憶、理解、應用、分析、評價、創造),第三類是依據特定的標準重新界定認知水平的分類。
國內外研究者在確定了認知水平和內容主題之后,按照實施課程調查模式一致性分析程序,物理學業評價試題和物理內容標準分別被構建成“內容主題×認知水平”的二維編碼矩陣,根據兩個二維編碼矩陣的匹配程度來衡量物理學業評價試題與物理內容標準的一致性。柳秀峰等人研究了美國紐約州物理科目攝政考試與核心課程標準的一致性,發現攝政考試與核心課程標準總體上一致性程度較高,但與核心課程標準對不同物理內容主題及認知水平的要求相比較,攝政考試的考查側重點有一定偏差。[2]柳秀峰、袁海泉等人研究了美國紐約州、中國江蘇省、新加坡三種教育制度下物理測驗與物理內容標準的一致性,發現美國紐約州試卷與內容標準一致性程度較高,而中國江蘇省試卷、新加坡試卷分別與對應的內容標準不具備顯著一致性,相比于物理內容標準,中國江蘇省試卷和新加坡試卷均加大了對較高認知水平的考查力度,中國江蘇省試卷比物理內容標準更加強調電學知識的考查。[9]國內學者陳嫻 (2010),王煥霞 (2011,2012,2015),羅瑩 (2011),蔡麗 (2012),袁令民 (2013),呂 華 榮 (2013), 張 光 燕 (2014), 楊 小 麗(2014),孫枝蓮 (2015),金毅 (2016)等對物理學業評價試題與物理內容標準的一致性進行了實證調查與分析研究。研究結果大多表明了物理學業評價試題與物理內容標準具備或不具備顯著的一致性,并進行了分類比較,與物理內容標準相比,試題對內容主題的側重是否有偏差,試題對認知水平的側重是否有偏差等。大多數研究者不僅通過大量翔實的數據對試題與課程內容標準中的要求進行比較,而且通過繪制直方圖、地形圖等形式直觀地呈現了課程內容標準或試卷在不同內容主題和認知水平的權重,較好地體現了量化研究的特征。