摘要:学业评价与课程标准的一致性研究引起全球范围内的广泛关注。国内外物理教育研究者主要开展了一致性分析模式研究,试题与内容标准的一致性研究等。综观已有研究,发现还存在一些难点和问题,包括一致性分析模式需持续优化完善;编码者分析的信度和效度需进一步增强;物理内容主题及认知水平的划分及准确判断等。未来研究可从开展广泛的合作研究、构建本土化一致性分析模式、构建一致性研究专业网站等方面着力进行。
关键词:物理学业评价;课程标准;一致性;一致性分析模式。
随着 “基于课程标准的教育改革”在国际上的深入开展,学业评价与课程标准的一致性研究引起全球范围内的广泛关注。学业评价的设计与实施均需以学科课程标准中的相应要求为依据。课程标准的严谨性、明确性、可操作性和挑战性等特征是基于标准的教育改革取得成功的前提条件,而学业评价与相应课程标准具备一致性则是教育改革取得成功的关键要素。[1]学业评价与相应课程标准一致时,可以有效激发并引导教师和学生开展高效而合理的教育实践活动,促进教育朝着预期的方向良性发展;而两者不一致时,则会产生不准确的评价结果,导致不合理的决定,引发不恰当的教育实践行为,并最终将教育指向不正确的方向。[2]作为基于课程标准的教育评价,物理学业评价理应与课程标准保持一致。研究物理学业评价与课程标准一致性问题具有重要意义。在深入分析国内外一致性研究现状基础上,笔者对已有研究进行深度反思,梳理已有研究取得的成就及可能存在的局限性,并对未来研究趋势进行预测。
一、物理学业评价与课程标准一致性研究现状。
国内外研究者对物理学业评价与课程标准一致性开展了丰富的研究。已有研究主要分为两大类,第一类是物理学业评价与课程标准一致性分析模式研究,第二类是物理学业评价试题与内容标准的一致性研究。相关研究对全球范围内物理课程改革的顺利进行和深入发展发挥了重要作用。
(一)物理学业评价与课程标准一致性分析模式研究现状。
国内外影响力较大的学业评价与课程标准一致 性 分 析 模 式 主 要 包 括 韦 伯 模 式 (WebbModel)、 实 施 课 程 调 查 模 式 (Surveys ofEnacted Curriculum Model)、 成 就 公 司 模 式(Achieve Inc.Model)等。韦伯模式确定知识深度、知识种类、知识样本平衡性、知识广度 “四维度”为一致性分析的具体标准,并为每一标准界定了可接受的水平。[3]实施课程调查模式确定认知水平和内容主题 “两维度”为一致性分析的具体标准,并界定了一致性指数的临界值。[4]成就公司模式确定挑战性、平衡性和范围、内容一致性、表现一致性 “四维度”为一致性分析的具体标准,并给出判定标准。[5]其他一致性分析模式包括评价、课程标准及学生测试研究中心模式(CRESST Model),巴 罗 斯 中 心 模 式 (BurosCentre Model),威克森模式 (Karen K.WixsonModel),2061计划模式 (Project 2061Model),斯坦 福 国 际 研 究 所 模 式 (SRI InternationalModel),基础教育协会模式 (Council for BasicEducation Model)等。不同的一致性分析模式关注的维度存在差异,各有所侧重。总体来看,共涉及以下维度:认知要求、测试内容、难度、范围、题量、价值取向、教学引导。[6]
国内外研究者开展物理学业评价与课程标准的一致性研究时,较多采用实施课程调查模式。安德鲁·帕特 (Andrew Porter)等人在建构实施课程调查模式过程中,借鉴、吸纳并改造了韦伯模式。[7]他们认为,衡量一致性最核心的标准是知识深度一致性标准,最直接的标准是知识种类一致性标准,最终确定认知水平和内容主题两个维度。实施课程调查模式一致性分析步骤为:首先需要将物理内容标准和物理学业评价试卷分别转化成相同结构的二维编码矩阵表格;其次将编码矩阵表格中所有数据进行归一化处理,形成两个比率表格,对两个比率表格中一一对应的单元格值的一致性进行比较;最后将两个比率表格中的单元格值代入帕特一致性系数公式进行计算,将得出的一致性系数与临界值比较,即可判断物理学业评价与课程标准的一致性程度。[4][8]
(二)物理学业评价试题与内容标准一致性研究现状。
国内外研究者多是借鉴实施课程调查模式对物理学业评价试题与内容标准一致性进行了实证研究。开展试题与内容标准一致性分析时涉及的一致性分析维度主要为物理内容主题和认知水平,不同研究对物理内容主题和认知水平的划分详见表1.
综观国内外物理学业评价试题与内容标准一致性研究,对物理内容主题的分类主要包括三大类:第一类是依据本国物理课程内容标准中内容主题的分类 (如美国的表述为陈述句,中国的表述为名词短语),第二类是依据美国州首席教育官 员 理 事 会 (Council of Chief State SchoolOfficers)对物理学内容的分类 (包括物质的属性、运动和力、能量、电、波五大部分),[9]第三类是依据特定的标准对物理内容重新分类。已有研究对认知水平的分类主要包括三大类:第一类是依据本国物理课程标准中认知水平的分类,第二类是依据修订的布鲁姆认知目标分类 (包括记忆、理解、应用、分析、评价、创造),第三类是依据特定的标准重新界定认知水平的分类。
国内外研究者在确定了认知水平和内容主题之后,按照实施课程调查模式一致性分析程序,物理学业评价试题和物理内容标准分别被构建成“内容主题×认知水平”的二维编码矩阵,根据两个二维编码矩阵的匹配程度来衡量物理学业评价试题与物理内容标准的一致性。柳秀峰等人研究了美国纽约州物理科目摄政考试与核心课程标准的一致性,发现摄政考试与核心课程标准总体上一致性程度较高,但与核心课程标准对不同物理内容主题及认知水平的要求相比较,摄政考试的考查侧重点有一定偏差。[2]柳秀峰、袁海泉等人研究了美国纽约州、中国江苏省、新加坡三种教育制度下物理测验与物理内容标准的一致性,发现美国纽约州试卷与内容标准一致性程度较高,而中国江苏省试卷、新加坡试卷分别与对应的内容标准不具备显着一致性,相比于物理内容标准,中国江苏省试卷和新加坡试卷均加大了对较高认知水平的考查力度,中国江苏省试卷比物理内容标准更加强调电学知识的考查。[9]国内学者陈娴 (2010),王焕霞 (2011,2012,2015),罗莹 (2011),蔡丽 (2012),袁令民 (2013),吕 华 荣 (2013), 张 光 燕 (2014), 杨 小 丽(2014),孙枝莲 (2015),金毅 (2016)等对物理学业评价试题与物理内容标准的一致性进行了实证调查与分析研究。研究结果大多表明了物理学业评价试题与物理内容标准具备或不具备显着的一致性,并进行了分类比较,与物理内容标准相比,试题对内容主题的侧重是否有偏差,试题对认知水平的侧重是否有偏差等。大多数研究者不仅通过大量翔实的数据对试题与课程内容标准中的要求进行比较,而且通过绘制直方图、地形图等形式直观地呈现了课程内容标准或试卷在不同内容主题和认知水平的权重,较好地体现了量化研究的特征。