在差异背后,可以找到国际读写测评中的一些基本趋势、规律。(三)测试任务层面,形式丰富,内容有学术性以上测评案例中的“任务”与我们熟悉的题目,有一些较为明显的差异。案例4德国课程标准中呈现的测试样例则是一个大任务中包含一系列连贯性的子任务,子任务是完成大任务的一个环节,完成一组子任务就完成了一个大任务,按要求建构了一个档案袋。其实,尊重读写规律、需求的任务,就是“真实”的语文实践活动。......
2023-08-17
明晰了测评构念、选择了测评途径之后,就进入测评工具开发或选择阶段。马达比·查特吉(Chatterji,M.)在《设计和使用教育评估工具》一书中专门指出,20世纪90年代开始,教育评估实践层面涌现出各种评估工具,“表现性评估”“选择性评估”“真实性评估”十分受欢迎,不过,评估重要的“过程”并不会因为评估方式的不同而不同或发生改变,效度、信度和一致性等基本原则依然适用于所有的评估设计情境。当然评估设计过程本身可能会有逐步的发展或一些小的更新。马达比·查特吉所说的“评估设计过程模型”主要包括四个阶段,如图1-2[14]所示:
图1-2 “评估设计过程模型”流程图
遵循这样的过程模型主要目的是保证测试的效度,以测到真正想测的各种心理属性。以上模型也适用于评估工具的选择过程。因此,该模型全称为“评估设计/选择和验证过程模型”。
该模型阶段一,主要考虑三个要素:构念、对象和测评目的,由此确定可观察的领域指标,即本节第一部分所述内容。
阶段二和阶段三指向的是需要开发或选择出的两个“产品”,一为评估细则,二为真实的评估工具。评估细则,可能表现为具体的“测评框架”文件[15],也可能表现为我们熟悉的测评细目表或测评蓝图。关于测评细目表或测评蓝图,需注意其基本样式和构成要素是发展变化的,譬如从双向细目表发展为多维细目表或“测验设计框架”[16],变化目的是让测评项目规划阶段考虑更加充分,让测评工具更加符合测评目的。就语文学科而言,在测评细目表或测评蓝图里一般应体现:测评领域,测评领域间的关系,特定领域的测评目标;试题类型分布,试题难度分布;语料的来源和情境类型等。
阶段三开发测评工具时,需注意测评的是“潜在的”[17]构念,因此测量与评价要解决的一个关键问题是如何用外显的工具引发学生隐性的思维过程、认知反应,并据此判断其构念发展水平。工具、反应、构念之间的关系可以用图1-3表示。此处勾勒的测评工具开发小模型突出了测评工具开发中需要特别重视的一个方面,即需要考虑工具引发的学生反应。试题开发中,一方面要考虑呼应和落实构念,试题引发的学生反应需尽量体现构念的发展水平;另一方面需要考虑这些反应的可观察性,是否方便和如何区分它们的发展水平,即如何评分。如果评分环节不能落实命题理念,不能呼应构念假设,那么试题的检测功能还是会打折扣,不能保证测试效度。
图1-3 工具、反应、构念关系图
阶段四与阶段一关联,验证效度。验证办法有两种,一是通过理论、逻辑的分析来判断试题的质量;二是通过试测数据的分析来判断试题质量。目前我国的绝大多数测试是没有正式的试测阶段的,这就需要命题人员在命题结束后自觉地进行试题反思。当然,最好还是尽量通过各种办法,获得来自学生的反馈信息,以修订和完善测评工具。
“评估设计/选择和验证过程模型”的四个阶段构成一个整体,其中阶段二和阶段三可能会有反复修正过程。
有关读写测评:理论与工具的文章
在差异背后,可以找到国际读写测评中的一些基本趋势、规律。(三)测试任务层面,形式丰富,内容有学术性以上测评案例中的“任务”与我们熟悉的题目,有一些较为明显的差异。案例4德国课程标准中呈现的测试样例则是一个大任务中包含一系列连贯性的子任务,子任务是完成大任务的一个环节,完成一组子任务就完成了一个大任务,按要求建构了一个档案袋。其实,尊重读写规律、需求的任务,就是“真实”的语文实践活动。......
2023-08-17
测量与评价,两者各有专门的话语系统但又密切相关。形成性评价关注学习过程,有利于及时揭示问题、及时反馈、及时改进教与学活动。要坚持定性评价和定量评价相结合,全面反映学生语文学习的状态及水平。将语文测评途径和语文测评构念联合起来思考,可以作出如下假设。......
2023-08-17
为了适应我国当前需求,同时兼顾国外测评的多样性,以下择取国外部分高利害考试和日常总结性测评案例加以剖析。11年级这一套试卷的三个模块,共呈现了6篇阅读文本,题目总计22个,其中选择题19个、基于阅读的写作题3个。其中的“语言与文学研究”领域开设三门课程,每门课程又分基础课程和高级课程供学生选修,其中的《语言A:文学》课程,相当于是将我们的整本书阅读中的文学作品阅读课程化了。......
2023-08-17
考试大纲曾经发挥了积极的作用。不过,不可回避的是,细究考试大纲,还有一些可以进一步讨论的问题。(一)测评领域的界定有待进一步研究考试大纲给“表达”领域分出了两个考查内容板块:语言文字应用和写作。2015年,有11个省市的考试说明将其作为一个专门的板块设定测评目标。[5]当然,实际的考试命题终究还是要操作性框架的,考试大纲文件的取消,并不代表着考试大纲中的概念框架、思维方式会同时消失。......
2023-08-17
超越任务选做型作文题,对于文体的不同规定值得专门探讨。其一,“文体不限”是文体开放的基本形式。文体不限是提高作文试题开放度的基本手段之一,学生有着广阔的文体选择空间。加了限制条件的“文体不限”,引导的是更加自觉的选择,以及对文体特征和功能更加到位的理解。其三,“规定文体”也能成为一种具有深远意义的开放。......
2023-08-17
2019年全国Ⅱ卷和北京卷设置了选做题,并且旗帜鲜明地打上了“任选”两字。(一)任选形式差异两个选做题,命题思路还是有差别的。[24]任选题形式差异背后应该有本质的考查意图和评价焦点上的差异。另一方面,要明了并尽量规避任选试题的风险。同时,也要防止长期固化一种任选类型可能给教学和学生发展带来的负面影响。......
2023-08-17
《阅读和写作评估标准》的一大特色是:在学生终身学习、整个教育系统的发展,以及整个社会所有成员读写能力发展的背景下谈读写评估问题。这份《阅读和写作评估标准》的态度十分坚决:“如果一项评估实践无法带来促进教和学的效果,那么其是无效的。”《阅读和写作评估标准》重视探究,是基于这样一个基本认识:如今,学校教育的目的已经不单单是传递知识,而是发展学生独立学习、合作学习和问题解决的能力。......
2023-08-17
我国考试大纲从其内容构成来看,倾向于是一份操作性文件,直接规定“考核目标与要求”“考试范围与要求”,不像国外的测评框架那样对测评的构念、领域作出明确的界定和详细的解释。......
2023-08-17
相关推荐