在新旧文件过渡期,《体系》的运用有必要从头说起。[20]回到《体系》文本本身,“总纲”中指明“它奠定了坚实的命题理论基础,构建了科学严谨的学科命题指南”,“高考评价体系是高考命题、评价与改革的理论基础和实践指南”[21]。因此,“理论基础”“实践指南”,可以看作对《体系》的基本定位。[22]从中可以看出,《体系》与课程标准基本取向上保持一致,在局部内容上有显性相关。......
2023-08-17
如何评估?这是一个更核心,也更现实的问题。《阅读和写作评估标准》及其相关阐释文字在这个问题上给出了较为明确和具有一定操作性的指引。
(一)宏观体系:多层次,重协作
如今,在绝大多数人的意识中,评估基本等于面向学生的“考试”,而且注意力主要集中在一些高利害考试上,所有的教学和日常的评估似乎都是为这些高利害考试做准备的。不过,《阅读和写作评估标准》主张的是多层次、多元受益主体的评估系统。
首先,评估是多层次的,不同层次的评估有不同的意义。《阅读和写作评估标准》附录中的案例分析,试图通过解析具体的评价项目与各个条目间的对应关系,来展示如何理解和运用《阅读和写作评估标准》。编写者刻意选用了代表不同层次的两组评估项目。一组是国家教育质量监测层面的评估项目:美国国家教育进展评估项目NAEP和新西兰国家教育质量监测项目(New Zealand's National Educational Monitoring Project)。一组是在学校、课堂、家庭环境里都可实施的日常评估项目:美国“干预反应项目”(Response to Intervention)的两个子案例,通过有针对性地实施教学干预和较长周期的跟踪、记录,判断学生是否存在学习困难或取得了怎样的进步。
其次,评价不仅仅是检查学生。前面在谈到评价要引导探究学习时已经提及,理想的评估不仅评估学生,也要评估环境。具体而言,教育系统里的各种角色都需要在评估中进行自我反思。“学校共同体里的所有成员有着不同但相关的兴趣、角色和责任,评估是中介,让所有的人探查他们学到了什么,他们是否履行了自身在学校共同体里应当履行的职责。”
多层次评估互补,同一层次评估中的不同角色共同反思、共同努力,这才是系统、健康的评估体系。
(二)中观途径:多类型,重日常
多层次评估体系,主要说的是评估主体的多元化,评估规模和环境的多样化。如果评估体系是多层次的,评估手段、类型还是单一的,那么还不能算是健全的评估体系。对此,《阅读和写作评估标准》有一些批评性文字,譬如:“传统的、集体管理的、机械评分的测试并不能鼓励学生建设性地反思自己的读和写……”“当我们特别重视某种写作形式时,譬如对说明性写作的重视远远超过对叙事性写作的重视,那么我们就是在控制表征世界的途径的合法性。”
《阅读和写作评估标准》鼓励的是形成性的、表现性的评估。这样的理念几乎贯串全文,相关的建议出现在多条标准的阐释性文字中:“事实上,对于学生来说最具有成效、最有力的评估可能是发生于日常课堂里的形成性评估。”“教师一定要形成常规的、系统的评估,以此保证每一个学生都能从教学中取得最大的收获。”“很多的评估信息来自课堂里学生的讨论,譬如,当学生讨论一本书时,教师就了解到了学生阅读的过程。”“我们必须少依赖一次性评估,而更重视评估生动的日常课堂行为表现。”“与常模参照测试相比,虽然教师的观察、记录看起来不那么正规,但以教师专业知识为基础,这些评估实际更富有成效。”
多元、多类型评价除了以上所说的关注日常形成性、表现性评价之外,还有另一层深意,即标准8的建议,“评价应该使用多视角、多种数据来源”。因为“完美的评价和评价人员都是不存在的”。因此,在做一些重要决策时,应该使用来自不同主体,基于不同视角,在不同情况下,用多种评估工具获得的多种数据。
(三)微观任务:提供高品质的信息
《阅读和写作评估标准》从评估项目可能提供的信息的品质角度,间接地提出了评估项目设计和实施中应该注意的问题。《阅读和写作评估标准》期待的是“可以引发反思的有用的信息”。这样的评估信息至少应该具有如下几个特征。
其一,明确。能具体反映学生知识、技能、策略或态度各个方面的具体状态,能说明学生能做什么,不能做什么。具体的信息才能有助于教师、家长、学生确定学习目标和更有效地设计教学。
其二,及时。因为“学习的需要、兴趣和热情会随着时间、情境的变化而变化,如果不能及时提供评估信息,那么也许就会错过影响和促进学习的机会”。
其三,真实。一方面,任务太难或太易,不利于学生展示真实的水平,评估结果信息值得怀疑。另一方面,如果评估未充分考虑读写的复杂性(譬如文本的类型和特征、任务类型,以及评估情境等),那么评估便不能充分展示学生实际的读写能力,甚至会扭曲学生的读写能力发展方向。
(四)结果报告:全面、谨慎
作为一个完整的评估过程,最后一个环节是评估结果的报告和运用。《阅读和写作评估标准》将保护学生的学习兴趣和尊重读写复杂性等基本取向,延续到了评估结果报告环节。“当我们报告和解释评估信息时,应该包括对评估任务、文本和教学情境的描述。想想读写的复杂性,把阅读和写作表现简化为一个数字或字母让人难以接受。”
从对学生发展的潜在影响来看,评估报告更需要全面和谨慎:
“只关注排名和分等级而不关注具体表现的评估报告会让学习者忽视学习过程本身,导致学习者狭隘地认为读写能力仅是一个线性的连续体,破坏合作性学习共同体,使教师和学生都处于一种‘防卫’状态,从而抑制学习。”
“当我们试图记录学生的语言发展时,其实我们某种程度上是在参与学生的这种发展。”因为当我们对学生作出评论时,我们的评论会转化为学生对自己的认识。
“如果告诉学生关于一篇文本只有一种理解,他(或她)是对的或错的,或者只告诉他们与其他人相比他(或她)处于什么位置,那么他们很难积极地反思自己的读写实践。”
“评估并不仅仅是技术程序。评估实践形成了我们看待孩子的方式,孩子们看待自己的方式,并影响他们未来的学习方式和状态。”“学校有责任以一种能够促进而不是阻碍学生学习和家长理解的方式来汇报评价的结果。”
有关读写测评:理论与工具的文章
在新旧文件过渡期,《体系》的运用有必要从头说起。[20]回到《体系》文本本身,“总纲”中指明“它奠定了坚实的命题理论基础,构建了科学严谨的学科命题指南”,“高考评价体系是高考命题、评价与改革的理论基础和实践指南”[21]。因此,“理论基础”“实践指南”,可以看作对《体系》的基本定位。[22]从中可以看出,《体系》与课程标准基本取向上保持一致,在局部内容上有显性相关。......
2023-08-17
在差异背后,可以找到国际读写测评中的一些基本趋势、规律。(三)测试任务层面,形式丰富,内容有学术性以上测评案例中的“任务”与我们熟悉的题目,有一些较为明显的差异。案例4德国课程标准中呈现的测试样例则是一个大任务中包含一系列连贯性的子任务,子任务是完成大任务的一个环节,完成一组子任务就完成了一个大任务,按要求建构了一个档案袋。其实,尊重读写规律、需求的任务,就是“真实”的语文实践活动。......
2023-08-17
明晰了测评构念、选择了测评途径之后,就进入测评工具开发或选择阶段。阶段三开发测评工具时,需注意测评的是“潜在的”[17]构念,因此测量与评价要解决的一个关键问题是如何用外显的工具引发学生隐性的思维过程、认知反应,并据此判断其构念发展水平。此处勾勒的测评工具开发小模型突出了测评工具开发中需要特别重视的一个方面,即需要考虑工具引发的学生反应。......
2023-08-17
表5-9典型题型明示的测评目标①除上海外,各地考试说明基本沿用了考试中心考试大纲中的能力层级体系及其标识,见第二章第一节。其次,部分看似是不同任务、表述不同的题目,公开解释中所说的能力范围一致,譬如,5、6、7之间有明显的交叉。......
2023-08-17
为了取得可见的实践效果和获得可持续性发展,核心素养语境下的语文教育评价需作出系统调整。调整思路可以通过比较核心素养理念下的培养目标和当前语文教育评价的现状,明确语文教育评价各环节需要调整的内容、方向。综合而言,当前语文教育评价可关注图7-1所示的系统调整框架和思路。二是广大语文教师可在日常教学中扎实地丰富评价的途径和类型。测量与评价领域基本已经形成了定论,形成性评价和终结......
2023-08-17
不过,这些逐级发展的目标背后,其实有着这样一个潜在的假设:无论是“写话”还是“习作”,都是为日后“写文章”意义上的“写作”打基础的。同时,用于“表达和交流”的“写作”,主要指的也是“写文章”。如果我们把视野放宽,可以看到国外母语教育界对于写作的功能定位,不限于“写文章”。[5]反观我国的状况,也许在大多数学生心中,写作就是写文章,是老师布置的任务。......
2023-08-17
我国考试大纲从其内容构成来看,倾向于是一份操作性文件,直接规定“考核目标与要求”“考试范围与要求”,不像国外的测评框架那样对测评的构念、领域作出明确的界定和详细的解释。......
2023-08-17
考试大纲曾经发挥了积极的作用。不过,不可回避的是,细究考试大纲,还有一些可以进一步讨论的问题。(一)测评领域的界定有待进一步研究考试大纲给“表达”领域分出了两个考查内容板块:语言文字应用和写作。2015年,有11个省市的考试说明将其作为一个专门的板块设定测评目标。[5]当然,实际的考试命题终究还是要操作性框架的,考试大纲文件的取消,并不代表着考试大纲中的概念框架、思维方式会同时消失。......
2023-08-17
相关推荐