不过,这些逐级发展的目标背后,其实有着这样一个潜在的假设:无论是“写话”还是“习作”,都是为日后“写文章”意义上的“写作”打基础的。同时,用于“表达和交流”的“写作”,主要指的也是“写文章”。如果我们把视野放宽,可以看到国外母语教育界对于写作的功能定位,不限于“写文章”。[5]反观我国的状况,也许在大多数学生心中,写作就是写文章,是老师布置的任务。......
2023-08-17
前文在纵览各省市历年语文高考卷的基础上,呈现了七类较为稳定的典型题目。分类依据主要是相对稳定的题干表述。更进一步的研究,需要追溯测评领域的相关规则,如关于选择题的一般类型和功能定位等。
(一)选择题的一般类型
选择题的类型和意义需要放在整体题型图谱中来看。
PISA测评框架,在说明其使用的题目类型时有这样一段简短的介绍:“主观题,即需要专家评分的题型,包括开放性建构反应题目(open constructed response)和简短的建构反应题目(short constructed response);客观题,即不需要专家评分的试题,包括多项选择题(multiple choice)、复杂的多项选择题(complex multiple choice)和封闭的建构性反应题目(closed constructed response items)。”[37]其中主观题、客观题是我们所熟悉的概念,但这段说明中还涉及我们比较陌生的概念“建构性反应题目”。
与“建构性反应题目”相对的是“选择性反应题目”,这两者其实是国外测量与评价话语体系中常见的一对概念。选择性反应,是学生从教师提供的答案中选出正确的答案;建构性反应与选择性反应相反,学生必须独立解决问题。[38]将这两类题目与我们熟悉的具体题目类型关联起来看,填空题、简答题、作文题属于建构性反应题目;选择性反应题目,并不仅仅单指我们日常所说的选择题,还包括是非题(二元选择)、匹配题。
PISA及其他国际测评项目中所说的“多项选择题”“复杂的多项选择题”,与我们的术语有些出入。前者其实就是我们平常所说的单项选择题。詹姆斯·波帕姆在《教师课堂教学评价指南》中明确指出:“多项选择题都要求学生选择一个符合题干的正确选项,或者一个最佳选项。”[39]由此推断,国外“多项选择题”概念中的“多项”指的是备选答案,即选项有多个,而我国所说的“多项选择题”的“多项”指的是最终从备选选项中选择的正确答案可能不止一个。我国所说的“多项选择题”大致对应PISA测评框架中所说的“复杂的多项选择题”。
无论要求学生选出一个答案还是几个答案,换个角度,从答案属性来看,选择题又可以分为两类,正确答案形式和最佳答案形式。后者说的是“其中,所有选项都部分正确,但有一个明显优于其他。这种类型用于考查较为复杂的成就,比如要求学生选择某个行为的最好理由、做某事的最好方法或某个原理的最佳应用。因此,是用正确答案形式还是用最佳答案形式,取决于要考查的学习成果”[40]。
各种题目类型可简单梳理如下:
表5-10 题目类型[41]
从国际题目分类框架可以看出,题目分类的立足点不是题目本身的“模样”差异,而是学生的行为反应差异。
选择题有诸多限制性,但它是题型图谱中不可或缺的一个类型。其存在的价值也许恰恰就在于其“限制性”:在限定的情境中,使“书写能力的影响得以控制”[42],“发现学生的薄弱环节”[43]。
(二)选择题的一般功能
选择题引发学生作出选择性反应之后,归根结底是要根据他们选择的答案判断其学习结果表现水平。那么选择题可以考查哪些预期学习成果和表现呢?
对此可以从两个层面思考:一是“一般性目标”,譬如,我们所熟悉的布卢姆教育目标分类学阐述的认知目标层级和知识类型;二是学科领域具体的学习成果和表现,其可能有“一般性目标”在学科领域的具体化,也可能有学科领域特殊的学习成果和表现。
关于第一个层次,我们可以看到不少积极的介绍:
多项选择题在美国和其他国家已经主导了成就测验领域长达几十年,它可以用来测量学生对知识的掌握情况以及更高水平的思维能力。[44]
它们可用于考查从简单到复杂的多种学习成果,也可以产生质量最高的题目。[45]
它适合于测量从机械记忆水平到最复杂水平间各水平的教学目标,当然,综合能力除外;特别适合于项目分析,发现学生的薄弱环节。[46]
测评“最佳”答案的题目,可进行比较深入的区分和辨析,能非常有效地测量理解能力。[47]
麦克米兰(Mc Millan,J.H.)还曾尝试把认知目标层级和各种题型的适用程度进行比对,他认为选择性题目不仅适用于测试知识的记忆,如果题目出得巧妙还能非常有效地测评学生的理解能力(包括深度理解)和推理能力。[48]
上述表达给我们一些信心,答案标准化的选择题,有其测试意义和价值,在实际运用选择题时,应让它恰如其分地发挥最大价值。至于想通过选择题测试怎样的能力类型和水平,需要根据语文测量构念研究结果作出恰当的选择。
有关读写测评:理论与工具的文章
不过,这些逐级发展的目标背后,其实有着这样一个潜在的假设:无论是“写话”还是“习作”,都是为日后“写文章”意义上的“写作”打基础的。同时,用于“表达和交流”的“写作”,主要指的也是“写文章”。如果我们把视野放宽,可以看到国外母语教育界对于写作的功能定位,不限于“写文章”。[5]反观我国的状况,也许在大多数学生心中,写作就是写文章,是老师布置的任务。......
2023-08-17
在差异背后,可以找到国际读写测评中的一些基本趋势、规律。(三)测试任务层面,形式丰富,内容有学术性以上测评案例中的“任务”与我们熟悉的题目,有一些较为明显的差异。案例4德国课程标准中呈现的测试样例则是一个大任务中包含一系列连贯性的子任务,子任务是完成大任务的一个环节,完成一组子任务就完成了一个大任务,按要求建构了一个档案袋。其实,尊重读写规律、需求的任务,就是“真实”的语文实践活动。......
2023-08-17
明晰了测评构念、选择了测评途径之后,就进入测评工具开发或选择阶段。阶段三开发测评工具时,需注意测评的是“潜在的”[17]构念,因此测量与评价要解决的一个关键问题是如何用外显的工具引发学生隐性的思维过程、认知反应,并据此判断其构念发展水平。此处勾勒的测评工具开发小模型突出了测评工具开发中需要特别重视的一个方面,即需要考虑工具引发的学生反应。......
2023-08-17
表5-9典型题型明示的测评目标①除上海外,各地考试说明基本沿用了考试中心考试大纲中的能力层级体系及其标识,见第二章第一节。其次,部分看似是不同任务、表述不同的题目,公开解释中所说的能力范围一致,譬如,5、6、7之间有明显的交叉。......
2023-08-17
为了取得可见的实践效果和获得可持续性发展,核心素养语境下的语文教育评价需作出系统调整。调整思路可以通过比较核心素养理念下的培养目标和当前语文教育评价的现状,明确语文教育评价各环节需要调整的内容、方向。综合而言,当前语文教育评价可关注图7-1所示的系统调整框架和思路。二是广大语文教师可在日常教学中扎实地丰富评价的途径和类型。测量与评价领域基本已经形成了定论,形成性评价和终结......
2023-08-17
类似地,情境化试题可以做更加细致的结构分析。该试题的目的是检测学生对句子的理解和运用能力。以上三个试题可以代表情境化试题的三种结构类型:A.背景+任务+(目的);B.背景+问题+任务+(目的);C.背景+(问题)+任务+(目的)。也就是说,情境化试题是由如下四个基本要素选择性组合而成的:1.背景要素,主要表现为人物、场景、事件或引导性材料等。......
2023-08-17
考试大纲曾经发挥了积极的作用。不过,不可回避的是,细究考试大纲,还有一些可以进一步讨论的问题。(一)测评领域的界定有待进一步研究考试大纲给“表达”领域分出了两个考查内容板块:语言文字应用和写作。2015年,有11个省市的考试说明将其作为一个专门的板块设定测评目标。[5]当然,实际的考试命题终究还是要操作性框架的,考试大纲文件的取消,并不代表着考试大纲中的概念框架、思维方式会同时消失。......
2023-08-17
譬如《PIRLS 2016测评框架》,对其认知目标做了两个层次的阐释。其一,回归真实的阅读过程,在阅读情境中描述抽象的认知目标所对应的、可能的阅读行为、过程、技巧等。直接推论是非常基础的。另外,有些直接推论也许要求读者将文本局部意思和文本总体意思关联起来。其二,举例说明各个认知目标可能涉及的阅读任务。在每一个国际阅读测评项目中,关于认知目标的详细阐述都勾勒出一个相对完整、立体的“阅读理解过程”。......
2023-08-17
相关推荐