首页 理论教育读写测评:选择题类型和功能

读写测评:选择题类型和功能

【摘要】:更进一步的研究,需要追溯测评领域的相关规则,如关于选择题的一般类型和功能定位等。与“建构性反应题目”相对的是“选择性反应题目”,这两者其实是国外测量与评价话语体系中常见的一对概念。选择题有诸多限制性,但它是题型图谱中不可或缺的一个类型。至于想通过选择题测试怎样的能力类型和水平,需要根据语文测量构念研究结果作出恰当的选择。

前文在纵览各省市历年语文高考卷的基础上,呈现了七类较为稳定的典型题目。分类依据主要是相对稳定的题干表述。更进一步的研究,需要追溯测评领域的相关规则,如关于选择题的一般类型和功能定位等。

(一)选择题的一般类型

选择题的类型和意义需要放在整体题型图谱中来看。

PISA测评框架,在说明其使用的题目类型时有这样一段简短的介绍:“主观题,即需要专家评分的题型,包括开放性建构反应题目(open constructed response)和简短的建构反应题目(short constructed response);客观题,即不需要专家评分的试题,包括多项选择题(multiple choice)、复杂的多项选择题(complex multiple choice)和封闭的建构性反应题目(closed constructed response items)。”[37]其中主观题、客观题是我们所熟悉的概念,但这段说明中还涉及我们比较陌生的概念“建构性反应题目”。

与“建构性反应题目”相对的是“选择性反应题目”,这两者其实是国外测量与评价话语体系中常见的一对概念。选择性反应,是学生从教师提供的答案中选出正确的答案;建构性反应与选择性反应相反,学生必须独立解决问题。[38]将这两类题目与我们熟悉的具体题目类型关联起来看,填空题、简答题、作文题属于建构性反应题目;选择性反应题目,并不仅仅单指我们日常所说的选择题,还包括是非题(二元选择)、匹配题。

PISA及其他国际测评项目中所说的“多项选择题”“复杂的多项选择题”,与我们的术语有些出入。前者其实就是我们平常所说的单项选择题。詹姆斯·波帕姆在《教师课堂教学评价指南》中明确指出:“多项选择题都要求学生选择一个符合题干的正确选项,或者一个最佳选项。”[39]由此推断,国外“多项选择题”概念中的“多项”指的是备选答案,即选项有多个,而我国所说的“多项选择题”的“多项”指的是最终从备选选项中选择的正确答案可能不止一个。我国所说的“多项选择题”大致对应PISA测评框架中所说的“复杂的多项选择题”。

无论要求学生选出一个答案还是几个答案,换个角度,从答案属性来看,选择题又可以分为两类,正确答案形式和最佳答案形式。后者说的是“其中,所有选项都部分正确,但有一个明显优于其他。这种类型用于考查较为复杂的成就,比如要求学生选择某个行为的最好理由、做某事的最好方法或某个原理的最佳应用。因此,是用正确答案形式还是用最佳答案形式,取决于要考查的学习成果”[40]

各种题目类型可简单梳理如下:

表5-10 题目类型[41]

从国际题目分类框架可以看出,题目分类的立足点不是题目本身的“模样”差异,而是学生的行为反应差异。

选择题有诸多限制性,但它是题型图谱中不可或缺的一个类型。其存在的价值也许恰恰就在于其“限制性”:在限定的情境中,使“书写能力的影响得以控制”[42],“发现学生的薄弱环节”[43]

(二)选择题的一般功能

选择题引发学生作出选择性反应之后,归根结底是要根据他们选择的答案判断其学习结果表现水平。那么选择题可以考查哪些预期学习成果和表现呢?

对此可以从两个层面思考:一是“一般性目标”,譬如,我们所熟悉的布卢姆教育目标分类学阐述的认知目标层级和知识类型;二是学科领域具体的学习成果和表现,其可能有“一般性目标”在学科领域的具体化,也可能有学科领域特殊的学习成果和表现。

关于第一个层次,我们可以看到不少积极的介绍:

多项选择题在美国和其他国家已经主导了成就测验领域长达几十年,它可以用来测量学生对知识的掌握情况以及更高水平的思维能力。[44]

它们可用于考查从简单到复杂的多种学习成果,也可以产生质量最高的题目。[45]

它适合于测量从机械记忆水平到最复杂水平间各水平的教学目标,当然,综合能力除外;特别适合于项目分析,发现学生的薄弱环节。[46]

测评“最佳”答案的题目,可进行比较深入的区分和辨析,能非常有效地测量理解能力。[47]

麦克米兰(Mc Millan,J.H.)还曾尝试把认知目标层级和各种题型的适用程度进行比对,他认为选择性题目不仅适用于测试知识的记忆,如果题目出得巧妙还能非常有效地测评学生的理解能力(包括深度理解)和推理能力。[48]

上述表达给我们一些信心,答案标准化的选择题,有其测试意义和价值,在实际运用选择题时,应让它恰如其分地发挥最大价值。至于想通过选择题测试怎样的能力类型和水平,需要根据语文测量构念研究结果作出恰当的选择。