国际阅读测评框架或说明文件的内容与特征

2023-08-17 理论教育版权反馈

【摘要】：综观PISA、NAEP和PIRLS阅读测评的相关文件，发现三者在内容构成、文件编写风格等方面具有不少相似之处。每一次测评都会有厚厚的“测评框架或说明”文件出版，每一次的“测评框架或说明”都会在上一轮测评结果的基础上再结合最新的研究成果进行必要的更新。[31]综观PISA、NAEP、PIRLS三个阅读测评项目的“测评框架或说明”，达到了这一标准。所有的读者阅读测评框架的过程同时也是一个学习的过程。

综观PISA、NAEP和PIRLS阅读测评的相关文件，发现三者在内容构成、文件编写风格等方面具有不少相似之处。

（一）科学的内容体系

无论是国外的阅读“测评框架或说明”，还是我国的“考试大纲”和“考试说明”，既面向考生、家长、研究者等社会人士，也直接指导命题者和相关技术人员。怎样的内容才能让各类人员都清楚明白且有用？

以下简单呈示三份文件的目录，从中可以大致感受国际测评项目测评框架的基本内容构成。

表1-1　三份国际测评项目测评框架目录

pagenumber_ebook=28,pagenumber_book=16

续表

pagenumber_ebook=29,pagenumber_book=17

对照之下不难发现，除了各自关注的专门项目外，《PISA 2009阅读测评框架》《NAEP 2011阅读测评框架》《PIRLS 2011测评框架》文件有着几乎一样的关键要素和内容体系：

·“阅读素养”的内涵发展

·阅读素养测评的理念框架

pagenumber_ebook=29,pagenumber_book=17 阅读的目的

pagenumber_ebook=29,pagenumber_book=17 阅读的情境

pagenumber_ebook=29,pagenumber_book=17 文本类型

pagenumber_ebook=29,pagenumber_book=17 认知目标（或过程）

·基于理念框架的测验设计

pagenumber_ebook=29,pagenumber_book=17 阅读目的、认知目标、文本类型间的内在组合

pagenumber_ebook=29,pagenumber_book=17 题型及各类型题目的编写

pagenumber_ebook=29,pagenumber_book=17 评分方法、评分量表

·测评结果报告的目的、依据、维度等

·文献与样章

在上述体系展开过程中又都具备如下两个特征。

其一，兼顾理念框架和技术程序。三者都用较长的篇幅介绍了阅读素养概念和以阅读的目的、情境、文本类型、认知目标（或过程）为核心要素的阅读素养测评理念框架。这些内容是测评背后的理据，给所有的命题者以一个非常清晰和一致的起点，为保证考试的效度打下了扎实的基础。同时大众也能从中明晰测评的目的、测评的能力点、可能出现的材料类型等。前期理念框架的完备，避免了后续试卷设计中可能的偏差、试卷分析中可能的争议。而关于测评设计、实施、评分和结果报告等技术的介绍，则保证了测评项目的规范性和科学性，也给了大众一个交代。

其二，注重在发展中完善。每个测评项目都有一定的实行周期，譬如PISA是三年一次，PIRLS是五年一次，NAEP是两年一次。每一次测评都会有厚厚的“测评框架或说明”文件出版，每一次的“测评框架或说明”都会在上一轮测评结果的基础上再结合最新的研究成果进行必要的更新。譬如，PISA 2009特别重视电子文本的阅读和学生的阅读参与度，由此《PISA 2009阅读测评框架》对“阅读素养”的概念进行了修订，调整测评设计框架，并且将电子文本阅读纳入测试内容。^[29]《NAEP 2011阅读测评框架》则专门对1992—2007年间所用的阅读测评框架和2009—2011年间所用的阅读测评框架进行了对比，突出了后者新的关注点，即在文本语境中理解词汇的能力。^[30]这样的更新和完善，其意义不仅仅在于准确定位每次测评的内容范围和测评目标，也反过来推动着对“阅读素养”的认识越来越深入和清晰。

（二）清晰的表达方式

1999年版的《教育与心理测试标准》曾提及：“测试文件应完整、准确并言辞清楚，这样读者将很容易理解其内容。”^[31]综观PISA、NAEP、PIRLS三个阅读测评项目的“测评框架或说明”，达到了这一标准。上述内容体系体现了测试文件的“完整”性，“准确并言辞清楚”则体现在这几个测评项目对具体内容的解释说明上，具体表现为如下三个特征。

1.核心概念条分缕析：详细解释“阅读素养”内涵的发展

“用非常明确的语言清晰地表达在观察或测量什么，是可靠的测评设计和说明面对的第一个难题。”^[32]PISA、NAEP、PIRLS“测评框架或说明”都对“阅读素养”做了非常详尽的阐释。PISA、NAEP更是用了先综述后解析的方式。

如《PISA 2009阅读测评框架》先将阅读素养界定为“阅读素养是个体为了取得个人目标、发展个体知识和潜能，以及参与社会活动而理解、运用、反思和投入阅读文本的能力”。随后，用较长的篇幅解析这个界定的各个元件：“阅读”“理解、运用、反思”“投入”（主要指阅读的动机和情感、行为方面的特征）、“文本”“为了取得个人目标、发展个体知识和潜能，以及参与社会活动”。^[33]

在上述概念中，有些概念看似不值得解释，如“文本”或“书面文本”，但一旦深究会发现其实在每一个细节上都有潜在的认识分歧，因此值得和需要解释。譬如“书面文本”，PISA用了一个专门的段落来解释。其主要意思是：书面文本（written texts）包括所有手写、印刷和电子三种呈现形式的文本；包括配有题注等文字的图、表，但不包括没有文字信息的图片；手写文本和印刷文本在阅读策略和过程层面基本没有什么质的区别，电子文本阅读则在许多方面异于手写、印刷文本的阅读。^[34]这些解释看似琐碎，却十分必要，既有助于人们了解为何最后测评中会涉及纸质和电子两类文本，也帮助人们从阅读对象角度加深了对“阅读”的理解。

2.测评框架逐层解说：明确框架中基本概念的所指和分类

前文已述及，本文所指的三个国际阅读测评项目所依赖的理念框架基本是由阅读的目的、情境、文本类型、认知目标或过程这几个维度构成的。每一个测评项目都不吝笔墨逐层厘清、详尽阐发每一个维度的内涵、细类。其间的解释策略或者说是思维方式值得学习。

PISA 2009对“文本”的解释是按照如表1-2所示的框架展开的，对每一个细类都做了详细的解释^[35]。以对文本类型的阐释为例，《PISA 2009阅读测评框架》采取了如表1-3所示的解释逻辑。

表1-2　《PISA 2009阅读测评框架》中的“文本类型”框架

pagenumber_ebook=32,pagenumber_book=20

以文本类型框架为纲（如表1-2所示），再加上“学术界定—通俗解释—子类别说明—示例”的解释逻辑（如表1-3所示），《PISA 2009阅读测评框架》展示给读者的是研发者对于文本类型的细致入微的认识和贴近读者认识逻辑的说明方式。这样的解释框架和解释逻辑，对于普通大众而言，清晰易懂；对于命题者而言，则相当于获得了明确的标准，即使是不同国度的命题者分别命题，也基本不会在文体的选择上出现偏差、产生分歧。条分缕析、落到实处的解释风格贯串了整个测评框架文本。所有的读者阅读测评框架的过程同时也是一个学习的过程。

表1-3　《PISA 2009阅读测评框架》对每一类文本的解释逻辑

pagenumber_ebook=33,pagenumber_book=21

3.抽象概念的“过渡性提示”：指引框架概念向试题开发过渡

阅读测评框架中文本类型、阅读情境及认知过程等维度的界定、解释、分类等，对于正式的测评工具开发而言是理论、观念和约定。如何将它们真正落实到测评工具设计中去，测评设计人员如何保证测评工具符合理念框架，似乎是一个隐性的思维运作过程。为了更好地指导测评工具开发过程，更好地落实测评理念框架，国外阅读“测评框架或说明”文本中提供了许多具体的提示。

譬如，《PIRLS 2011测评框架》认为阅读理解过程由四个阶段构成：聚焦和检索文本中直接陈述的信息；直接推论；解释和整合观点、信息；检视并评价文本语言、内容等特征。在详细解释这四个阶段的基础上又明确指出：整个测试中，所有的阅读理解题都围绕着这四个阅读理解过程来设计，每一个题目都指向一种认知过程。^[36]于是，接下去直接关乎操作的重要问题便是，如何保证题目和认知类型之间的对应性、匹配性？《PIRLS 2011测评框架》在描述认知过程分类的同时，又专门列举了与特定类型认知过程匹配的出题角度或出题点。整理之后可得简表1-4^[37]：

表1-4　《PIRLS 2011测评框架》阅读认知过程与测试任务类型

pagenumber_ebook=34,pagenumber_book=22

“我国普通高考阅读能力层级还没有明晰、独立的能力层级指标。‘理解’‘分析综合’和‘探究’并不是阅读能力特有的指标。”^[38]在国际阅读测评项目中，我们不仅能看到如上表左列中所呈现的专属于阅读的认知过程（也是测评的能力目标），而且能看到如上表右列所示的介于能力目标和具体测评任务之间的“任务类型”。其作为能力目标和具体测试题目之间的过渡性提示，不仅能帮助读者了解抽象的能力目标之所指；也能给出题者一些思路和方向，保证所出题目尽量指向相应的认知活动。并且，细细推敲和综合看这些过渡性提示，指向的都是真实、自然的阅读过程中可能和应该有的思维活动细节。因此，即使清晰的条目可能引起所谓的“猜题”，其结果也是积极的。

4.隐性过程的显性化：指导测试题目开发过程

除了增加“过渡性的提示”以指明测评框架与具体测评工具之间的关联外，国际“阅读测评框架或说明”还会尽可能通过操作程序、概念图等各种方式把测评工具开发过程中隐性的思维操作过程显性化。譬如，阅读测评试卷中最基本的元素是文本和测试题目，从文本的选择、确定到具体题目的产生，其间有着很大的思考和操作空间：如何准确判断文本的价值？特定的文本有哪些出题点，重点是什么？回答这些问题是凭感觉、经验，还是基于一定的操作标准，在一定程度上影响着试卷的信度和效度。在《NAEP 2009阅读测评说明》中，可以看到关于文本的具体分析框架和分析步骤，其中会用到一个专门的工具“文本解析地图”（map），用一个分析框架来剖析特定的文本^[39]。

（三）可靠的理论依据

《PIRLS 2011测评框架》列举的参考文献有18页。在《PIRLS 2011测评框架》开篇“PIRLS测评项目回顾”中，编者们突出显示了这样一段说明性文字：“在整个框架说明中，引用了为框架设计提供学理依据的各个方面的资料。这些资料还只是所有文献和研究资料中的一部分。来自各个测评参与国的无数相关研究资料都为PIRLS测评项目设计提供了信息和理论依据。”^[40]PISA和NAEP也都在“测评框架或说明”文件中有意识地做了类似的说明。

这并不仅仅是一种形式化的声明。事实上，PISA、PIRLS和NAEP阅读测评项目，无论是关于测评框架的整体构建，还是框架中关于阅读素养、认知过程、文本类型等概念的界定和各要素的分类，都切切实实地基于对既有研究的梳理、选择。

对既有研究的尊重，在行文中随处可见。如，《PISA 2009阅读测评框架》中关于题型的选择及其比例的确定也有着可靠的研究证据。关于“题型”，基于既有研究结果，《PISA 2009阅读测评框架》有着如下几个层次的说明。^[41]

第一层次，指出在大规模测试中，多项选择题和简短的建构性反应题目^[42]是最适用的题型。

第二层次，列举基于PISA测试数据进行的关于题型的若干研究结果。其一，题型对不同的学生有着不同的意义。譬如，不同的题型对不同阅读精熟度的阅读者有着不同的测试效果；不同的题型对不同国家的学生有着不同的测试效果；不同的题型对男生和女生有着不同的测试效果。为此，拉方丹和蒙瑟尔（Lafontaine＆Monseur）建议多项选择题和建构性反应题目的比例要尽量相当。其二，开放性建构反应题目对于测评学生的反思和评价能力有着重要的意义，该类题目主要用于评估学生思考的质量而不是追求完美的答案本身。

第三层次，小结：为了保证不同国家学生之间和同一国家内部男女生之间的公平性，为了保证试题能测评到阅读过程中的各项能力，并能有效地测评反思和评价能力，PISA阅读测评将继续使用多项选择题和开放性建构反应题目。

第四层次，特别指明：出于经济的考虑和为了充分利用电子媒介提供的自动编码能力空间，电子文本阅读测试中客观性题目的比例将大一些。

第五层次，制表分别列出在纸质和电子文本阅读试题中，不同认知维度的主观题和客观题的比例，如表1-5和表1-6所示。

表1-5　PISA 2009纸质文本阅读中主观题和客观题的大致分布和比例

pagenumber_ebook=37,pagenumber_book=25

表1-6　PISA 2009电子文本阅读中主观题和客观题的大致分布和比例

pagenumber_ebook=37,pagenumber_book=25

一个测评项目的研发过程是建立在合理的理据之上的集体智慧的结晶，如《NAEP 2011阅读测评框架》中所说：“阅读测评框架源于无数致力于阅读和阅读教育研究、实践的个体和相关组织的共同努力，涉及人员包括研究者、政策制定者、教育者和其他公众。而所有人合作的基础是建立在科学研究基础之上的，关于‘阅读’的一致的理解。”^[43]

国际阅读测评框架或说明文件的内容与特征

相关推荐