首页 理论教育基于LOG数据的PISA问题解决能力研究成果

基于LOG数据的PISA问题解决能力研究成果

【摘要】:有人说,比较教育“有着悠长的过去,却只有简短的历史”。比较教育也逐渐在欧美学术界赢得了一席之地,正式成为教育学科中的一个独立分支。历史学方法、因素分析方法成为此阶段引领比较教育发展的主要方法。但在当时,要获取各国的教育统计数据也非易事。1962年,国际教育成就评价协会率先尝试发布了《12个国家13岁儿童的教育成就:一项国际研究的结果》,开创了通过国际测试比较各国教育成就的先河。

有人说,比较教育“有着悠长的过去,却只有简短的历史”。

这是因为,从法国学者兼政治家朱利安(Marc-Antoine Julian,1775-1848)1817年发表《比较教育的研究计划与初步意见》、首次提出“比较教育”的学科概念至今刚过200多年,而人类又偏偏有着强烈的好奇心,并且总是希望在他人别国的教育经验中发现最佳教育制度与方法。至少从公元前500多年前起,人们就通过各种形式记录下异域他乡的教育现象,并将这些记载保存和流传下来。孔子曾率众弟子周游列国、游学交流,传授“齐家、治国、平天下”之道,古希腊则有学者兼军事家色诺芬(Xenophon,公元前430-前355)认真比较斯巴达雅典教育的异同,又在其《波斯王塞勒斯传》中赞颂波斯的公共教育与训练。随后千百年,古罗马有西塞罗(Cicero,公元前106-前43)描述古希腊与古罗马的教育异同,中国有唐玄奘(602-664)“西天取经”,写下《大唐西域记》,记载异域人文宗教,叙述印度的教育制度、课程与教师。还有意大利旅行家马可·波罗,游历东方、供职元朝,以《马可·波罗游记》记载下丰富的趣闻轶事,向西方介绍灿烂的东方教育文化

然而,闲闻游记和传记轶事难以满足欧洲新兴的资本主义国家建设近现代教育制度的需要。朱利安的奠基之作虽然提出了众多研究、交流和改革建议,也不能满足政治家和教育家们提出立竿见影、迅速建立新体制的要求。于是,各国交流比较、学习借鉴的任务就得靠各国教育行政官员的出国考察和调查报告来完成。法国人库森(Victor Cousin,1792-1867)的《德意志各邦,特别是普鲁士公共教育状况的报告》和美国麻省首任教育厅长贺拉斯·曼(Horace Mann,1796-1859)的《第七年年报》就成了19世纪最引人注目的比较教育文献

从20世纪初至第二次世界大战结束,越发便捷的交通运输逐步将世界各国连接在一起,国家间的争议协商、学者间的交流合作、商贾间的贸易交往也愈加频繁。比较教育也逐渐在欧美学术界赢得了一席之地,正式成为教育学科中的一个独立分支。以康德尔(Issac L.Kandel,1881-1965)、施奈德(Friedrich Schneider,1881-1974)和汉斯(Nicholas Hans,1888-1969)等为代表的比较教育学者们并不满足对别国教育制度的描述,他们试图用各种方法去分析别国教育发展的来龙去脉,诠释各国教育制度的存在原因,从而为各自国家教育发展提供借鉴。历史学方法、因素分析方法成为此阶段引领比较教育发展的主要方法。

二战以后,人类教育理念的更新、各国教育制度的重建和社会科学的蓬勃发展,一方面为比较教育学者提供了前所未有的广阔天地,另一方面又推动了比较教育研究方法的科学演进。贝雷迪(George Bereday,1920-1983)提出描述、解释、并置和比较的四阶段比较教育研究工作模式;一些学者倡导对教育开展社会学、人种志和文化背景研究;诺亚(H.J.Noah)和埃克斯坦(M.A.Eckstin)则提出,应采用现代科学研究的一般程序来研究比较各国的教育问题,数据收集和统计分析成为比较教育研究迈向科学的关键

但在当时,要获取各国的教育统计数据也非易事。一方面,许多发展中国家和一些发达国家的教育统计能力还普遍不足,难以对各国教育状况做出及时准确的数据统计;另一方面,一些国家也鉴于教育数据的敏感性,不愿意将数据拿出来让各国研究分享。为解决这一问题,国际教育局(IBE)和联合国教科文组织从20世纪50年代起开始组织出版《世界教育调查》(1955-1971,共五卷)等国际教育统计资料,直到1992年才开始出版连续性的《世界教育报告》。1999年联合国教科文组织终于成立了统计研究所(UNESCO Institute of Statistics,UIS),由它负责建议和改进各国教育统计方法、设立统一的教育统计指标体系,力求使联合国教科文组织的教育统计报告不仅可以向各国提供全球教育发展的准确数据,而且能够依据统计数据为各国提供教育决策的依据,为世界教育提供关注重点和发展趋势。许多全球教育统计的概念和指标,如各学段的“毛入学率”“师生比”“教育财政开支占GDP/GNP的百分比”等,也都由此发展起来。

然而,全球的教育统计数据主要来自各国政府的自主申报,而各国的各届政府在提供教育数据时,仍然会出现口径不一致、前后不连贯、关注点不同、数据陈旧等问题,统计数据还容易受到其他因素的干扰和影响。另外,各国教育统计数据往往比较容易反映各级各类教育的发展规模,但难以揭示各级各类教育的质量水平,更难以揭示造成各国教育质量差异背后的复杂原因。这些国际教育统计数据的弱点就给国际教育成就测评的发展带来了巨大的发展空间,直接催生了国际教育成就评价协会(IEA)的建立和国际教育成就测评的出现。

1962年,国际教育成就评价协会(IEA)率先尝试发布了《12个国家13岁儿童的教育成就:一项国际研究的结果》,开创了通过国际测试比较各国教育成就的先河。之后,IEA连续组织了1964年的“第一次国际数学研究”(FIMS)、“六个学科领域研究”(1970-1971)、“第二次国际数学研究和第二次国际科学研究”(1981-1984)和“国际数学和科学教育趋势研究”(TIMSS,1995),等等。IEA的开创性工作至少表明,“教育成就的跨国比较是能够进行的,而且能够得到可比的结果”[1]。然而,IEA的国际教育测评的规模还十分有限,参加国家最多的项目也仅覆盖21个国家和地区,而且基本局限在欧美发达资本主义国家。

在冷战结束、世纪转换、21世纪来临的时候,一些发达国家的专家已经发现,尽管它们早已实现了义务教育的普及,但教育质量却没有明显提升,教育公平的目标也未随之实现;而另一些国家的教育部长还误以为“自己国家的学校体制是世界上最优秀的”。经济合作与发展组织(OECD)教育与技能司司长施莱歇尔则批评说,这种井底之蛙的说法仅仅是由于“这是他们最了解的体制”[2]。同时,21世纪面对的知识经济信息技术的挑战,更要求各国政府实施教育系统的重大变革。在全球范围中比较参照,深刻认识本国学生的学习状况和教育问题,寻找发现各国“最佳实践案例”,就成了众多国家和教育专家推进教育改革的基本前提和重要选项。而冷战的结束和东西方之间藩篱的拆除,则使大型国际教育测评真正有可能成为世界各国参与,并在此基础上进行跨国分析比较的方法与工具。

2000年,OECD研发开展了“国际学生评估项目”(PISA),44个国家和地区参与了第一轮测试。PISA测评既不是基于课程内容的学业成绩考试,也不是简单地测试学生的智力高低,而是力图测评学生在接受义务教育后,是否具有面对未来社会挑战的“素养”,也就是说,力图考察15岁学生通过学习形成的解决真实世界问题的能力。PISA崭新的评估理念和测评方法得到了越来越多国家和地区的认同,参与的国家和地区持续增加。到2015年,已经有超过占全球GDP总量90%的72个国家和地区的70万名学生参与到这一大规模国际教育测评项目中来。

2008年,OECD又推出了“教师教学国际调查”(TALIS)项目,全面深入地调查各国家和地区教师的工作条件、学校学习环境和教师专业发展状况。TALIS通过问卷调查,收集和分析可靠、及时和可比的数据信息,希望帮助不同国家和地区通过以数据为基础的国际比较和分析反思,制定高质量的教育政策,以构建高质量、专业化的教师队伍,因为PISA和TALIS测试调研表明,教师是除了家庭以外,对学生学业成绩和成长发展影响最大的单一因素。

大规模的国际教育测评与调查研究项目大大拓展了比较教育研究的既有范式和方法,使比较教育从游记轶事、制度描述和历史因素分析,再到社会科学数据统计,发展到通过组织国际教育测评比较分析各国教育质量和问题的新境界。这些国际教育测评项目以实证研究为基础,结合跨国的学习成就测试和师生问卷调查,借助数理统计、数据分析等多种方法,不仅获得了各国各地区可比的教育成就数据,能够回答“是什么(what)”、处于“什么水平(at what level)”的问题,揭示一个国家或地区教育质量在世界版图中的高低现状;而且还能深入发掘造成教育成就高低背后的各种关键影响因素,多维度地解答“为什么(why)”和“怎么会(how)”的问题。正因如此,这些大规模国际教育测评能够为各国政府推进教育改革、制定教育政策提供数据证据、案例经验和启示建议。这种循证、测量的比较方法,为比较教育研究的发展带来了新的活力。伴随这些国际测评项目的持续推进,相关的教育测量和评估技术也得到迅速发展和完善,其中包括大规模教育研究的抽样理论、试题难度和学生能力的估计理论等,有力地推动了教育评价监测的发展,甚至推动了教育科学,特别是教育实证研究的发展。这正是我们筹划和组织出版“国际教育测评丛书”的初衷。

当然,我们也充分意识到,教育研究的实证测量浪潮并不是对其他教育研究及教育研究方法的摒弃和替代。教育研究仍然需要立足于各国教育实践的大地,需要运用多种方法,不同维度地深入观察和研究学习过程、学生发展和教学过程;教育研究仍然需要植根于对各国教育发展的历史分析和哲学思考的沃土之中。只是,对于今天的比较教育研究者和各分支学科的教育研究者而言,教育统计测量、数据处理、评价解释、信息技术等方面的专业知识和运用能力应该成为其专业的基本知识和能力。(www.chuimin.cn)

上海作为中国教育改革开放的前沿,40年来一直秉持先行先试的发展战略。2009年我们第一次组织参加了由经济合作与发展组织研发实施的“国际学生评估项目”(PISA 2009),以后又参加了PISA 2012。2013年,上海又参加了OECD研发的“教师教学国际调查”(TALIS),2015年我们还参加了由世界银行组织的“提升教育成就系统研究”项目(SABER)。在这几项大型国际教育测评比较研究中,上海的学生、教师和教育行政部门都显示出特有的优势,引起了各国政府和教育界的关注,上海基础教育因此走入国际教育平台的核心圈。与此同时,相关的研究结果和国际比较也对我们认识上海教育的弱点、问题和盲点,对上海教育乃至中国教育的发展,产生了深远的影响。

十几年来,在PISA和TALIS等国际比较教育研究的实践和研究过程中,大批国内比较教育研究学者紧跟上述世界教育发展步伐,通过深入参与国际比较教育研究项目,不仅学到了相关项目的组织策略和技术方法,还通过对研究数据的分析进行了大量教育实证研究。这也使得我国的教育测评研究、设计水平和教育实证研究得到了迅速提升。本套丛书正是基于这样的研究背景而出现的。这些研究成果不仅能帮助我们更加清楚地认识各国教育发展的特征,还能使我们将中国教育置身于国际化的平台上进行重新认识,了解我们的优势和不足,提供可能的借鉴和学习的经验。

我们还注意到,国际教育测评本身也处在迅速发展的过程之中。以PISA为例,从测评内容方面来看,国际教育测评不仅测试学生阅读、数学和科学等学科的素养、知识与能力,而且试图测评21世纪信息技术、全球治理、协作分享和创新素养等新兴领域的学生素养。PISA在2012年第一次引入“以计算机为基础的创造性问题解决测评”,2015年又增设了“合作解决问题测评”,2018年开展了“全球胜任力”测评,2021年PISA还将尝试进行“创造力测评”。与数学、阅读和科学学科领域的测试相比,对这些21世纪核心素养的测试显然更具挑战,更需要集中各国教育专家的智慧。从测评技术上来看,PISA已经从最初的纸笔测试转变为今天的计算机测试,未来还可能采用自适应测试,甚至将人工智能技术运用于测试中。

近年来,大规模国际教育测评项目不仅在持续改进和发展测试技术,而且还同步改进着评价和调查的方法,各国专家力图用最新信息交流技术提高教育调查、测评的客观性和真实性。以“教师教学国际调查”(TALIS)为例,TALIS最初是通过问卷来进行教师调查的,为了增强其研究的客观性,TALIS分别对教师与校长作问卷调查,以期了解和揭示教师和校长对于同样问题的不同感受。然而,仅仅用双维的调查还不足以解决众多的客观性问题。2018年,TALIS项目引入了教师课堂教学视频研究(Video Study)。通过教师前后问卷、学生测试加教师课堂录像分析的精致研究设计,TALIS视频研究力图以先进的现代信息技术手段,发现各国数学教师的教学真实成效,从而弥补原自陈式调查了解实际教学行为方面的不足。

与PISA和TALIS不同的是,世界银行的SABER则系统开辟了新的教育政策文献研究实证化道路。它独特的文献统计研究策略,根据对各国教育政策文献的语词记录、分析和比较,将各国教育具体领域的政策评为从低到高的“潜在(latent)”“出现(emerging)”“巩固(established)”和“先进(advanced)”4个水平。然后,再以“三角聚焦”的要求,结合实地观察、访谈、问卷以及相关国际测评成绩的相关分析,最终形成对一个国家教育发展、教育政策及其结果的分析判断。我们相信,科学的进步总是随着科学研究方法的发展而发展的。通过不断参与与合作,追踪和研究全球最新研究方法的进展,我们才能更进一步推动我国比较教育、教育测评和教育研究的进步。这也是我们推出此套丛书的初衷之一。

推出“国际教育测评丛书”的另一缘由,是为比较教育研究学者,特别是为研究国际教育测评的学者,搭建学术平台、提供交流机会、汇集研究成果。在此,我们要特别感谢上海市教育委员会和上海教育出版社给予我们的全力支持!没有这些支持,长期的研究难以为继,付梓出版更无可能。本套丛书首批三部著作的作者都是上海PISA测试的最早参与者,他们已经在这个领域探索耕耘了十余年,他们为比较教育新方向的形成、教育测评技术的引进发展、我国教育实证研究的发展作出了贡献!朱小虎博士研究了PISA如何检测各国培养学生“问题解决能力”这个崭新的课题。陆璟教授用独特的方法研究了一个精细而有趣的问题。她运用的是“日志研究”方法——即通过对学生在PISA测试中使用计算机过程(学生思维痕迹)的记录,来研究和揭示学生的思维过程与风格,比较各国教育教学对学生思维过程、路径和风格的影响。徐瑾劼博士则研究了各国参与PISA测试的职业学校学生的学习状况与成就,通过将测试结果与问卷调查数据的分析比较,解释上海和各国职业教育的各自优势、存在问题和最佳案例。我们相信,更多的来自PISA、TALIS、SABER、TIMSS、PIRLS和PIAAC等国际教育测评的研究成果,以及对这些国际教育测评的元研究、元评价结果将会陆续问世。

展望未来,随着信息技术、人工智能的迅速发展,教育必将产生更加深远的变革。联合国教科文组织《教育2030行动框架》特别指出了监测、追踪和评价对于各国和全球教育目标实现的重要性,指出监测教育质量要采取多维度的方式,覆盖系统设计、资源投入、新兴技术运用、测评内容、过程和结果等方面。为了促进教育过程和结果的可比性,这些监测需要从理念、内容、方法和技术上形成全球共识,并为所有人共享,从而推进区域性和全球性的研究、促进全人类教育的发展。

对教育研究者,尤其是比较教育研究者而言,这既是前所未有的挑战,也是学科发展的巨大机遇。

上海师范大学国际与比较教育研究院

【注释】

[1]王承绪.比较教育史.[M]北京:人民教育出版社.1999:353。

[2]Schleicher,Andreas.World class:How to build a 21st-century school system.[M]Paris:OECD.2018,20.