首页 理论教育男女生试题正确率比较及胜算分析

男女生试题正确率比较及胜算分析

【摘要】:为了控制这些差异,OECD在PISA 2012问题解决研究报告[3]中比较了男女生在不同类别试题上的胜算比,也称优势比。表6-3中国上海男女生在不同类型试题上的表现比较注:粗体字表示有统计上的显著性。我计算了中国上海男女学生在每个试题上的正确率,各题性别差异比较见附表6-1。

要衡量一组试题对同一个国家(地区)的男生来说更容易,还是对女生来说更容易,可以比较男女生平均在其中各个试题上回答正确的百分比有多少,也就是平均正确率,例如男生在27个互动问题上平均正确率为53.7%,女生为47.1%,女生比男生低6.6个百分点,而对男女生回答正确率测量的标准误为1.6个百分点,可以算出差异的t值为4.7,t值大于3.29,不存在差异的可能性就小于千分之一,所以可以看出男女生有极显著的差异,这是最直观的比较视角。从表6-3可以看出,在问题解决过程的4个认知方面上,中国上海女生在表征和构思、计划和执行试题上的正确率均低于男生;在试题情境性质的两个分类——静态问题和互动问题上,上海女生正确率都低于男生。

但是,在某一个试题上的正确率会受到这道题目在试卷中出现的位置的影响。一般来说,同一个试题出现在试卷的前半部分的正确率会高于出现在后半部分,虽然PISA计算机测试在组卷的时候考虑到了试题在各套卷子中的均衡分配,每个试题出现在前半部分和后半部分的概率是相同的,但因为对一个国家(地区)来说,参加测试的学生数量比较有限,所以小的差异仍有可能存在。另外,在估计某一类试题(例如互动试题上)与其他类型试题相比回答正确的可能性是不是存在性别差异的时候,不仅要考虑试题类型,还要考虑试题类型与性别的交互作用,因为如果试题类型和性别不是独立的而是有关联的话,仅仅控制试题类型实际上没有完全控制试题类型对结果的作用。为了控制这些差异,OECD在PISA 2012问题解决研究报告[3]中比较了男女生在不同类别试题上的胜算比,也称优势比。胜算比是通过逻辑回归来估计的,回归方程中的变量是每个试题正确与否,自变量包括试卷虚拟变量(表示试题在试卷中的位置)、性别、试题类型的虚拟变量(表示每个学生在试题类型上的相对优势),以及试题类型与性别的交互作用。在控制了这些因素后,用交互作用的逻辑回归系数的胜算比来说明男女生在某个试题的答对可能性有没有差异,用某一种类型试题的平均值来说明在该试题类型上答对的可能性有没有差异。

表6-3 中国上海男女生在不同类型试题上的表现比较

注:粗体字表示有统计上的显著性

从表6-3右边两栏的数据可以看出,在控制了这些因素后女生在静态问题解决试题上的胜算比等于0.98,没有显著性,就说明在考虑了试题位置和其他试题的表现后,女生在15道静态问题试题上的正确率总体上与男生相当。同样地,在考虑控制因素后,互动问题解决的正确率也与男生相当。而在问题解决的4个认知方面上,上海女生在表征和构思试题上的胜算比为0.73,说明在考虑试题位置和其他试题上的表现后,上海女生回答正确的可能性是男生的0.73倍,显著低于男生;在监控和反思试题上胜算比为1.22,说明在考虑了试题位置和其他试题的表现后,女生回答正确的可能性是男生的1.22倍,显著高于男生。

我计算了中国上海男女学生在每个试题上的正确率(满分学生所占百分比),各题性别差异比较见附表6-1。其中有显著性别差异的试题如表6-4所列。在静态试题中,“交通单元为公开样题,题目和评分标准见附录2,这其实是两道简单的加减法题,但是因为有了交通图的背景,解决问题还需要有直观想象能力。其他几道试题未公开,但是都有共同特点,家具摆放平面图通信网络图都有类似地图的结构。从这些试题上女生得分低于男生可以看出,女生在涉及生活中的空间关系问题上相对比较弱。在互动问题上,“室温控制”是公开样题,试题和评分标准见附录2,“金鱼缸”“广告”和“遥控器”与“室温控制”类似,都是基于微动态系统的试题,而基于微状态机的试题中只有“时钟”第2题显著低于男生,而“时钟”第1题还显著高于男生,所以总的来说,女生在微动态系统试题上表现不如男生,而在微状态机试题上差异不显著,说明女生对量变的探究和控制比较弱,对质变的控制与男生相当。所以本章中将利用“交通”和“室温控制”两个单元的log数据来分析男女生在这类试题解决过程中的差异。(www.chuimin.cn)

表6-4 中国上海男女生正确率有显著差异的试题

(续表)