首页 理论教育数学课考试:评价学生基础知识与技能能力的重要方式

数学课考试:评价学生基础知识与技能能力的重要方式

【摘要】:在现阶段数学学科的学业评价过程中,考试仍不失为一种重要的考核学生基础知识与基本技能水平、数学能力水平等方面的评价方式,无论是诊断性评价、形成性评价、还是终结性评价,都离不开考试这种方式。教学要求是进行教学的依据,考试是对教学效果的检查,这两者应该是一致的。

考试是教育评价的重要手段,是测量学生学习效果的一种有效而常用的重要工具。在现阶段数学学科的学业评价过程中,考试仍不失为一种重要的考核学生基础知识与基本技能水平、数学能力水平等方面的评价方式,无论是诊断性评价、形成性评价、还是终结性评价,都离不开考试这种方式。

传统的数学考试在今天新课程标准实施的背景下仍然具有重要的意义,但是,新的课程标准也对今天的数学考试有新的要求,如果不能对传统的数学考试进行一定的改革,那么新课程标准就难以真正的落到实处。在本节中我们首先就传统的数学考试进行较为全面的介绍,然后再对新课标下的数学考试进行一些探讨。

(一)传统的数学考试

1.涵义及其在教学方面的功能

考试是一种量化取向的评价方法,在数学教育中应用最为广泛。它是根据数学教育目标,通过编制试题、组成试卷对学生进行测试,引出学生的数学学习表现,然后按照一定的标准对测试结果加以衡量的一种评价方法。考试的主要特点是其评价信息的处理可以运用一定的数学统计工具,评价结果是以一组数据的形式呈现,它可以通过纸笔、操作、口头、电脑等多种方式进行,而其测试项目往往都可以赋予一定的分数,并存在标准的答案。考试法自身的这种特点决定了其功能的局限性,主要适用于数学基础知识与基本技能的评价,也就是说它较为适用于可以转化为分数的学生学习表现的评价。

教师在一个阶段的教学任务完成后通常采用考试的方式来检查学生学得如何,考试的结果直接反映了学生学习的信息,比如学生对基础知识掌握的程度如何、基本技能熟练程度如何、数学运算能力如何、逻辑推理能力如何等等。通过仔细分析试题,对照教学大纲的教学目的和教学目标要求,教师可以发现哪个概念学生掌握得好,哪些知识和能力达到了大纲要求,哪些方面的内容还存在问题,是个别学生的问题还是普遍性的问题等等,这些都是学生学业评价的重要依据。与此同时,教师进一步寻找问题的根源,是知识本身的问题,还是教学方法或教学态度方面的问题,反思自身教学中存在哪些薄弱环节。因而,通过考试可以帮助教师更清楚地认识学生知识能力方面的情况,也能更客观地评估自己教学上的成效与不足,提供自我评价的重要依据,使之有针对性地研究教学内容,重新组织和整合知识,改革教学方法,提高教学质量。

目前数学新课程下的考试不仅关注基础知识和基本技能的评价,而且还要重视考查学生分析问题和解决问题的能力,要将知识和能力的考查有机结合起来,将开卷和闭卷有机结合起来,改进考试的方式,倡导灵活多样、多次机会、双向选择的原则。此外,评价者必须明确考试的目的是客观地诊断学生的学习情况,发掘学生存在的问题与不足,以及时查漏补缺,在此过程中使学生的数学思维、素养和能力得以发展,这也是数学新课程发展性评价的根本目的。

2.考试的分类

从考试的基本形式上划分,考试可分为两类。一类是教师自编题考试,一类是标准化考试。教师自编考试是由教师个人或集体编制试卷的考试,一般是为了日常教学而进行的班级考试,是由任课教师针对学生对知识的掌握情况而编制试卷,最后由任课教师完成评卷工作,确定学生成绩。如果是期中或期末考试,考试由学校或教研组组织,集体编制试题,评分也有统一的标准,这样便于比较和相对评价。毕业考试和升学考试也多采用教师集体命题,只是这种考试要求很严格,统一组织命题组,由教育主管部门制定考试宗旨,确定考试性质,试卷按照规定严格编制,最后采用统一标准、统一阅卷、统一评分的方式较为客观地给出学生的学业成绩。

标准化考试是一种按系统的科学程序组织、具有统一的标准、并对误差作了严格控制的考试。考试要求做到试题编制的标准化、考试实施的标准化、阅卷评分的标准化以及分数转换与解释的标准化,最大限度地减少由于主观因素造成的误差,使测定的结果更接近学生的实际。

数学标准化考试一般采用主观试题同客观试题相结合的形式,每道试题都经过测试、统计,科学地评价出试题的质量,并建立起题库,以便根据不同的考试要求,随时组成不同难度的试卷。这些试题题量大,覆盖面宽,能比较全面地考查考生对教材的掌握情况,也能较好地防止猜题、押题等弊端,将学生学习的注意力引导到掌握教材的基本知识及基本理论上来。此外,标准化考试的一个重要标志就是使用标准分,它可以提高测量结果的可比性,使分数更趋合理。

3.数学试卷的编制

(1)数学试卷编制的原则。数学试卷是检查学习质量的工具,编制一份好的试卷是进行教学测评的首要前提。数学试卷的编制,一般应遵循下列原则:

①目的性原则。在编制一份数学试卷之前,首先应当明确为什么要进行考试,其目的是什么,因为考试的目的直接影响到试卷编制工作的各个方面。例如,以了解学生掌握数学知识程度为目的的单元考试,它命题范围一般都不超过该单元所在的这一章的内容;以选拔为目的的数学高考,其内容范围就要广得多,对数学能力的考查也有较高的要求;高中数学会考的目的是检验每一个高中毕业生在数学学科上是否已经达到了教学大纲中所规定的各项教学基本要求,因此试题的难度就应当适中;数学竞赛,它是以选拔人才为目的的,因此对试题的难度和鉴别力必然会有很高的要求。因此,只有明确了考试的目的,试卷的编制才不会偏离方向,考试的有效性才有可能得到保证。

②考试与教学要求一致的原则。教学要求是进行教学的依据,考试是对教学效果的检查,这两者应该是一致的。考试应以教学要求为标准,以教材内容为依据,试题涉及的数学基本知识、基本技能与方法不应该超出大纲中规定的内容与要求。

科学性原则。试题不能是错题,这是最起码的科学性要求。此外,为了保证测试公正、合理,还必须遵循有效性原则。为此,应注意以下几方面:试题有较大的覆盖面,要保持各部分内容之间的恰当比例,突出考查中学数学中的重点内容;试题的份量要恰当,难度要适中,与考试群体中多数学生的水平相符;试卷的编排要合理,既按从易到难的顺序编排试题,使各题的难度构成一个梯度,又要注意各题之间的独立性;试题的语言表达应简明、清晰,图形要正确;编制参考答案,给出评分标准。

(2)分数的统计分析。如何判断一份考试试卷的可靠性和有效性,前面已给出一些定性标准,实际上也可以对考试分数进行统计分析,给出定量标准。下面介绍几个衡量试卷质量的数量指标。

①难度。难度是反映试题难易程度的数量指标,通常用难度指数p表示,它的基本计算公式为

其中表示参加考试的学生解答试题的平均得分,x是该题的满分值。

如果试题是二分记分,即答对的满分,答错或未答的零分,则该题的难度指数为

其中N为全体考生数,n为答对该题的考生数。

从计算公式可以看出,0≤p≤1。并且p的值越大,试题越容易;反之,p越小,试题越难。当p取两个极端值0,1,或非常接近这两个极端值时,所有考生在该题的得分不会有显著差异,这说明试题无法区分学生的学习水平,考试失去了评价的意义。

难度的确定与考试的目的和性质有关。在教学过程中的各种数学考试,多数试题的难度指数介于0.8-0.35之间。在选拔性考试中,多数试题难度指数介于0.8-0.25之间。

②区分度。区分度指的是试题对考生之间实际学习水平区别程度的指标,常用字母D表示其大小。区分度的计算一般有两种方法:

第一种方法:高低分组得分相减法。这种方法先将考生按成绩从高分到低分排序,然后按27%的百分数,分别计算高分段的平均分和低分段的平均分,则区分度

其中,x为满分值,试卷整体区分度也可以用这个公式计算。

例如,某次考试有120人参加,某试题的满分为12分。将120人的成绩按高低顺序排列,再按27%、46%、27%的比例将它们分成三个分数段,分别计算高分

段与低分段的均分,得则该题的区分度

第二种方法:相关系数法。这种方法是用学生在某试题上的得分与他们的考试总分的积差相关系数r作为该题的区分度,即

其中,N为被试学生总数分别是全体学生在该题的得分与均分是全体学生的考试总得分与均分,σx、σy分别是该题与整份试卷的标准差。

从计算公式可以看出,0≤D≤1,如果考试成绩较好的学生在该题的得分较高,考试成绩较差的在该题的得分较低,则D值较大;反之,D值越大,试题的区分能力就越高。如果某试题(或某试卷)的区分度在0.20以下,则该题(或该试卷)不具有任何考核意义,应淘汰不用。一般情况下,区分度应不低于0.4。在编制选拔性考试的试卷时,设计合理的试卷梯度,增加考题的新颖性,在允许难度范围内提高考题的综合性等等。

③信度。信度是反映试卷作为一种测量工具的稳定性、可靠性的数量指标,即试卷被同一个被试群体使用多次,所得结果的一致性程度。一致性程度越高,说明试卷的信度越高。信度的大小用信度系数来表示。由于衡量系数的标准不同,所以计算信度系数有多种方法这里介绍两种计算简便、数据精确的计算方法。

第一种方法:分半法。将一份试卷分成两份等价的试卷,通常以所有奇数号题为一份,以所有偶数号题作为另一份。求出这两题目之间的相关系数,即

式中xi、yi分别为第i个考生第一、第二次考试的实得分,N为考生总人数。然后代入公式中,即可求得整份试卷的分半信度系数ru

在使用上述公式时,必须假定由一份试卷分成的两部分试题在平均分、标准差、分布形态、内容与要求等方面都近似相等或相似,否则由此计算所得的分半信度系数的误差就比较大。此外,为减少误差,在试题分半时,应以小题为单位进行划分。

第二种方法:克伦巴赫(L.J.Cronbach)公式。克伦巴赫于1951年提出了可用于任何评分方法的计算试卷信度系数的公式:

式中n为试题总数,S2为所有被试学生考试总分的方差,S为所有被试学生第i题得分的方差。

对于一般数学考试,信度系数应达到0.9以上。在编制试卷时,可以通过采取一些策略提高信度系数,比如在可能的情况下,增加试题量,减少大题的数量;多采用客观题,给出合理的评分标准,以减少因评分人员的主观因素产生的成绩误差;试题排列由易到难,考试时间长短适宜,以减少因学生的情绪波动产生的成绩误差等等。

(3)考试成绩的解释与评定。根据考试的评分标准,从试卷直接得到的分数叫做原始分数。一般情况下,为了科学、客观、公正地评价学生的学习,我们不能直接用原始分数来评价学生的学习效果,常需要对原始分数进行整理。

为了客观地确定考生的位置,科学地进行不同考试结果的比较,常常运用某些量化数据,常用的量化数据如下:

①集中量数。如果一个数据反映了某被测群体的整体水平或集中趋势,则称它为集中量数。常见的集中量数有算术平均数、加权算术平均数、中位数、众数等。例如,算术平均数是指一组表示相同意义的数值得和除以这一组数值的个数所得的商,记为。算术平均数用公式表示为:(xi为考生的原始分数,N为考生人数)。

在实际问题中,在一组相同意义的数值中,某些数多次重复出现,它表明该数值在总体中所占位置的重要程度。为使所统计的数值对算术平均数的影响与各自的重要性程度相吻合,就把某数值重复出现的次数代表该数值的重要程度,这个次数称为权数。

如果在n个同质数值中x1出现f1次,x2出现f2次……xk出现fk次,又f1+f2+…+fk=n,那么,根据简单算术平均数公式,这个n个数值的平均数表示为=或缩写成,我们把上面的平均数叫做加权算术平均数。

例如:某校初中一年级有4个班级,各班人数和毕业考试的数学成绩如下表:

表8-3 数学成绩表

问:这所学校初中三年级毕业考试的数学平均分是多少?

可见,用一般算术平均数公式计算出来的结果产生了负偏差是:82.05-79.79=2.26,原因就是忽略了权数。

②差异量数。从所收集的数据当中,除了可以发现数据的集中趋势,还有离中趋势,表示数据的分散程度。一般地,描述一组数据离散程度的量叫做差异量数,它与集中量数一样,用来量化评价研究的对象。有些情况仅用集中量数去描述一组数据还不能全面的评价某一事物。比如有两个班数学考试成绩的平均分都为85分,用集中量数无法区别这两个班级的考试情况,实际上,一班的最高成绩是98分,最低成绩是55分;而二班的最高成绩为90分,最低成绩为70分,显然,他们的离散程度不同,数学学习的情况也不一样。如果使用差异量数去分析,就可以从另一个侧面反映数据的情况,弥补集中量数的不足。我们介绍两个常用的描述差异量数的方法。

第一种:标准差。标准差是由每个观测值与平均数的离差所求得,它利用了每一个观测值所提供的信息资料,因此,具有较高的可靠性,使差异量中最科学最常用的量数。公式如下:

用于考试分数评价中,它表示一个被测群体的考试成绩的变异程度。σ越大,说明平均数的代表性越小,σ越小,说明群体中考生的成绩与平均数越相近的代表性就越大。

第二种:标准分。它是由原始分数换算得来的可以进行比较的量数,它的一种计算公式是:

其中x为原始分数为平均分,σ是标准差,λ是常数,它作为修正值在运算中调整数值。通过该公式计算得来的分数又称为Z分数。可以看出,Z分数以平均分为零点,以标准差为单位。当原始分数大于,则Z分数为正,当原始分数小于时,Z分数为负,λ就起到将负转正的作用。将原始分数化为标准分数之后,我们可以对它们进行比较,并由此对学生的学习作出评价。

例如,某班期中、期末考试中,一名学生的原始分数,以及考试的均分、标准差如下表所示,试分析这名学生的成绩是提高还是下降了?

表面上看,这位学生的数学成绩是下降了,但不能就得出该生成绩下降的结论。现在用标准分计算:

表8-4 成绩表

期中考试,期末考试,取λ=50,z1=50-0.32=49.68,z2=50+0.46=50.46。可见,从标准分来分析,该生期末考试的成绩比期中考试要好。

标准分也可以用于同一个人不同测验分数的比较。例如,某生参加5门课程考试,各科得分、各科均分、标准差及标准分数如下表所示。

表8-5 成绩表

从表中数据可以发现,如果单纯比较原始分数,史地成绩是最优的,容易被认为是考得最好的一门。但如果将原始分数与平均分比较,会发现语文、数学高出均分最多,然而数学的标准差较小,说明数学考试成绩与均分的差异程度较小,因此数学成绩优于语文。如果直接观察各科成绩的标准分数,比较后便可很直观的得到上述结论。

(二)新课标下对数学考试改革的思考

尽管考试仍然是新课标背景下评价学生学业的重点,但是,由于传统的考试是与传统的数学教学相适应的,如果还把传统的数学考试的做法完全搬到新课标下的数学考试中,那么就不能体现考试在新课标下对于学生数学知识、技能和能力的要求,因而对传统的数学考试进行一定的改革是非常必要的。由于新课程使用的时间不长,对于如果进行考试改革还处于研究之中,以下就考试内容谈一些设想。

1.考试题目中应该有一些生活化的内容

考试题目应该有一些生活化的内容,也就是有一些内容是与学生的实际生活相联系的。新课标十分强调数学教学活动要联系实际,要贴近学生的生活。因此,在考试中出现这样的实际问题是非常必要的。

例3 2007年5月23-29日,在合肥销售8000万元即开型福利彩票(每张面额2元),设特等奖100万元,结果中100万元者有15名,假如你也花10元买5张,下列说法正确的是( )

(1)中100万元是必然事件;

(2)中100万元是不可能事件;

(3)中100万元是可能事件,但可能性很小;

(4)因为5÷15=0.333,所以中100万元的可能性是33.3%。

2.考试题中应该有一些开放性的和探索性的问题

新课程标准认为,数学教学应该培养学生的创新意识和创造能力。而开放性和探索性问题,能为学生提供更好的自由选择、自由想象和自主探索的空间,能够鼓励学生多角度、多层次和多层面地思考问题,因而在教学中应该适当地使用这一类问题,相应地,在考试中自然也应该选择一定量的此类问题。

例4 某初一学生做作业时,不慎打翻墨水瓶,使作业题只能看到如下字样:“甲、乙两地相距400千米,摩托车的速度为45千米/时,货车的速度为35千米/时。”请按自己的理解将此题补充完整并解答。

3.考试题中应该有一定数量的动手实践问题

新课标强调了动手实践在数学学习中的重要意义,把它和自主探索以及合作学习一起作为学生数学学习最重要的方式。新课标要求在数学学习中应该提供给学生一定的机会来动手实践,通过动手实践来认识数学、理解数学和应用数学,因而在考试题中也应该有这方面的问题。

例5 设“●▲”分别表示三种不同的物体,如图所示,前两架天平保持平衡,如果要使第三架天平也平衡,那么“?”处应放“”的个数为( )。

4.在考试题中应该有一定数量的数学题,在解题时能够反映学生的思维过程

新课程标准强调,教学应当结合具体的数学内容,让学生经历“问题情境——建立数学模型——解释、应用与拓展”的过程。在经历知识的形成与应用过程中,更好地理解数学、发展应用意识和能力,因而,在数学考试中也应该有此类问题。

以上从四个方面谈了在新课程标准下数学考试内容的选择。在新课标下的数学考试除了内容外,还有其它一些相关问题需要研究,这里就不再涉及。