首页 理论教育基于LOG数据的问题解决能力评价指标

基于LOG数据的问题解决能力评价指标

【摘要】:在开展计算机化测试后,动态问题解决或复杂问题解决过程可以利用计算机后台保存的log文件对整个解题过程、知识获取阶段、知识应用阶段分别进行评价。从上述指标可以看出,目前对问题解决过程指标的分析主要局限在时间、步骤等基本统计上,综合的评价指标较少,并且指标比较分散,没有系统的分析框架。

过去在经典的、静态分析问题解决中,测量问题解决过程的最佳方式是出声思维,如Güss等[66]用出声思维方法分析了5个国家511名学生在两个微世界题目上的问题解决过程。但是出声思维的方法受被试意识和短时记忆影响大,难以反映深层思维,并且成本太高,在大规模测试中不可行。为了保持接近这种测量方式,美国国家评价、标准和测试研究中心(National Center for Research on Evaluation,Standards,and Student Testing,CRESST)建议通过要求人绘制概念图来测量内容理解(类似于领域知识);还通过要求解题者写一篇文章,解释他们如何解决任务的问题,用来评价解决问题的策略。这两种测量方法都采用开放题的形式,需要由专业编码者在事后做出分析判断。

在开展计算机化测试后,动态问题解决或复杂问题解决过程可以利用计算机后台保存的log文件对整个解题过程、知识获取阶段、知识应用阶段分别进行评价。但是,由于log文件信息量过于庞杂,学者们设想了多种过程指标,但是有些指标并没有找到具体的测量办法或者还没有实证研究支持。

在知识获取或系统识别阶段,文献中提到的过程指标有[67]

“每次只改变一个变量”的策略(Vary-one-thing-at-a-time),英文简称为VOTAT策略,又称控制变量策略。每次只改变一个变量的值而保持其他值不变(保持在0的位置),从而能够分别确定不同自变量对结果的影响[68]。控制变量策略代表了分离变量的变化的原则,这是开展有效的科学实验的核心元素。

无干预观察策略,也称外生变量零输入策略,即把所有变量都设为0。为了发现“本征动态”变化(即没有主动干预情况下的自动变化),被试至少要有一次保持所有变量都在0的位置的情况下点击“应用”,这被认为是问题解决情境中的无干预观察行为[69]

强干预策略。除了上述系统地控制外生变量结构的策略,还需要做出关于干预量大小的决定。如果在探索阶段发现加大干预量不会使系统出问题,则更强干预会更好,因为影响效果将更清楚地显示。但是目前这一策略只是研究者的一种设计,并没有学者开展相关实证研究。

响应时间(Response Time)/第一反应时间(Initial Reaction Time)。从计算机呈现题目开始到第一次做出答题反应的时间,这一时间可以看作阅读理解题目的时间,如果时间过长,那么被试可能缺少基本阅读技能[70];如果时间过短,那么被试可能是缺少动机而随意猜测[71]。Albert和Steinberg的研究表明,第一次主动干预前的时间量可以用作与问题情境中的规划和无干预观察密切相关的抑制性控制的指标,也是问题解决成绩的预测指标[72]

搜索策略。根据解题者在探究问题条件的过程中是先在第一层上扩展还是先在一个点上层层深入,把探究分为广度优先策略和深度优先策略。但是目前没有检索到这方面的实证研究。

在知识应用或系统控制阶段,文献中提到的过程指标有:

目标评估策略。即评估当前状态与目标状态的距离并设计如何达到目标状态的策略,以及评估如果达到了目标状态则使系统保持在目标状态的策略。但是这一策略也只是理论设想,目前没有关于如何测量这些策略的任何建议。(www.chuimin.cn)

最优性。使用从初始状态到目标状态的最佳路径。

有效性。导致系统变化的有效步骤占总的操作步骤数的百分比。

评价整个答题过程的指标有:

答题时间。学生为了解决每个任务而用的时间,即从阅读题目开始到答题结束的全过程时间[73]。对于简单的自动化任务可以作为衡量熟练水平的指标[74],对于高难度任务则可以作为努力程度的指标[75]

时间分配策略。测量知识获取和知识应用两个阶段所用时间的比例,来判断问题解决者重点聚焦在识别信息还是整合信息上。

干预频率。根据题目的具体设定,解题者点击“应用”或“重设”之类直接干预的数量[76]

转换频率。不同类型的问题之间的转换频率,例如总的问题(小镇里有银行吗?)到具体的问题(小镇的现金余额有多少?)、具体问题到探究问题(税率普遍上升的后果是什么?)之间的转换频率分析显示成功和不成功的问题解决者之间的显著差异[77]

从上述指标可以看出,目前对问题解决过程指标的分析主要局限在时间、步骤等基本统计上,综合的评价指标较少,并且指标比较分散,没有系统的分析框架