Corel-10K数据库含有100个图像类别,包括桥梁、瀑布、草原、国旗、邮票、食物、汽车、灯塔等,图7-6展示了Corel-10K数据库的一些图像类别,从图7-6也可以看出纹理特征广泛存在于自然界和日常生活中。Corel-10K数据库的每个类别有100个样本图像,因此该数据库一共有100×100=10 000个样本图像,大部分图像的分辨率为187×126或192×128。......
2023-06-29
检索效果是指信息系统检索信息的有效程度,反映了信息系统的检索能力。检索效果包括检索的技术效果和经济效果。技术效果是由信息系统完成其功能的能力确定,主要指性能和质量。经济效果由完成这些功能的价值确定,主要指信息系统服务的成本和时间。
克兰弗登(Cranfield)在分析用户基本要求的基础上,提出了六项评价系统性能的指标,它们是收录范围、查全率、查准率、相应时间、用户负担和输出形式。其中,查全率和查准率是两个最主要也是最常用的指标。
1.查全率和查准率
查全率(recall ratio)是指检索出的相关信息量与信息系统中的相关信息总量之比,衡量系统检索出与课题相关信息的能力,计算公式如下:
查准率(precision ratio)是指检索出的相关信息量和检索出的信息总量之比,衡量系统拒绝非相关信息的能力,计算公式如下:
查全率和查准率两者结合,表示信息系统的检索效率。相关信息和非相关信息在检索效果的分析中总是相辅相成的,其关系可参见表6-1。
表6-1 检索效果评估相关数据表
检索者的最终目的是要求达到查全率和查准率均为100%,这实际上是不可能的。一系列试验结果表明,查全率和查准率之间存在互逆关系。通常折中检索,即查全率一般在60%~70%,查准率一般在40%~50%,这是检索的最佳状态。
2.查全率和查准率的局限性
查全率和查准率虽然是目前用来衡量检索效果的相对合理的指标,但它们却存在着难以克服的局限性。
查全率的局限性主要表现在:它等于检索出的相关信息与存储信息中的相关信息之比,但很少有人事先确知存储信息中相关信息究竟总共有多少,而只能估计;另外,查全率或多或少具有“假设”的局限性,这种“假设”是指检索出的相关信息对用户具有同等价值,但实际并非如此。
查准率的局限性主要表现在:如果检索结果是题录式而非全文式,由于著录的内容简单,用户很难判断检索到的信息是否与课题密切相关,而必须寻找到该题录的全文,才能真正判断该信息是否符合检索课题的需要。同时,查准率中所讲的相关信息,也具有“假设”的局限性。
产生这种局限性的主要原因是在“相关性”这个概念上。“相关性”概念本身,主观成分颇多。不同的课题,对检索信息相关性的要求不同,即使同一课题,随着时间、地点、条件的不同,对检索信息的相关性要求也会有很大出入。例如,在开始确定一项新的研究计划时,对查全率要求很高,希望不漏掉任何一个重复研究项目的情报;而在进行这项研究的过程中,为了核实或补充某个问题,有时又需要很高的查准率。因此,前面所说的查全率和查准率,都是相对的查全率和查准率,而不是绝对的查全率和查准率。它们只能近似地描述检索效果。在评价检索效果时,必须谨慎使用这两个概念。(www.chuimin.cn)
在实际检索中需要根据具体的检索课题来调整查全率和查准率。用户常常是经过几次检索来调整符合检索课题需要的查全率和查准率。在多数情况下,应该在查全基础上逐步利用限制检索来逐步提高查准率。
3.影响查全率和查准率的主要因素
对用户来说,最关心的是检索效果,而影响检索效果的主要因素有信息标引的广泛性和用户检索标识的专指性。标引的广泛性是就标引时揭示信息主题基本概念的广度而言,是支配查全率的重要因素;检索标识的专指性是就检索标识表达主题的基本概念的专指度而言,是支配查准率的重要因素。
对一个信息系统来讲,这些都是影响查全率和查准率的客观因素:系统内信息存储不全,收录遗漏严重;索引词汇缺乏控制;词表结构不够完善;标引缺乏详尽性,没有网罗应有的内容;信息分类(标引)专指度缺乏深度,不能精确地描述信息主题;组配规则不严密,容易产生模棱两可或歧义现象等。
对用户来说,影响查全率和查准率的主观因素有:检索课题要求不明确;检索系统选择不恰当;检索途径和方法过少;检索词缺乏专指性;检索面宽于检索要求;用词不当;组配错误等。
4.提高检索效果的措施和方法
要提高检索效果,可以参考使用以下辅助性措施和方法。
(1)提高检索系统的质量,包括数据库收录信息的范围不但要广泛,而且要切合课题检索的要求;著录的内容详细、准确,辅助索引完备;具有良好的索引语言的专指性与网罗性及其标引质量等。
(2)提高用户利用检索系统的能力,使之具备一定的检索语言知识,能选取正确的检索词,并能合理使用逻辑组配符完整地表达信息需求的主题;能灵活运用各种检索方法和检索途径等使检索系统最大限度地发挥作用。比如,全面准确地表达检索要求,合理使用信息、检索点。根据不同检索课题的需要,适当调整对查全率和查准率的要求。
(3)制订优化的检索策略,尽量准确地表达检索要求,合理调整查全率和查准率。由于查全率和查准率是互逆的,所以,需要根据课题的具体要求,来调整两者的比例关系。如需了解某项研究的概况、申请专利、科技查新、开题、立项等则要求查全率高;如需了解某项研究的最新进展、检索新的课题则要求有较高的查准率。总之,选用泛指的检索词,或尽可能增加与检索主题概念相关的检索词的数量,查全率就高;选用专指性的检索词或由若干个检索词组配的专指概念的检索词,查准率就高。只要掌握了这些方法和技巧,并在具体检索中合理运用,就能得到满意的检索结果。
不同的检索课题,不同的信息需求,对查全率和查准率的要求是不同的,表6-2给出了调整查全率和查准率的一些措施,供用户检索时选用。
表6-2 调整查全率和查准率的措施
有关信息技术:基础+实践的文章
Corel-10K数据库含有100个图像类别,包括桥梁、瀑布、草原、国旗、邮票、食物、汽车、灯塔等,图7-6展示了Corel-10K数据库的一些图像类别,从图7-6也可以看出纹理特征广泛存在于自然界和日常生活中。Corel-10K数据库的每个类别有100个样本图像,因此该数据库一共有100×100=10 000个样本图像,大部分图像的分辨率为187×126或192×128。......
2023-06-29
表6-6 地表居住-公共服务用地地质环境适宜性评价指标注:①δ为工作区历年最高洪水位。表6-8 环境设施用地地质环境适宜性评价指标(四)地下空间根据分析地形地貌、工程地质、水文地质和地质环境问题4个方面对城区地下空间开发的影响,构建城镇城区地下空间开发的地质环境适宜性评价指标体系。......
2023-11-03
信息化合作式学习必须关注学习者的个性特点,从学习者出发进行因材施教。在信息化合作式学习中应该关注学习者能力的培养,教师对能力培养的关注与否成为评价的一个主要内容。借用我国教育理论工作者评价课堂合作学习的指标体系,我们将信息化合作式学习中的学生和教师这两个因素的评价项目表述如下。对教师而言,应该关注现代教育观念、信息意识、信息能力、信息化合作学习设计的能力等。......
2023-10-25
我确立的初中信息技术课程发展性评价内容主要是由信息技术的意识和态度、信息技术的道德修养、信息技术知识和信息技术能力四个方面组成,如图6-1所示。网上试卷考评法要求教师首先根据教学目标和《信息技术课程标准》确定考评的评价目标,然后根据评价目标编制一个二维的细目表。它要求教师首先根据教学目标和《信息技术课程标准》制定评价指标。......
2023-08-04
深入探究研究区地质环境问题的类别及其活动状态、活动强度、发展趋势、影响范围等,利用层次分析-综合指数法评价研究区各类地质环境问题的危险性。采用综合指数法综合评判研究区的地质环境风险程度。(二)单类地质环境问题危险性评价地质环境问题危险性评价是考虑易于诱发地质环境问题发生的各种因素及各种因素可能的相互组合对地质环境问题发生的影响,预测评估地质环境问题发生的可能性、范围、强度及频率等。......
2023-11-03
“发展性”评价操作。心理素质,由心理教育教师和班主任,分别对学生的心理健康知识、心理品质、心理卫生习惯作出发展性评价解释。发展性评价应该是全员参与的全面评价。发展性评价制度是面向全体教师的,不是面向少数优秀教师或少数不称职教师的,它要求包括领导在内的全体教师都要接受评价。发展性评价的目的是引导和改善教师工作状况,激励和促进教师发展。......
2023-11-29
图5-16主题列表图5-17主题的右键快捷菜单2.主题的美化主题是主题颜色、主题字体和主题效果三者的组合,用户可根据需要更改当前主题的颜色、字体和效果。单击列表下方的“自定义字体”按钮,弹出图5-21所示的“新建主题字体”对话框,可设置标题和正文的中、西文字体。图5-20主题字体列表图5-21“新建主题字体”对话框图5-22主题效果列表......
2023-11-01
在文本框中输入文本后,除了可以设置文本的样式,还可以为文本框设置填充样式、边框样式及旋转文本框等。图5-32幻灯片中的占位符图5-33插入文本框图5-34“插入对象”对话框4.设置文本效果格式在文本框或占位符内输入文本后,可以对其中的全部或部分文本设置各种效果。......
2023-11-01
相关推荐