首页 理论教育信息检索技术策略探究:教师提升研究

信息检索技术策略探究:教师提升研究

【摘要】:各种类型的检索课题所涉及的学科范围不同,对检出文献的需求也不一样;各专业的用户因其所从事工作性质及研究的不同,对检索的查全率和查准率也有着不同的要求。对于那些对查全率、查准率无特殊要求的用户来说,应针对不同的课题,制定相应的检索策略。检索式的制定是否合理,将关系到检索策略的成败。

(一)检索策略及制定步骤

1.检索策略分析

所谓检索策略,就是在分析用户情报提问实质的基础上。正确地选择检索词,科学地运用逻辑算符、制定合理的检索提问式的原则和方法。检索策略的优劣,直接影响到相关文献的查全率和查准率,关系到检索服务的效果。当然,对于一定的情报提问来说,检索效果的优劣取决于许多因素:首先是书目数据库的本身的因素,如该数据库所使用的词表质量、标引质量等;其次是系统所提供的功能。但是,在一定数据库质量和系统功能的前提下,检索策略无疑是一个非常重要的因素,在同一个检索系统中对同一个书目数据库进行同一课题的检索,不同的检索策略会导致不同的检索效果。

2.检索策略制定步骤

(1)检索课题的分析。在制定检索策略时,必须先对检索课题进行详细的主题分析,分清主要概念和次要概念,以便考虑问题时有所侧重;检查是否需要排除某些概念,以保证情报提问的准确表达。对于一些没有什么检索意义的泛指概念(如方法、研究、作用等),一般不宜选用。在进行主题分析时,去掉隐含的概念,可取得较好的检索效果。

在分析课题时,应对查全率和查准率有相应的要求,以便确定合适的检索范围。各种类型的检索课题所涉及的学科范围不同,对检出文献的需求也不一样;各专业的用户因其所从事工作性质及研究的不同,对检索的查全率和查准率也有着不同的要求。对那些要研究新课题、撰写评述性文章与学术著作以及申报专利的用户而言,他们往往需要全面、系统地收集某一专题范围内的文献资料,因此对查全率要求较高。这时,应采取多选用相关概念,增加上位概念(如查微型计算机,必要时可查计算机)或下位概念(如查贵金属时,可以查具体的金属名称:金、银、铂等)的方法来扩检。

另外,通过减少概念组面数,去掉部分限制条件,也可扩大检索范围,取得查全的效果。对于在研究过程中需要解决某一具体问题或正在进行技术攻关的用户来说,他们往往只需要某一主题或几个关键数据方面的情报,只要求检索的结果能解决他们的实际问题,不一定需要很多文献,因此对查准率要求较高。这时应使用专指性较强或增加限制的概念来缩小检索范围,以达到查准的目的。还可通过对字段的限定,来保证查找的准确性。

对于那些对查全率、查准率无特殊要求的用户来说,应针对不同的课题,制定相应的检索策略。对文献量较大属于成熟学科的课题,应优先考虑查准率,从众多的相关文献中选取针对性较强的文献。这样,既可以保证检索的质量,又可节省机时。对文献量较少属于新兴学科的课题,可适当放宽检索范围,来保证查全率,以免遗漏重要的参考文献。

(2)检索词的选择。通过主题分析,确定了各概念组之后,就要选择表达概念的检索词(项)。检索词的选择,一般有以下方式:

①优先选用主题词表。主题词能准确地表达主题概念,查准率高。主题词表的参照结构及等级关系,可提供所用主题词的上位词,下位词及相关词等,以供参考和选择。这对选全和选准有关主题词有较大帮助,有助提高查全率。

②从相应的印刷本工具中选取索引词。这种词针对性强,检索效果较好。通过手检摸底,可以了解有关专业术语及用词规律,还可估算有关文献量,以便制定相应的检索策略。

③从原始文献中选取自由词。这种词一般都是专指性较强的专业词语,只要组配得当,通常能够取得较好的检索效果。但要注意选全有关的同义词和近义词,有时还应使用反义词(如环境保护环境污染)同时,还必须考虑英美不同拼写形式的词以及检索词的单、复数形式、缩写形式等。(www.chuimin.cn)

④在不具备以上条件的情况下,可以从专业词典、手册及分类表等参考工具书中选词。但是,要避免选用使用频率较低的词,且一般不选用动词和形容词,也不要想当然地按平时的习惯称呼用词。必要时,可使用扩展指令,显示检索系统的索引和词表,以便选择检索词。

⑤检索专利数据库可使用分类号来限制检索的专业范围,以提高查准率。在有些文档中查找特定的化学物质时,使用化学物质登记号,可取得较好的检索效果。

(3)编制合理的检索式。检索式是检索策略的逻辑表达式。从某种意义上说,它就是检索策略的具体体现。检索式的制定是否合理,将关系到检索策略的成败。检索式的质量,主要取决于检索者对检索系统功能的了解程度以及使用检索算符的方法和技巧。一般而言,使用逻辑“与”算符越多,则限制条件就越多,专指性就越强,有利于提高查准率;使用逻辑“或”算符越多,连接的相关词越多,检索范围就越大,查全率越高。另外,使用逻辑“非”算符来去掉不相关概念,也可提高查全率。但在使用逻辑“非”时要慎重,不然会舍去一些相关文献。

在检索式中,一般不要连续使用多个位置逻辑算符,以免限制过严而漏检文献。一般而言,如果连续使用三个以上的(W)算符,就难查到文献了。利用截词符对检索词进行适当处理,可表示检索词的单复数形式,同一词的不同拼写形式以及词干或词尾有多种变化的各种检索词。

(二)检索策略的调整方式

在机检过程中,有时需要对检索策略进行多次反复调整才能获得最佳检索效果。检索策略的调整方式分为以下两种:

1.联机反馈调整的方式

联机反馈调整的方式灵活简便,可任意扩检或缩检。检索人员可采用“人—机对话”方式,边检索边观察终端屏幕显示的结果,当场进行调节,修正,不断完善检索策略,直至获得满意结果。由于检索系统具有将已输入的检索词或检索式再限制在题名和标引词字段查找之功能,这使得联机调整有更大的灵活性,在检索中,可先输入检索词进行全文查找,然后再根据终端显示结果来决定是否要进一步缩小检索范围,以得到更为准确的结果。

2.脱机反馈检索的方式

在检索中,有时由于种种原因,没有预期的检索效果,或是发现了新的检索线索,这时,需要进行再一次的反馈检索。脱机反馈检索就是通过对检索结果进行分析、研究,找出存在的问题,或补充新的检索内容,制定新的方案,然后用修改后的检索式再检索的过程。