首页 理论教育信息检索的步骤:快速精准查询

信息检索的步骤:快速精准查询

【摘要】:图6-1信息检索的步骤1.分析研究课题在着手查找信息前,需要对课题进行分析,明确学科或专业的范围,弄清检索的真正意图及实质。3.确定检索途径检索途径是进入检索的入口。上述两类途径构成了信息检索的整个检索途径体系。这是根据信息的题名来检索信息的途径,比较符合一般用户对信息使用的习惯。它们是一些信息类型的特有标识,与信息有对应的关系。

计算机信息检索的步骤从检索课题开始,包括分析研究课题、制订检索策略、选择检索系统、确定检索途径、选择检索方法、初步检索结果、获取原始信息、得到检索结果等多个步骤,具体如图6-1所示。

图6-1 信息检索的步骤

1.分析研究课题

在着手查找信息前,需要对课题进行分析,明确学科或专业的范围,弄清检索的真正意图及实质。它包括了解课题的内涵概念范围和外延概念范围,以便确定检索标识(检索词、分类等);明确课题所需信息的内容、性质和水平以及出版国别、语种和年限;了解并掌握课题的国内外情况;同时还要在分析的基础上形成主题概念,包括所需信息的主题概念有几个、概念的专指度是否合适、哪些是主要的、哪些是次要的等要素。还有些检索系统要求使用相应的词表和类表对选择出来的检索词进行核对,力求检索的主题概念准确反映检索需求。

可从以下几方面确定检索范围。

(1)专业范围:确定该课题涉及哪些专业及其相关的学科。

(2)时间范围:确定该课题需要检索信息的年代范围。

(3)地理范围:各国出版的检索系统以收藏本国的信息为主,因此,某课题在哪个国家处于领先地位,原则上就采用该国的检索系统。

(4)语种范围:该课题在哪国占优势,原则上就选择该国母语的检索系统。

(5)信息类型:各种检索系统收录信息的着重点是不同的,即使是综合性检索系统也未必面面俱到,因此,要选择与课题有关的、针对性强、适合课题需要的检索系统。

2.选择检索系统

检索系统与检索结果直接相关。要根据课题要求,选择与所查课题相适应、质量较高、检索手段比较完善的检索系统。须了解和掌握其适用范围、收录特点,然后通过三次信息的选择和检索,如《工具书指南》《数据库目录》等工具指引到二次信息检索系统。

在选择检索系统时,要考虑的主要问题如下:

(1)在内容和时间方面,要考虑检索系统、数据库内容对课题内容的覆盖面和一致性,如应综合考虑检索系统、数据库收录信息是否齐全、编制的质量、使用是否方便等因素。

(2)在手段上和技术上,具有机检条件一般就不选择手检工具,机检无疑具有较高的检索效率。但是数据库收录的信息一般都来自于20世纪八九十年代,较久远的信息未必已被回溯建库,所以在选择时必须掌握其收录信息的年代范围。

(3)考虑价格和可获得性,应选择就近容易获得的检索系统。

3.确定检索途径

检索途径是进入检索的入口。归结起来,有两类检索途径,一是反映信息内容特征的(主题、分类)途径,二是反映信息外部特征的(著者、题名、代码等)途径。上述两类途径构成了信息检索的整个检索途径体系。

(1)分类途径。

这是按学科分类体系查找信息的途径,采用的是分类目录和分类索引。它以学科概念的上、下、左、右的关系来反映事物的派生、隶属、平行、交叉的关系,能够较好地满足族性检索的要求。

(2)主题途径。

这是利用信息主题内容进行检索的途径,即利用从信息中抽象出来的,或经过人工规范化的,能够代表信息内容的标引词来检索。它打破了按学科分类的方法,使分散在各个学科领域里的有关课题的信息集中于同一主题。其最大优点是接近人们的工作和生活实际,且直接准确,同时,由于采用的概念易于理解或为人所熟悉,能够把同性质的事物集中于一处,所以检索时便于选取。在各学科和其分支交叉渗透日益强化的今天,这种途径的检索是深受欢迎的。

(3)题名途径。

这是根据信息的题名来检索信息的途径,比较符合一般用户对信息使用的习惯。知道信息题名的读者可以通过这种途径获取所需的信息。但题名往往较长而且复杂,题名相同或相似的甚多,容易造成误检,故不宜作为主要的检索标识。(www.chuimin.cn)

(4)著者途径。

这是以著者(包括个人及团体著者)的名称,按照字顺编排成一个体系,通过这一体系的排列规律,把某一著者的信息集中起来。通过这一途径能获取该著者所有的信息。

国外对著者途径非常重视,许多检索系统都把著者索引作为最基本的必备辅助性索引。著者途径的特点是:科研人员一般是各有所长,尤其是有些领域的知名学者、专家,他们的文章和特点一般都代表了一定的水平和动向,通过著者线索,可以系统地发现和掌握他们研究的进展,可以查寻某著者的最新论著。一定程度上,可以引导查找到同类或相关的信息。这种途径的检索既快速又方便,但查得的信息缺乏系统性、完整性。

(5)代码途径。

这是通过已知信息的专用代码,如国际标准书目号(ISBN)、国际连续出版物号(ISSN)、专利号、合同号等查找信息的途径。它们是一些信息类型的特有标识,与信息有对应的关系。在已知信息代码的前提下,用此途径检索信息比较方便、快速,尤其是ISBN、ISSN的唯一性使得检索更快速和便捷。

(6)其他途径。

有些检索系统还附有一些特殊的索引,可用特殊途径找到所需信息的线索。如已知题名、会议时间和地点,则可用“图书索引”和“会议索引”等来检索所需的信息。另外,根据学科性质和它们的特点,也出现了一些特殊的标识,由这些标识构成了辅助检索途径,如以地质地理科学的地域区划和地名为标识编制的专门索引。

在计算机信息系统中,检索途径还有很多,几乎信息的每一个特征(如出版社、出版年代等)都可作为检索途径。显然,检索途径的多少直接关系到检索的便利与否。

多种检索途径各有特色、作用,使用时不可偏废。在检索信息时,应根据检索要求、已知条件、设备是否齐全等因素,尽量综合利用各种途径,取长补短,进行优化选择,以提高检索效率。

例如,为科学研究确定的课题,为了解某一学科的发展历史、研究现状和发展趋势,为制订战略决策和进行预测而搜集有关信息,应以分类途径为主,辅以主题检索途径;为研究解决某一具体问题或攻克某一技术难关,应以主题途径为主,辅以分类途径;如果已知检索课题的外部特征,则应选择题名、著者、代码等检索途径;如果已知检索课题的内容特征,则应选择主题途径或分类途径。

选择检索途径可供参考的意见如下。

(1)从已知信息特征选择检索途径。

如果事先已知信息题名、著者、代码等条件,则采用题名目录、著者索引、代码索引或有关的目录索引。用这些途径进行检索比较快速、方便和有效。也可分类途径或主题途径配合使用,即从分类途径或主题途径查出一批信息,掌握一些著者姓名,然后采用著者途径进行追溯。

(2)从课题检索要求选择检索途径。

如果课题检索的泛指性较强,也就是说所需信息的范围广,要求“特性检索”,则选用主题途径为好。

(3)从检索系统提供的索引选择检索途径。

检索系统提供的每种索引,都是一种检索途径,应充分熟悉和使用。目前国内外检索系统提供的索引情况不一,多的提供索引十多种,少的只提供一二种。因此,选择检索途径还要根据检索系统的具体情况来决定。

检索途径确定以后,就要根据课题要求拟定相应的检索标识。当选择内容途径时,有时检索系统还要求将确定的检索标识与相应的词表或类表进行核对,以提高查准率

4.制订、调整检索策略

(1)信息检索的策略。

所谓信息检索策略,即将课题的提问及其检索词与检索系统的收录内容、编排特点相匹配而确定的检索方案或程序。制订检索策略的主要内容是,在分析检索课题的基础上,确定要利用哪些检索系统,确定查找年限和专业范围的选择,确定检索用词并判明各词之间的逻辑关系与查找步骤等事项。

(2)检索策略的调整。

检索过程是一个动态的随机过程,在某些检索环节中,会不可避免地产生一些和检索目标相差甚远的现象,如检索词过于宽泛或过于偏窄而造成扩检或漏检,检索词不规范而引起的误检等。所以,有必要在评价检索效果的基础上,对检索结果进行信息反馈,以便于重新修正检索策略,调整检索手段,进行新一轮的循环检索,从而实现检索目标的完善。