首页 理论教育搜索引擎的发展展望及技术趋势

搜索引擎的发展展望及技术趋势

【摘要】:搜索引擎既是一门技术,又是一项服务,因此搜索引擎的发展应该包括搜索引擎产品技术的研发及其服务方式的改进与发展。基于问题的搜索技术可能将成为未来搜索引擎发展的新趋势。因此,收费型与免费型搜索引擎还将同时存在,并彼此展开竞争,从而推动搜索引擎技术的发展和检索性能的改善。

搜索引擎既是一门技术,又是一项服务,因此搜索引擎的发展应该包括搜索引擎产品技术的研发及其服务方式的改进与发展。但是,不管搜索引擎技术如何发展,服务方式如何改进,都不应偏离用户快速、准确、方便查找信息的主导方向。提供经过甄别、筛选、评价和专家推荐的网站信息无疑是高质量搜索引擎永恒不懈的追求,是搜索引擎智能化与专家系统交汇融合的结果。基于问题的搜索技术可能将成为未来搜索引擎发展的新趋势。从1994年Yahoo!的运行到现在,搜索引擎取得了长足的发展与进步,无论是从数量上看还是从检索性能来看,都已经基本趋于成熟。虽然中文搜索引擎在产业化发展道路上还存在一些距离,但在搜索技术方面已不亚于国外搜索引擎。特别是在处理汉字上运用的切分标引技术、内码转换、词典标引技术、单汉字标引技术等独特技术与方法,使中文网络信息检索成为因特网上的一道亮丽的风景线。综合国内外搜索引擎研究与开发利用情况,搜索引擎的发展主要有以下趋势:

(1)大型综合性的搜索引擎与小型专业专题性搜索引擎协调发展

开发大型搜索引擎像Google、Yahoo!和Altavista需要大量的人力、物力和财力,不是一般信息开发机构所能做到的,网上已有许多大型的优秀搜索引擎,中小型的信息开发机构和信息应用单位可充分利用网上现有的大型搜索引擎,经二次检索建立符合自己需要的小型专业性搜索引擎,来满足本行业本单位和本专业的需要。如可以搜集网上的医学图像,建立影像搜索引擎,也可以通过人工方式和利用搜索引擎结果,将因特网上的医学网站集中起来建立一个生物医学专题导航系统或生物医学搜索引擎。

(2)方便使用与查全率、查准率的协调发展

网络用户没有经过网络信息检索知识与技能的培训,对网络信息检索知识不了解,对为提高查全率和查准率而设置的各种检索句法和规则很难理解。因此,设计搜索引擎时要充分考虑各层次网络用户的使用水平,既要做到满足一定的查全与查准,又要尽量做到简化查询句法,查询界面清晰、有层次,给用户以更多的选择。

(3)概念检索、自然语言检索与精确检索、主题词语言检索协调发展

自然语言检索和概念检索是检索语言的两个不同的发展方向,可以分别满足不同用户对查全和查准的要求,自然语言检索则考虑的是方便用户的使用。国外已有不少医学搜索引擎使用了医学主题词表来支撑网络信息检索,能够实现由关键词或文本词向规范化主题词的自动转换(如PubMed),从而大大提高了医学搜索引擎的智能化程度。主题词语言与自然语言的协调发展和相互兼容也是大势所趋。

(4)制定分编网页内容的标准语言和格式并倡导实行

要提高网络信息资源的查全率和查准率,必须对网上最基本的资源单位如网页内容进行规范化和标准化处理,每个网页在发布之前,由网页的制作者或专门的人员,对该网页按照一定的标准进行规范,如网页的标题必须能够反映网页的内容,提取能反映网页内容的关键词放在特殊位置,编写网页摘要等。这样做不仅可以大大提高网络资源的查全率与查准率,而且可以极大地降低搜索引擎加工网页的成本和时间。网上医学信息的规范化处理和标准化编目著录尤其重要,对医学专业网站和相关网页的标准化处理可以让用户放心大胆地使用这些医学信息。

(5)多途径检索

网上检索工具最初只是提供类目浏览和关键词检索,发展至今已成为能够检索多种类型信息的检索工具。医学图像信息的获取与利用,对于开展教育培训与继续医学教育有着非常重要的作用,国外一些大型搜索引擎提供了图像搜索的功能,生物医学搜索引擎特别要在提供图像搜索功能方面加大研究力度。

(6)多语种检索、本土化服务

随着上网用户的不断增加,世界各地上网人数不断增多,英语已无法满足所有用户的需要,语言障碍越来越明显。许多搜索引擎认识到这一点,正在相继加入多语种检索。与此同时,为解决信道拥挤、上网速度慢等问题,一些搜索引擎提供了本土化的检索服务,增加服务器,分流用户,提高上网查询速度。

(7)增加个性化服务与特色服务

个性化服务是指满足用户的特定需要。搜索引擎通过长期观察用户的搜索行为,能够从中识别用户的信息需求偏好,并且能够根据用户对搜索结果的评价,自觉调整搜索策略;在某些时候如用户所关心的信息发生变化时,自动发送电子邮件通知用户,保证用户能在第一时间获取最新的信息。搜索引擎的个性化服务可以帮助用户更快、更准确地找到所需信息,还可以避免无关信息的干扰,这其实也是搜索引擎智能化的一个方面。网上检索工具已不仅仅是单纯意义上的检索工具,正在向其他服务范畴扩展,提供站点评论、天气预报、新闻报道股票点评、各种黄页(如电话号码、航班和列车时刻表、地图等)。那些主动向有关用户提供信息的服务项目具有较强的主动性和针对性,信息质量较高,用户不必在网络中漫无边际地查询,有些类似目前流行的信息推送技术。

(8)收费型与免费型搜索引擎并存

自搜索引擎出现以来,其提供的检索服务多为免费。但是随着因特网市场的发展壮大,搜索引擎作为一种网络服务,如同电子邮件一样,也会出现一些有偿的搜索服务。从长远发展来看,搜索引擎的部分有偿服务将有利于它的发展:技术开发商可以有更多的资金投入到技术研究与开发中,加快搜索引擎产品的更新换代;服务提供商可以通过与数据库厂商合作,有偿使用其数据库产品,从而加强自身数据库的建设。继Northernlight实行一头免费、一头收费的部分收费服务机制之后,Medical World Search这一医学搜索引擎也开始了收费服务。虽然目前大多数搜索引擎仍提供免费型服务,主要靠网络广告和提供搜索技术等来维持网站的运转,但收费型搜索引擎以其高质量的全文信息服务和低于联机检索和光盘检索的收费标准,使用户检索的信息在质量上有明显提高。因此,收费型与免费型搜索引擎还将同时存在,并彼此展开竞争,从而推动搜索引擎技术的发展和检索性能的改善。

(9)搜索引擎广泛吸纳信息技术人员参与,加强对搜索引擎检索信息质量的评价

对于搜索引擎的质量评价,更多的应依靠信息技术人员与图书馆人员,通过他们的参与制定具体、操作性强的量化指标体系来综合评价搜索引擎的质量,同时开展因特网医学信息的评价与评价标准的研究,使搜索引擎提供的检索结果更可信,质量更高。

(10)搜索引擎索及网页的质量控制将成为制约其发展的重要因素

随着网络信息资源的爆炸性增长,任何一个搜索引擎都不可能不加选择地从网上搜索新的网页和网站,制定网页质量评价指标及网页入选标准,并公之于世。只有能满足用户信息需求的搜索引擎,才能更快速地发展。

(11)大型元搜索引擎的发展将格外引人注目,分布式搜索引擎研发市场前景看好

研究以多个搜索引擎甚至是多个元搜索引擎为主体的大型元搜索引擎,必将在提高网络信息覆盖率方面更胜一筹,同时也能包容更多的检索型搜索引擎,从而更大程度地满足网络用户查全率的要求。而分地区、分专题的分布式搜索引擎研发在降低网络带宽资源和其他设备资源方面有其优势和特色,因此对于分布式搜索引擎的研发将提上议事日程。随着国际大型资源合作编目组织如OCLC和中国CALIS中心的范围扩大,分布式搜索引擎的研发将变为现实。