但是,搜索引擎的发展格局是多方面的,市场需求的多元化也导致了搜索引擎的行业化和细分化,从而“垂直搜索引擎”成了搜索引擎发展的必然趋势之一。垂直搜索引擎要依靠网页爬虫技术,抓取某一个特定领域中的所有相关网页。在进行了抓取、分类、抽取之后,垂直搜索引擎就可以利用这些结构化的对象信息,来应对用户的提问,并进行各种智能分析和挖掘工作。......
2023-11-01
搜索引擎是开启网络知识殿堂的钥匙,获取知识信息的工具。随着网络技术的飞速发展,搜索技术的日臻完善,中外搜索引擎已广为人们所熟知和使用。任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群指向。一种搜索引擎不可能满足所有人或一个人所有的检索需求。在某些情况下,如文献普查、专题查询、新闻调查与溯源、软件及MP3下载地址搜索等,人们往往需要使用多种搜索引擎,对搜索结果进行比较、筛选和相互印证。为避免逐一登录各搜索引擎,并在各搜索引擎中分别多次输入同一检索请求(检索字串)等烦琐操作,人们往往并非使用最好的搜索引擎,而只是使用自己最熟悉的搜索引擎。因此,要想获得一个比较全面、准确的结果,就必须反复调用多个搜索引擎。元搜索引擎的出现,在一定程度上解决了这些问题,也更好地解决网络信息资源的发现并为检索提供了一个新的发展方向。
所谓元搜索引擎(metasearch engine),是指用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。由于采用了一系列的优化运行机制,能够在尽可能短的时间内提供相对全面、准确的信息,而且即使不能完全满足用户需求,仍可以作为相对可靠的参考源进行扩展搜索,因此成为倍受推崇的检索首选入口。其技术重心在于查询前的处理(检索请求提交机制和检索接口代理)和结果的集成。
元搜索引擎由三部分组成,即检索请求提交机制、检索接口代理机制、检索结果显示机制,如图6-6所示。
图6-6 元搜索引擎的基本结构图
①“请求提交”负责实现用户“个性化”的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。(www.chuimin.cn)
②“接口代理”负责将用户的检索请求“翻译”成满足不同搜索引擎“本地化”要求的格式。
③“结果处理”负责所有源搜索引擎检索结果的去重、合并、输出处理等。
元搜索引擎实际上是一种网络查询接口工具,它的工作原理相对简单。它没有自己的网页索引数据库,只给用户提供一个集成的查询界面,用户的查询要求经它加工处理后转发给相应的一个或多个独立搜索引擎完成,返回的检索结果经它处理后以统一的显示格式提供给用户。熟悉联机检索系统的人不难发现,元搜索引擎的工作方式特别类似联机系统的“网关”或“前端系统”。用户向元搜索引擎发出检索请求,它将该请求整理为相应的检索指令发往多个单搜索引擎。各单搜索引擎执行检索指令后将检索结果传送给元搜索引擎,经过整理后再传送给用户。
常用的中文元搜索引擎有万纬搜索(http://www.widewaysearch.com)、metaFisher(http://www.hsfz.net/fish/)、搜星(http://www.soseen.com)、Bbmao搜索引擎 (http://www.bbmao.com)、北斗搜索(http://www.bydou.com)、Xooda 元搜索引擎(http://www.xooda.com)、Seekle(http://www.seekle.cn)。常见的国外常用元搜索引擎有Mamma(http://www.mamma.com)、ASK Jeeves(http://www.ask.com)、Search(http://www.search.com)、MetaCrawler(http://www.metacrawler.com)、Profusion(http://www.profusion.com)、ByteSearch(http://www.bytesearch.com)、Dogpile(http://www.dogpile.com/)。
有关信息技术:基础+实践的文章
但是,搜索引擎的发展格局是多方面的,市场需求的多元化也导致了搜索引擎的行业化和细分化,从而“垂直搜索引擎”成了搜索引擎发展的必然趋势之一。垂直搜索引擎要依靠网页爬虫技术,抓取某一个特定领域中的所有相关网页。在进行了抓取、分类、抽取之后,垂直搜索引擎就可以利用这些结构化的对象信息,来应对用户的提问,并进行各种智能分析和挖掘工作。......
2023-11-01
Google的诞生可以说是一个偶然。于是Page建立了一个实验用的搜索引擎BackRub,实际上他已经在不知不觉之中建立了第一个网络爬行工具。Google以检索功能强大、搜索信息准确而倍受赞誉,一些门户性网站如雅虎、网易等也以它作为搜索引擎,世界上许多权威机构更是将其评为最佳搜索引擎。Google从功能上分为三大部分:网页爬行、标引入库和用户查询。图6-4Google运作过程示意图基于Robot的搜索过程。这样,Google就可以通过各种策略来解决排序沉没和排序漏出等问题。......
2023-11-01
1.搜索引擎技术原理搜索引擎有三步。但即使最大的搜索引擎建立的索引数据库,仍占互联网上不到30%的普通网页,不同搜索引擎之间的网页数据重叠率一般在30%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的网页。同时,市场需求的多元化也导致了搜索引擎的发展格局必然是行业化和细分化。......
2023-11-01
站内搜索引擎具有目的性强、自动归类匹配、效率高、信息价值量随用户的参与增多而增多、局限性、被动性等特征。大众点评网站是典型的站内搜索引擎,它主要为用户提供有关美食、购物、休闲娱乐,提供商家优惠券、生活服务、会员卡和社区等信息,并且分类明确、搜索方便,目录更是一目了然。虽然就目前而言,Baidu、Google等大型搜索引擎仍占重要地位,但是相信在不久的将来,站内搜索也会有自己的一席之地的。......
2023-11-01
信息技术在文物及非物质文化遗产保护中广泛应用,包括计算机技术、网络技术、通信技术、软件技术、地理信息系统、定位技术、遥感技术等。在浙江省良渚古城城墙遗址的确认上,应用了数字高程技术。......
2023-10-17
的回答, 83%的同学都表示喜欢“四自四导”教学模式。表2-2学生对“四自四导”教学模式的态度2.对“四自四导”教学模式的认同程度调查显示,被调查者对教学试验采用“四自四导”是持肯定态度的。对于问题“信息技术课程‘四自四导’教学模式调动了你学习的积极性和主动性吗?”......
2023-08-04
四元数是一种全局的姿态描述方法,在使用四元数进行姿态描述的时候,纵使出现上文中=θ=ψ=π/2的情况,依然是有解的。由于无人机姿态中这种奇异性的情况非常特殊,我们通过直接验证理解四元数的全局性。......
2023-07-05
相关推荐