搜索引擎的整个处理流程是非常复杂的,涉及大量的运算。搜索引擎整理信息的过程称为“创建索引”,其目的是提高搜索引擎查找的速度。接受查询用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回结果。目前,搜索引擎返回结果主要是以网页链接的形式提供的,通过这些链接,用户便能到达含有自己所需信息的网页。要注意的是,各个搜索引擎的检索语法也不尽相同,需要时请到各网站查阅检索帮助。......
2023-10-22
1.评价指标
在传统信息检索中,衡量检索系统的基本指标有:查全率(recall)和查准率(pricision),查全率是检索出的相关文档数和文档库中所有的相关文档数的比率;查准率是检索出的相关文档数与检索出的文档总数的比率。
对于搜索引擎系统来讲,因为没有一个搜索引擎系统能够搜集到所有的Web网页,所以召回率很难计算。因此,目前的搜索引擎系统都非常关心精度。
搜索引擎要满足用户对信息查询的需求,以下是几个比较重要的指标。
(1)网页覆盖率:提高查全率,是保证查准率的基础。
(2)返回结果的准确性:主要是第一页结果的准确性。
(3)重复信息返回的过滤:返回结果应该尽可能不出现重复、类似的情况。
(4)网页更新速度:取决于新网页的发现,和死链(指无法访问的网页)的及时删除。
(5)搜索服务的相应时间:即用户提交检索后得到结果返回的等待时间。
(6)搜索服务的系统稳定性。
2.网页链接评估
搜索引擎算法离不开链接,链接在搜索引擎中也是必不可少的因素之一,未来,链接算法会越来越复杂。搜索引擎对网页的链接的评估有四种基本方法。(www.chuimin.cn)
(1)链接数量。用link命令查询网站的反向链接,例如,link:www.seo-service.com.cn。
一般来说,链接数量较多的网站会比较少链接的网站排名高些。不过,不是所有的链接都是平等的。
(2)链接质量。
搜索引擎通过检查链接来源站点的链接流行度来判断权重性。因此,如果一个高权威性的站点链接到你的网站,就等于将它的一些权威性赠与到你网站上。搜索引擎将最高网页排名的因素归于从很多高质量站点来链接,甚至更复杂。一个只有5个链接的高权威性网页转移给每个链接页面的权威性比一个含有50个链接的权威性相同的网页所传送的权威性多。这个理论是,只有这么多的权威性存在,而链接的数量越多,每个链接的网页所得到的推荐值就越低。
(3)文本链接。
文本链接在搜索引擎算法中是一个关键的搜索请求排名因素。搜索请求趋向于返回那些在文本链接中包含有搜索请求关键词的被链接的网页。
例如,“SEO”网站的一个网页开始吸引到很多链接为“SEO服务”的链接,由于包含这些词的搜索请求,SEO网页的排名就会比以往更高。
(4)链接相关性。
从内容相关站点来的链接也是一个搜索请求排名的关键因素。内容的相关性是指信息是关于某一个主题的(或者话题或者title),仅仅是文本链接使用相似的词是不够的,因为词语在不相关的主题中可以有不同的含义。在文本链接之外,搜索引擎查看文本链接周边的字,查看整个网页甚至整个链接来源站点上的词。为什么?因为与搜索请求主题相关的站提供了比其他站点更相关的链接。
从流行度站点来的随便的链接与既从流行度站点又从高度相关站点来的链接不具有相同的权威性。
搜索引擎可以在发出搜索请求和出现搜索结果之间的短暂时间内考虑这么多复杂的因素,说明其具有相当快的计算速度。搜索引擎认为高网页排名因素是那些有很多高质量链接的网页。认为高搜索请求排名因素是那些拥有很多进入链接的网页,这些链接既来自于很多内容相关的站点,同时在文本链接中还含有搜索请求关键词。
有关信息技术:基础+实践的文章
搜索引擎的整个处理流程是非常复杂的,涉及大量的运算。搜索引擎整理信息的过程称为“创建索引”,其目的是提高搜索引擎查找的速度。接受查询用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回结果。目前,搜索引擎返回结果主要是以网页链接的形式提供的,通过这些链接,用户便能到达含有自己所需信息的网页。要注意的是,各个搜索引擎的检索语法也不尽相同,需要时请到各网站查阅检索帮助。......
2023-10-22
利用AutoCAD设计中心的查找功能,可以根据指定条件和范围来搜索图形和其他内容,如块和图层的定义等。图11-10 对话框在下拉列表中给出了利用该对话框可查找的对象类型,在框中显示了当前的搜索路径。如果查找到了符合条件的项目,则将显示在对话框下部的搜索结果列表框中。......
2023-11-03
运行算法时所消耗的资源的多少称为算法的效率。在6.4.1节讨论了无序表的顺序查找算法,在6.4.2节讨论了有序表的折半查找算法,现在我们来分析对比一下这两个不同的查找算法的时间效率。对于有序表的折半查找算法来说,当给出一个要查找的书号时,由于知道记录是按书号有序存放的查找线索,所以折半查找算法可以从表的中间处开始查找。因此,在学习掌握各种算法时,不仅要掌握算法的实现过程,还要掌握算法的时间效率。......
2023-11-18
图10.4.1使用indexOf()查找子字符串2.lastIndexOf()方法lastIndexOf()函数与indexOf()函数类似,区别是lastIndexOf()从后往前搜索子字符串,有则返回第一个字符的下标,没有则返回-1,语法如下:参数说明:◇ str:表示字符串、字符串变量或字符串对象。图10.4.3使用includes()判断是否包含指定子字符串4.replace()函数查找字符串常常和替换字符串一起出现。动手写10.4.4执行10.4.4.html,输出结果到网页,如下图所示。......
2023-11-08
旅游目的地竞争力影响因素相互作用,形成多项竞争分力,这些分力集成耦合并作用于目的地的旅游产业,最终形成旅游目的地竞争力。在此基础上,结合波特的比较优势与竞争优势理论以及“钻石模型”理论,还可以对上述精炼后的影响因素做进一步的分类与汇总,以便服务于旅游目的地竞争力概念性评价模型的构建。......
2023-11-24
表6-11 全区地质环境功能区划(二)生态功能区划生态功能区划是根据工作区区域生态环境要素、生态环境敏感性与生态服务功能空间分异规律,确定工作区不同地域单元的主导生态功能,将工作区划分成不同生态功能区的过程。其目的是为制定工作区生态环境保护与建设规划、维护区域生态安全以及资源合理利用与工农业生产布局、保育区域生态环境、确定生态用地范围提供科学依据。以生态系统服务功能评价为基础进行主导性分区。......
2023-11-03
由于受到当时各方面条件的限制,中国第一次水资源评价没有对地下水水质进行系统评价,仅根据地下水的矿化度对咸淡水分布区进行了划定。第二轮次的地下水水质评价主要包括现状水质综合评价、污染分析、水质变化趋势分析等。中国的地下水污染有浅层向深层渗透的发展趋势。......
2023-09-18
相关推荐