首页 理论教育搜索引擎评价查找结果

搜索引擎评价查找结果

【摘要】:搜索引擎要满足用户对信息查询的需求,以下是几个比较重要的指标。2.网页链接评估搜索引擎算法离不开链接,链接在搜索引擎中也是必不可少的因素之一,未来,链接算法会越来越复杂。搜索引擎对网页的链接的评估有四种基本方法。搜索引擎通过检查链接来源站点的链接流行度来判断权重性。文本链接在搜索引擎算法中是一个关键的搜索请求排名因素。

1.评价指标

在传统信息检索中,衡量检索系统的基本指标有:查全率(recall)和查准率(pricision),查全率是检索出的相关文档数和文档库中所有的相关文档数的比率;查准率是检索出的相关文档数与检索出的文档总数的比率。

对于搜索引擎系统来讲,因为没有一个搜索引擎系统能够搜集到所有的Web网页,所以召回率很难计算。因此,目前的搜索引擎系统都非常关心精度。

搜索引擎要满足用户对信息查询的需求,以下是几个比较重要的指标。

(1)网页覆盖率:提高查全率,是保证查准率的基础。

(2)返回结果的准确性:主要是第一页结果的准确性。

(3)重复信息返回的过滤:返回结果应该尽可能不出现重复、类似的情况。

(4)网页更新速度:取决于新网页的发现,和死链(指无法访问的网页)的及时删除。

(5)搜索服务的相应时间:即用户提交检索后得到结果返回的等待时间。

(6)搜索服务的系统稳定性。

2.网页链接评估

搜索引擎算法离不开链接,链接在搜索引擎中也是必不可少的因素之一,未来,链接算法会越来越复杂。搜索引擎对网页的链接的评估有四种基本方法。(www.chuimin.cn)

(1)链接数量。用link命令查询网站的反向链接,例如,link:www.seo-service.com.cn。

一般来说,链接数量较多的网站会比较少链接的网站排名高些。不过,不是所有的链接都是平等的。

(2)链接质量。

搜索引擎通过检查链接来源站点的链接流行度来判断权重性。因此,如果一个高权威性的站点链接到你的网站,就等于将它的一些权威性赠与到你网站上。搜索引擎将最高网页排名的因素归于从很多高质量站点来链接,甚至更复杂。一个只有5个链接的高权威性网页转移给每个链接页面的权威性比一个含有50个链接的权威性相同的网页所传送的权威性多。这个理论是,只有这么多的权威性存在,而链接的数量越多,每个链接的网页所得到的推荐值就越低。

(3)文本链接。

文本链接在搜索引擎算法中是一个关键的搜索请求排名因素。搜索请求趋向于返回那些在文本链接中包含有搜索请求关键词的被链接的网页。

例如,“SEO”网站的一个网页开始吸引到很多链接为“SEO服务”的链接,由于包含这些词的搜索请求,SEO网页的排名就会比以往更高。

(4)链接相关性。

从内容相关站点来的链接也是一个搜索请求排名的关键因素。内容的相关性是指信息是关于某一个主题的(或者话题或者title),仅仅是文本链接使用相似的词是不够的,因为词语在不相关的主题中可以有不同的含义。在文本链接之外,搜索引擎查看文本链接周边的字,查看整个网页甚至整个链接来源站点上的词。为什么?因为与搜索请求主题相关的站提供了比其他站点更相关的链接。

从流行度站点来的随便的链接与既从流行度站点又从高度相关站点来的链接不具有相同的权威性。

搜索引擎可以在发出搜索请求和出现搜索结果之间的短暂时间内考虑这么多复杂的因素,说明其具有相当快的计算速度。搜索引擎认为高网页排名因素是那些有很多高质量链接的网页。认为高搜索请求排名因素是那些拥有很多进入链接的网页,这些链接既来自于很多内容相关的站点,同时在文本链接中还含有搜索请求关键词。