【摘要】:但是,搜索引擎的发展格局是多方面的,市场需求的多元化也导致了搜索引擎的行业化和细分化,从而“垂直搜索引擎”成了搜索引擎发展的必然趋势之一。垂直搜索引擎要依靠网页爬虫技术,抓取某一个特定领域中的所有相关网页。在进行了抓取、分类、抽取之后,垂直搜索引擎就可以利用这些结构化的对象信息,来应对用户的提问,并进行各种智能分析和挖掘工作。
对于一个用户来说如果有对特定的领域或行业的信息需求的时候,如果一个是专业的垂直搜索能做到精确锁定内容,但内容量偏小;而另一个是能检索出大量内容,但搜索到的内容一大部分都是“垃圾”并且很难找到符合的信息。这样的话,你会选择哪个呢?答案很明显,更多的用户会舍弃后者,即使前者品牌小名声小,因为结果往往是最令用户看重的。
正因为如此,现在搜索市场大量的垂直专业搜索引擎如雨后春笋般诞生,例如,比价购物搜索引擎,工作搜索引擎等,占了百度几乎一半以上的流量的MP3搜索,其实也可以说是专业的搜索MP3的垂直搜索引擎。许多垂直门户已经纷纷推出了自己的搜索引擎系统。
所以说搜索引擎的出现,整合了互联网上众多的网页资源,并提供信息导航和信息查询服务,使信息的价值得到了用户和厂商的普遍认可。但是,搜索引擎的发展格局是多方面的,市场需求的多元化也导致了搜索引擎的行业化和细分化,从而“垂直搜索引擎”成了搜索引擎发展的必然趋势之一。
所谓垂直搜索,是针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点是专、精、深,且具有行业色彩。它是与通用搜索引擎截然不同的引擎类型,是通用搜索引擎的细分和延伸,是对网页库中某类网页资源和结构化资源进行的深度整合(如果说通用搜索引擎搜索的是一次信息,那么垂直搜索就是二次信息整合的结果),定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户,并为用户提供符合操作行为的信息服务方式。(www.chuimin.cn)
垂直搜索引擎专注具体、深入的纵向服务,致力于某一特定领域内信息的全面和内容的深入,这个领域外的闲杂信息不收录。比如,用户搜索上海长宁区的可带宠物就餐的川菜馆的电话、菜单价格、交通指路等就是一种垂直搜索。
垂直搜索引擎要依靠网页爬虫技术,抓取某一个特定领域(比如一个照相机产品)中的所有相关网页。在获得这些页面后,系统要对这些网页中所包含的对象信息类型进行分类,也就是说,它要分辨某个网页究竟是一篇论文、一个博客页面,还是一个商品信息页面。在完成了这项工作后,系统就可以分门别类地将内容集成到对象信息仓库中。而这项工作需要事前进行大量的训练和模型组建。在进行了抓取、分类、抽取之后,垂直搜索引擎就可以利用这些结构化的对象信息,来应对用户的提问,并进行各种智能分析和挖掘工作。
影响较大的垂直搜索引擎有论坛搜索(如搜狗论坛搜索http://www.sogou.com/bbs/)、生活搜索(如美团https://www.meituan.com/)、商业搜索(如慧聪网www.hc360.com/)、旅游搜索(如去哪儿网www.qunar.com)、招聘搜索(如搜职网www.globehr.com)、比价搜索(如顶九网www.ding9.com)、娱乐搜索(如视频搜索( https://rankchart.org/site/openv.tv/)。
相关推荐