首页 理论教育 系统API优化措施解析

系统API优化措施解析

【摘要】:1)Lucene图2-20文本信息聚类图Lucene是一个高性能、规模化的信息检索库,是由Java实现的成熟、免费的开源项目。Lucene提供了一个简单强大的核心API,它可以方便地嵌入到各种应用中实现全文索引/检索功能。表2-2搜索Lucene接口2)OpenSearchOpenSearch是一个技术集合体,允许搜索结果以一种适用于聚合的形式发布。OpenSearch Aggregators:显示OpenSearch结果的站点。OpenSearch Auto-Discovery:标志链接到用户的搜索插件及嵌入在HTML页面header头部中的链接。另外系统使用的API还有Yahoo News,Yahoo Search API,eTools,MSN API,Solr。

1)Lucene

图2-20 文本信息聚类图

Lucene是一个高性能、规模化的信息检索库,是由Java实现的成熟、免费的开源项目。Lucene提供了一个简单强大的核心API,它可以方便地嵌入到各种应用中实现全文索引/检索功能。Lucene在实现中,不是维护一个索引文件,而是在扩展索引的时候不断创建新的索引文件,然后定期把这些新的小索引文件合并到原先的大索引中(针对不同的更新策略,批次的大小可以调整),这样在不影响检索效率的前提下,提高了索引的效率。Lucene组成结构:对于外部应用来说,索引模块(index)和检索模块(search)是主要的外部应用入口。

表2-2 搜索Lucene接口

2)OpenSearch

OpenSearch是一个技术集合体,允许搜索结果以一种适用于聚合的形式发布。它为网站和搜索引擎的结果发布提供了一种标准可访问的格式。

OpenSearch包括:

•OpenSearch Description files:识别和描述一个搜索引擎的XML文件。

•OpenSearch Query Syntax:描述搜索引擎中检索位置信息。

•OpenSearch Aggregators:显示OpenSearch结果的站点。

•OpenSearch Auto-Discovery:标志链接到用户的搜索插件及嵌入在HTML页面header头部中的链接。

OpenSearch Description Documents描述文档列出了给定站点和工具的搜索结果列表。

另外系统使用的API还有Yahoo News,Yahoo Search API,eTools,MSN API,Solr。这里就不详细介绍了。