首页 理论教育开放型机构知识库著作权管理:OAI服务提供者

开放型机构知识库著作权管理:OAI服务提供者

【摘要】:2002年6月OAIster发布时仅有66家数据提供者和23.5万条记录。

5.1.2.1 OAI服务提供者构成

2012年9月,笔者对OAI网站上注册的服务提供者(SP)进行了调研。32家注册SP目前只有19家能够有效访问。分析可见:①地理分布:美国5家,德国3家,法国、意大利各2家,其他国家各1家;②主办者性质:由政府、学会主办的SP 有16家,由商业机构主办的有3家。其中,Scirus是由Elsevier主办的商业性SP,记录多达4.6亿条;③学科范围:3家SP提供专题性学科服务,15家提供综合学科服务,1家提供技术服务;④资源采集范围:6家从本国采集,13家从国际采集资源;⑤服务功能方面:15家SP提供搜索和链接,2家提供作者索引和引用分析,少数SP还提供订阅、虚拟社区、参考文献链接、项目指南、wiki、P2P和标签服务。与笔者2009年的调查相比,SP大浪淘沙,变化较大。除了一些著名SP(如德国的BASE、美国的ARC)以及商业性SP(如Scirus),许多已悄然消失在茫茫互联网中。

5.1.2.2 OAI服务提供者的层次性

根据SP采集资源的上下游关系可以划分其相对位置和层次。例如美国的Arc从ArXiv.org和学位论文数字图书馆网(Networked Digital Library of Theses and Dissertations,NDLTD)采集元数据,就是ArXive和NDLTD的下游SP。而当其他计算机科学的学科SP从Arc采集元数据时,Arc就成为了下游SP的数据提供者(DP),因此SP的上下游层次关系是相对的。

5.1.2.3 OAI服务提供者的功能[103]

(1)元数据采集与维护:①定期向数据提供者抓取元数据资料,以便更新联合目录中的元数据。抓取条件包括数据集(set)、日期(date)、标识(identifier)和格式(format)等,抓取频率由SP自行设定;②允许数据提供者登陆、上载并更新元数据。③存储和维护多个数据提供者的元数据,提供各种元数据框架之间的映射。

(2)浏览功能:①可将数据提供者、作品类型、作者、主题、时间、地点等元数据提取出来作为支持浏览功能的主题目录;②采用模块方式编制目录,能够识别已处理和未处理的数据;③将图片资料以缩略图的方式编制索引,再与原图存储单位的大图相链接。

(3)查询功能:①能够提供搜索框检索、模糊检索和全文检索;②提供简单查询和高级查询;③具有布尔逻辑查询、截词检索以及条件限制等功能;④能够通过数据提供者(DP)入口进行查询;⑤可以让用户选择资料的显示和排序方式,如相关度排序、时间排序等。

(4)链接原文:将“句柄”(handle)转换为URL,实现链接全文、图片或多媒体的功能。

(5)系统管理:可以划分管理员、目录维护、一般用户、数据提供者等多个授权级别。

(6)扩展功能:①作为下游SP的数据提供者,提供都柏林核心格式的元数据记录,并与其他机构交换数据;②具有将字符集CCCII,BIG-5转换为UTF-8的功能;③可以整合查询Internet的内容,具有互联网入口。(www.chuimin.cn)

(7)门户服务:意大利国家知识库服务项目PLEIADI提供的是一种门户服务。它从意大利本国的数据提供者处收割元数据,在“处理层”实现采集、分类、缓存、索引、引用分析、全文检索、统计、著作权管理等功能,最后通过“门户层”向终端用户提供获取、提醒、论坛、虚拟参考咨询和OA相关信息等服务。

(8)OAI服务提供者的功能比较。麦格纳斯·英格尔(Magnus Enger)在其硕士论文中比较了2005年注册的22家SP的功能。其中100%提供检索服务,55%有浏览功能,23%提供外部链接功能或电子商务功能。引用分析、公式检索、联合推荐、提醒服务、排行、评价等新兴功能也初见端倪[104](见表5.2)。

表5.2 OAI服务提供者的功能比较

5.1.2.4 OAI服务提供者工作原理

OAI服务提供者(SP)通常使用6个动作获取数据提供者(DP)的记录:①“GetRecord”用来从知识库检索个别元数据记录;②“Identify”检索有关知识库的信息;③“Listidentifers”用于检索记录的“头标区”(headers),但不包含元数据;④“ListMetadataFomats”用于检索元数据的格式;⑤“ListRecord”从知识库收割记录;⑥“ListSets”用于检索知识库合集(sets)的结构。由于搜索范围相对有限,故而SP的查准率比较高。

5.1.2.5 典型的OAI服务提供者

OAIster是2001年美国安德鲁·梅隆基金支持的应用OAI-PMH的7个实验项目之一。2009年OCLC和密执安大学发布合作声明,共同维护OAIster的长期发展。OAIste提供包括数字化书刊、音频、视频文件、图片和数据集等各种类型数字资源的一站式检索,初建时使用的是伊利诺伊大学的采集器。2002年6月OAIster发布时仅有66家数据提供者和23.5万条记录。此后,OAIster鼓励并帮助知识库成为数据提供者,同时也向Yahoo!,Google,ISI等开放元数据。2006年底,OAIster的检索量累计已达62.5万次。最新统计显示,其数据提供者已经超过1 100家,记录数约为2 300万条。OAIster保存和维护IR的元数据但不保存内容,通过OpenURL将用户导向知识库的学术资源,故称“数字资源的联合目录”。由表5.3可见,OAIster并入OCLC之后进展缓慢,与IR建设速度相比明显滞后。

表5.3 OAIster的成长轨迹