首页 理论教育商业出版者和数据库:开放型机构知识库著作权管理研究成果

商业出版者和数据库:开放型机构知识库著作权管理研究成果

【摘要】:商业出版者仍然是学术交流的主渠道,但DP,SP、商业数据库和搜索引擎之间的内容交叉重复现象十分明显。Scirus不仅汇聚了OAI收割的数据而且整合了Elsevier及其合作伙伴的商业数据库书目信息。首先,作为商业出版者,他们最关注OAI和开放内容活动的发展对商业收入的影响。目前,Scirus搜索的全球学术站点约4.4亿个,广度和深度都在OAIster之上。

商业出版者仍然是学术交流的主渠道,但DP,SP、商业数据库搜索引擎之间的内容交叉重复现象十分明显。原因大体如下:首先,多数DP(IR)收录的主要是商业数据库的核心内容——期刊论文。其次,多数DP和SP向Google等搜索引擎开放元数据,通过Google可以直接链接知识库原文。第三,不少商业数据库不仅自己提供一些开放资源还使用Google服务增加资源的可见度。最后,商业出版者也参与OAI的盛宴,例如Scirus。Scirus发布于2001年,是Elsevier创办的STM(科技医药)学术搜索引擎。其数字资源由网络资源和知识库资源两部分构成。网络资源来自URL自动提取工具、Elsevier出版集团相关主题网站、Scirus科学图书馆与技术促进委员会成员提供的资源、Scirus网管和用户建议的新站点、容易识别的新站点5个渠道。知识库资源来自合作伙伴的数据库和OAI收割的数据。其中,合作伙伴包括Elsevier自己的商业数据库ScienceDirect,美国国家医学图书馆的MEDLINE,NIH的Pubmed Central和美国专利局。OAI采集的数据来自数十家知名的IR和学科库。Scirus提供简单检索和高级检索,过滤和排序功能强大。美中不足是尚未处理好多来源作品的去重问题。

Scirus工作原理是:①底层数据来自互联网(种子列表)和Elsevier可以获取的数据库;②数据处理层对网络列表进行定向爬梳并对数据库进行OAI收割;③处理后的数据按照同一个标准体系分类;④Scirus索引;⑤根据用户查询以多种排序方式输出结果。Scirus不仅汇聚了OAI收割的数据而且整合了Elsevier及其合作伙伴的商业数据库书目信息。资源丰富、检索功能强大,未来可能成为最具潜力的“一站式”检索平台。Scirus目前提供的是“免费午餐”,但是商业组织参与OAI服务的目的非常明显。首先,作为商业出版者,他们最关注OAI和开放内容活动的发展对商业收入的影响。其次,他们具有管理信息资源的技术优势,能够快速介入该领域。第三,他们具有版权资源的优势,也就是说他们能跨到“copyleft”这边来,而OA倡导者走不到“copyright”那边去。目前,Scirus搜索的全球学术站点约4.4亿个,广度和深度都在OAIster之上。但是,其商业本质总让人提防三分。(www.chuimin.cn)