科学数据管理方法研究研究者主要提出两种科学数据管理方法,即多层法和实用法。Roberts进一步探讨了电子实验室记事本和科学数据管理系统的整合方式[8]。目前,科学数据管理的实施主要借助科学数据管理软件及系统。现行数据库管理系统仍可运用于科学数据管理。云服务也逐渐成为科学数据管理的工具之一。关于本体和元数据在科学数据管理中的应用研究①本体在科学数据管理中的应用。......
2023-11-22
本部分结合关键词词频和因子分析的结果,确定了科学数据研究的8大主题。从数据库中获得相关主题文献的全文,通过深入分析文献内容,剖析这些主题的研究内容和结构,进而探讨目前国内科学数据研究所呈现出的特征。
(1)研究分布的8大主题
①科学数据共享和数据共享平台。
国内对科学数据共享的研究主要涉及以下4个方面:a)科学数据共享的动力分析。如张晋朝采用问卷调查方法,通过结构方程模型分析了影响我国高校科研人员科学数据共享意愿的关键因素[85]。b)图书馆、科研机构等机构参与科学数据共享。如黄筱瑾等探讨了研究型图书馆与科学数据共享的关系,指出不同类型图书馆应根据自身的服务能力及服务对象的需求提供不同类型的科学数据共享服务[86]。c)不同技术在科学共享中的应用,包括本体、元数据、网格等。如李丽亚等构建了基于Ontology的数据共享检索体系,并实现了简单的语义查询功能[87]。d)科学数据共享的模式和实践。如左建安和陈雅提出了大数据环境下科学数据共享的4种模式:国家政策驱动、部门之间交换、企业发展带动以及国际组织参与[88]。
科技部在2002年和2003年分别启动的“国家科学数据共享工程”和“国家基础条件平台建设”项目,引发了科学数据共享平台建设与研究的热潮。地球、气象、林业、水利、机械、资源环境等不同学科和专业领域的学者均探讨了相应领域中数据共享平台中数据资源建设、数据资源分类与编码、数据安全、数据汇交、网站总体设计、平台的架构与实现、互操作等问题。如诸云强等基于Java EE环境,研制开发了分布式地球系统科学数据共享平台,能够实现跨部门、跨系统的部署[89]。
②科学数据组织与分类。
科学数据分类与组织是科学数据管理、集成和服务的基础。早期的研究主要包括元数据和XML等数据标引技术、分类和编码体系以及传统的信息组织方法的应用。如耿庆斋等提出了多维组合的水利科学数据分类体系结构,构建了由科学属性、获取方法、数据载体和时空定位组成的多维水利科学数据分类体系,并对其进行了规范化的编码设计[90]。
随着对语义网技术研究的深入,数据资源的组织方法不再仅仅从数据资源的表面特征入手,而是逐渐深入至数据资源的概念和语义,出现了一些基于本体、关联数据、生命周期的数据组织的理论与方法。如房小可指出图书馆可以从实体命名、实体资源描述框架描述、实体关联胡和实体的发布等方面构建科学数据的组织模型[91]。
③科学数据监护与服务。
国外图书情报界对数据监护(Data Curation,DC)的研究涉猎较广,从其历史背景、概念界定、战略规划的制定、数据标准、关键技术到相关法律制定等都作了很多探索性研究与实践[92]。然而,DC在国内图书情报界还是一个新兴的研究领域,目前还没有相关实践探索,理论研究主要集中在:a)国外的机构、组织及高校图书馆等有关DC的会议、培训、项目和实践活动及其最新进展。b)国内图书馆可开展的DC服务,包括数据保存、数据共享和教育培训等服务类型,分析开展此项服务面临的问题,并提出相应的对策[93]。c)在国内实施DC的方法和途径,包括制定明确的DC规划和发展策略、培训数据监护人才、完善高校图书馆数字资源长期保存机制等[94]。
随着科学研究逐渐向数据密集型科研转变,科研信息服务也由传统的文献服务转向科学数据服务。国内科学数据服务研究主要关注以下3个方面:a)科学数据服务的内容与方式。主要包括数据存储与发布服务、数据发现与获取服务、数据管理规划服务、数据分析服务、数据引用服务和用户社区服务等[95]。b)科学数据服务中技术的应用。涉及数据共享平台的构建技术、数据存储、访问和获取技术、SOA技术、语义集成技术、云计算和虚拟化技术等。c)图书馆参与科学数据服务。研究主要包括科学数据服务引发的图书馆未来发展定位、战略规划问题、图书馆参与科学数据服务的角色定位、图书馆可提供的科学数据服务方式及基于科学数据服务的信息素养教育等[96]。
④科学数据整合。
整合集成海量与异构的科学数据资源是实现科学数据管理和共享的基础。目前在实际应用中已经形成了一些较为成熟的整合方式,主要包括基于数据仓库和基于中间模式的整合方式[97]。随着数据仓库应用和网络技术的发展,基于数据仓库的整合方式有了一些新的发展,如整合的对象由异构数据库向Web数据发展、利用数据挖掘等技术实现决策服务等更深层次的服务。基于中介模式的整合方式主要是采用中间件,中间件构建方法主要有两种:基于XML和基于语义模型的构建[98]。这种方式的新发展体现在开始利用Web Service、网格中间件等相关技术实现面向服务的集成整合。另外,为了解决数据整合中的语义异构问题,研究者开始关注利用具有较强语义概念的本体来解决数据整合中的语义不一致的问题。
⑤科学数据政策与开放获取。
科学数据的管理和共享需要政策的支持和引导,国外在科学数据政策的制定和研究起步较早。国内相关研究主要侧重于对英、美和澳大利亚等发达国家科学数据政策的调查和分析。从结构层次上看,科学数据政策体系应该是由宏观(国家)、中观(科研资助机构)、微观(科研机构、高校、出版机构等)层面分别制定的科学数据政策共同组成。从内容上看,科学数据政策体系的内容至少应该涵盖数据产生与汇交政策、数据管理与共享政策、数据保管与利用政策、技术支持政策。裴雷结合我国科学数据相关政策进行了实证研究,构建了上下位政策概念的一致性指标测算框架,讨论了12个领域数据共享政策在吸收、扩散和创新过程中的政策文本质量,并提出改进建议[99]。
相关的科学数据保存和共享政策的制订,极大地促进了数据的开放获取。国内对科学数据开放获取的研究主要集中在科学数据公共获取的障碍、开放科学数据的相关政策、科学数据的开放注册和引用、开放科学数据仓储与数据共享平台等。陈传夫较早地关注了科学数据的公共获取问题,分析了科学数据获取方面存在的障碍,提出促进科学数据公共获取的建议[100]。随后,刘细文和熊瑞分析了英美以及众多国际组织与研究机构的开放获取政策的特点,认为其体现出围绕科学数据交流渠道各环节的特征[101]。另外,黄永文等对国外3个开放科学数据仓储进行了介绍和比较,指出唯一标识符(DOI)和CC协议的采用有利于科学数据的开放共享和再利用[102]。
⑥网格技术的应用。
网格是一个集成的计算和资源环境,其目标是将分布在不同地理位置上的网络、数据、计算资源、存储、应用等在内的资源整合成一个无缝的计算环境[103]。科学数据网格(SDG)是其在国内的主要应用。SDG是中科院科研信息化环境建设中的一个试点项目,建立在海量数据资源的基础上,旨在利用网格技术达到大规模、分布、异构的数据资源的集成和共享,并以网格服务的形式提供数据服务的发布、查找和调用[104]。
目前科学数据网格以Globus为基础提供数据访问和统一服务接口,但本质上还是C/S模型,在发布和发现服务上采用集中式模式,对海量数据访问低效。周园春等在结合P2P特点的基础上,提出了一种新的数据访问中间件框架,具有可扩展性、数据访问高效性等特点[105]。另外,科学数据网格环境下数据传输技术、数据资源节点信任评价系统、信息服务技术、分布式查询处理技术的关注也不断增加。
⑦科学数据挖掘。
科学数据海量增长的态势,使得科学数据挖掘技术在数据分析、聚类、关联、知识发现以及趋势预测等各项应用中变得尤为重要。由于数据的高维度、时变、时空相关等特性,使得现有的数据挖掘技术不能够完全适应这些特性,很多学者探讨如何将传统的数据挖掘方法包括基于决策树的方法、基于神经网络的方法、基于遗传算法的方法、贝叶斯方法、基于粗糙集的方法等应用在科学数据挖掘中,提高挖掘的效率与精度。另外,针对当前对科学数据特征表示的深度不够的问题,孙巍提出了一种基于复合文本描述的科学数据特征的表示方法,提高了科学数据聚类的效果[106]。
⑧科学数据管理。
科学数据管理的研究主要集中在:a)国外科学数据管理与服务实践。如彭建波归纳了北美人文社会科学数据管理典型案例的特点,对我国开展人文社会科学数据管理提出了建议[107]。b)科学数据管理工具与模式,涉及科学数据管理系统与平台、科学数据可视化分析系统、科学数据管理的方法与程序和科学数据管理框架等。c)科学数据管理政策。主要包括宏观和微观两个层面,宏观政策为科学数据的管理和共享提供法律上的依据[108],微观层面主要体现在组织、机构等的数据发展与管理政策。d)科学数据管理的教育与培训。主要是对国外培训项目的介绍,目前国内图书情报专业课程设置中还未曾见到与科学数据管理相关的课程。
(2)研究特点分析
通过因子分析和对文献内容的研究,国内学者对科学数据的研究已经形成了相对集中的主题领域,我们可以对科学数据的研究特点做进一步的探讨。第一,从上述8大主题的研究深度来看,部分主题还停留在基础理论的研究阶段。以科学数据共享主题为例,主要探讨了数据共享的方法与机制,并没有深入探究科研人员对科学数据需求状况、数据共享中利益平衡问题以及科学数据共享中的障碍因素。第二,许多新兴主题研究力度不够,难以单独形成体系。通过对关键词的统计分析,发现“云计算”“关联数据”等主题正在逐步成长为新的热点,但由于关注度和研究力度不够,使得它们在共词分析中只能依附于其他主题。第三,部分研究主题内容相互交叉。例如,“科学数据共享和数据共享平台”和“科学数据监护与服务”这两个主题均涉及科学数据服务的研究。
本研究以近十年国内科学数据研究的582篇文献的高频关键词为数据基础,通过共词分析方法对研究主题和结构进行了分析,揭示了国内科学数据8大研究主题,分别为科学数据共享和数据共享平台、科学数据组织与分类、科学数据监护与服务、科学数据整合、科学数据政策与开放获取、网格技术的应用、科学数据挖掘、科学数据管理,对了解国内科学数据研究的主题具有较大的参考价值。需要指出的是,本研究尚属于探索性研究,还存在着一些不足。首先,在高频词的阈值确定方面,没有足够的理论支撑,阈值的确定很大程度上依赖于以往的经验,具有一定的主观性。其次,所研究的文献类型为期刊论文,并没有包括学位论文等其他文献,如果将其他类型的文献统计在内,可能会对本研究的结论有一定的修正作用。另外,还可以利用CiteSpace等软件对共引作者、机构等进行分析,展示当前科学数据领域的研究进展和前沿。
【注释】
[1]Data Science Journal[EB/OL].[2015-02-11].http://www.datasciencejournal.org/.
[2]Open Data&Information for A Changing Planet.CODATA 23(2012)[EB/OL].[2015-02-11].http://www.codata2012.com/.
[3]XLDB.XLDB(2012)Conference Program[EB/OL].[2015-02-11].http://www-conf.slac.stanford.edu/xldb2012/ProgramC.asp.
[4]National Research Council of the National Academies.A Review of the U.S.Global Change Research Program’s Draft Strategic Plan(2011)[EB/OL].[2015-02-10].http://www.nap.edu/catalog.php?record_id=13330.
[5]UK e-Science All Hands Meeting 2011[EB/OL].[2015-02-10].http://www.allhands.org.uk/.
[6]Data Science Summit 2012[EB/OL].[2015-02-10].http://www.greenplum.com/datasciencesummit.
[7]Simon Wood.Comprehensive Laboratory Informatics:A Multilayer Approach[J].American Laboratory,2007(16):20-23.
[8]Nathan William Roberts.Automation of Laboratory Activities through Integration of an Electronic Laboratory Notebook(ELN)with a Scientific Data Management System(SDMS)[D].Bloomington:Indiana University,2006.
[9]Charles P.Schmitt,Margaret Burchinal.Data Management Practices for Collaborative Research[EB/OL].[2012-05-15].http://www.frontiersin.org/child_and_neurodevelopmental_psychiatry/10.3389/fpsyt.2011.00047/full.
[10]Luis Martinez-Uribe,Stuart Macdonald.User Engagement in Research Data Curation[C].Proceedings of the 13th European Conference on Research and Advanced Technology for Digital Libraries.Berlin:Springer,2009:309-314.
[11]Nick Nay,et al.Towards Lensfield:Data Management,Processing and Semantic Publication for Vernacular E-science[C].Proceedings of the 5th IEEE International Conference on eScience.New York:IEEE,2009:352-357.
[12]Monika Nøhr Løvgreen,et al.MyCrystals—A Simple Visual Data Management Program for Laboratory-scale Crystallization Experiments[J].Journal of Applied Crystallography,2009(4):741-742.
[13]I.Leon,et al.ESA New Generation Science Archives:State of the Art Data Management Techniques for SOHO and EXOSAT Science Archives[C].Proceedings of the 19th ASP Conference on Astronomical Data Analysis Software and Systems.San Francisco:Astronomical Society of the Pacific,2010:201-204.
[14]Steve Androulikis,et al.ARCHER—e-Research Tools for Research Data Management[J].The International Journal of Digital Curation,2009(1):22-33.
[15]David T.Liu.Data Centric Scientific Workflow Management Systems[D].Berkley:University of California,Berkley,2007.
[16]DataOne.DMPTool Goes Live[EB/OL].[2012-06-23].http://www.dataone.org/news/dmptool-goes-live.
[17]Federa Geo Data Commission.Geospatial Platform[EB/OL].[2012-05-23].http://www.geoplatform.gov/home/.
[18]Reza Akbarinia,Vidal Martins.Data Management in the APPA System[J].Journal of Grid Computing,2007(5):303-317.
[19]Mark G.Beckett,et al.Building A Scientific Data Grid with DIGS[EB/OL].[2012-06-29].http://rsta.royalsocietypublishing.org/content/367/1897/2471.full.pdf.
[20]Jaechun No,Hyoungwoo Park.GEDAS:A Data Management System for Data Grid Environments[C].Proceedings of the 5th International Conference on Computational Science.Berlin:Springer,2005:485-492.
[21]Mark Hedges,et al.Rule-based Curation and Preservation of Data:A Data Grid Approach Using iRODS[J].Future Generation Computer Systems,2009(4):446-452.
[22]Jim Gray,et al.Scientific Data Management in the Coming Decade[EB/OL].[2012-03-30].http://arxiv.org/ftp/cs/papers/0502/0502008.pdf.
[23]Johan Tysklind.Wrapping a Scientific Data Management System[D].Uppsala:Uppsala University,2005.
[24]Jurgen Bernard,et al.A Visual Digital Library Approach for Time-Oriented Scientific Primary Data[C].Proceedings of the 14th European Conference on Research and Advanced Technology for Digital Libraries.Berlin:Springer,2010:352-363.
[25]C.Curdt,et al.Management and Visualization of Interdisplinary Research Data with ArcGIS Server[EB/OL].[2012-04-20].http://proceedings.esri.com/library/userconf/proc09/uc/papers/pap1177.pdf.
[26]Sangmi Lee Pallickara,et al.Scientific Data Management in the Cloud:A Survey of Technologies,Approaches and Challenges[M]//Borko Furht.Handbook of Cloud Computing.Berlin:Springer,2010:517-533.
[27]Ewa Deelman,et al.The Cost of Doing Science on the Cloud:The Montage Example[EB/OL].[2012-06-27].http://pegasus.isi.edu/publications/2008/deelman_sc08_corrected.pdf.
[28]UK National e-Science Centre.The Tenth e-Science All Hand Meeting(AHM)[EB/OL].[2012-07-28].http://www.allhands.org.uk/.
[29]Brian Atkin,et al.Curation in the Cloud[EB/OL].[2012-05-26].http://www.dcc.ac.uk/webfm_send/779.
[30]Joseph Edward Heyward.Selection of A Scientific Data Management System(SDMS)Based on User Requirements[D].Bloomington:Indiana University,2008.
[31]Meredith Nahm,Jiajie Zhang.Operationalization of the UFuRT Methodology for Usability Analysis in the Clinical Research Data Management Domain[J].Journal of Biomedical Informatics,2009(2):327-333.
[32]Yuan-Fang Li,et al.PODD—Towards an Extensible,Domain-agnostic Scientific Data Management System[C].Proceedings of the 6th IEEE International Conference on e-Science.New York:IEEE,2010:137-144.
[33]Peter Fox,et al.Ontology-supported Scientific Data Frameworks:The Virtual Solar-Terrestrial Observatory Experience[J].Computers&Geosciences,2009(4):724-738.
[34]Sandra Geisler,et al.Ontology-based System for Clinical Trial Data Management[EB/OL].[2012-04-11].http://www.ti.rwth-aachen.de/publications/output.php?id=642&table=proceeding&type=pdf.
[35]Hu Changjun,et al.Ontology-Based Semantic Integration Method for Domain-Specific Scientific Data[A].Proceedings of the 8th ACIS International Conference on Software Engineering,Artificial Intelligence,Networking,and Parallel/Distributed Computing.Washington:IEEE Computer Society,2007:772-777.
[36]Michael Witt,et al.Constructing Data Curation Profiles[J].The International Journal of Digital Curation,2009(3):93-103.
[37]Jane Greenburg,et al.A Metadata Best Practice for A Scientific Data Repository[J].Journal of Library Metadata,2009(9):194-212.
[38]Zhou Linhua,et al.Ontology-based Scientific Data Service Composition:A Query Rewriting-based Approach[EB/OL].[2012-04-08].http://www.aaai.org/Papers/Symposia/Spring/2008/SS-08-05/SS08-05-024.pdf.
[39]Virginia A.de Wolf,et al.Part I:What is the Requirement for Data Sharing?[J].The Hastings Center,2005(6):12-16.
[40]OECD.OECD Principles and Guidelines for Access to Research Data from Public Funding[EB/OL].[2012-05-25].http://www.oecd.org/dataoecd/9/61/38500813.pdf.
[41]WDS.WDS Data Policy[EB/OL].[2012-05-26].http://www.icsu-wds.org/organization/data-policy.(www.chuimin.cn)
[42]Raivo Ruusalepp.A Comparative Study of International Approaches to Enabling the Sharing of Research Data[EB/OL].[2012-06-05].http://www.jisc.ac.uk/media/documents/programmes/preservation/national_data_sharing_report_final.pdf.
[43]ICPSR.National Archive of Criminal Justice Data[EB/OL].[2012-05-26].http://www.icpsr.umich.edu/icpsrweb/NACJD/.
[44]NSF.Grant Proposal Guide[EB/OL].[2012-05-28].http://www.nsf.gov/publications/pub_summ.jsp?ods_key=gpg.
[45]Nell Sedransk,Linda J.Young,Katrina L.Kelner,et al.Make Research Data Public?—Not Always so Simple:A Dialogue for Statisticians and Science Editors[J].Statistical Science,2010(1):41-50.
[46]ICPSR National Archive of Criminal Justice Data[EB/OL].[2012-05-26].http://www.icpsr.umich.edu/icpsrweb/NACJD/.
[47]RIN.Research Funders'Policies for the Management of Information Outputs[EB/OL].[2015-02-11].http://www.rin.ac.uk/our-work/research-funding-policyand-guidance/research-funders-policies-management-information-outpu.
[48]RCUK.RCUK Common Principles on Data Policys[EB/OL].[2012-05-24].http://www.rcuk.ac.uk/research/Pages/DataPolicy.aspx.
[49]Science Commons.Science Commons Projects[EB/OL].[2012-05-26].http://sciencecommons.org/projects/.
[50]Rodrigo Dias Arruda Senra,Claudia Bauzer Medeiros.SciFrame:A Conceptual Framework to Describe Datasharing in e-Science[J/OL].[2012-05-26].http://www.lis.ic.unicamp.br/Members/rodsenra/sciframe-a-conceptual-framework-todescribe-data-sharing-in-e-science/.
[51]Todd J.Green,Grigoris Karvounarakis,Nicholas E.Taylor.Orchestra:Facilitating Collaborative Data Sharing[EB/OL].[2012-05-26].http://www.db.cis.upenn.edu/DL/07/sigmod07-demo.pdf.
[52]Caroline J.Savage,Andrew J.Vickers.Empirical Study of Data Sharing by Authors Publishing in PLoS Journals[J/OL].[2012-05-26].http://www.plosone.org/article/info:doi/10.1371/journal.pone.0007078.
[53]PARSE.PARSE Insight[EB/OL].[2012-05-26].http://www.parse-insight.eu/downloads/PARSE-Insight_D3-4_SurveyReport_final_hq.pdf.
[54]Carol Tenopir,Suzie Allard,Kimberly Douglass,et al.Data Sharing by Scientists:Practices and Perceptions[J/OL].[2012-05-25].http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101.
[55]Dale Peters.Open Access to Science Data:Why Research are Reluctant to Share[EB/OL].[2012-05-26].http://researchspace.ukzn.ac.za/xmlui/handle/10413/7307.
[56]Christine L.Borgman,Jillian C.Wallis,Noel Enyedy.Little Science Confronts the Data Deluge[J].International Journal on Digital Libraries,2007,vol(7),issue(1-2):17-30.
[57]Nell Sedransk,Linda J.Young,Katrina L.Kelner,et al.Make Research Data Public?—Not Always so Simple:A Dialogue for Statisticians and Science Editors[J].Statistical Science,2010(1):41-50.
[58]ICPSR.National Archive of Criminal Justice Data[EB/OL].[2012-05-26].http://www.icpsr.umich.edu/icpsrweb/NACJD/.
[59]Winston Tabb.Copyright Issues Affecting Digital Libraries:What Librarians should Know and Do[J/OL].[2012-06-29].http://www.lib.sjtu.edu.cn/adls/download/12-16/1216AM-C1.pdf.
[60]Luis Martinez Uribe,Stuart Macdonald.A New Role for Academic Librarians Data Curation[J/OL].[2012-04-10].www.era.lib.ed.ac.uk/bitstream/1842/3207/6/data_role.doc.
[61]Gold Anna.Cyberinfrastructure,Data,and Libraries,part 1:A Cyber infrastructure Primer for Librarians[J].D-Lib Magazine,2007(13):9-10.
[62]G.S.Choudhury,C.Lynch.Initiatives from the NSF's DataNet Program:DataONE and the Data Conservancy[EB/OL].[2012-04-22].https://jscholarship.library.jhu.edu/handle/1774.2/33953.
[63]Choudhury G.S.Case Study in Data Curation at Johns Hopkins University[J].Library Trends.2008,57(2):211-220.
[64]S.Madnick,M.Smith,K.Clopeck.How much Information?Case Studies on Scientific Research at MIT(HMI case studies)[J/OL].[2012-04-15].http://web.mit.edu/smadnick/www/wp/2009-16.pdf.
[65]W.Lougee,N.Rambo.Library Engagement with E-Science[EB/OL].[2012-04-18].http://www.arl.org/bm~doc/mm152_lougee.pps.
[66]Leslie M.Delserone.At the Watershed:Preparing for Research Data Management and Stewardship at the University of Minnesota Libraries[J].Library trends.2008,57(2):202-210.
[67]Columbia University Library.GIS&Statistical Data Resources[EB/OL].[2012-7-20].http://library.columbia.edu/indiv/dssc/data.html.
[68]Research Data Services.Digital Curation at the University of Wisconsin-Madison[EB/OL].[2012-07-19].http://researchdata.wisc.edu/.
[69]T.O.Walters.Data Curation Program Development in U.S.Universities:The Georgia Institute of Technology Example[J].The International Journal of Digital Curation,2009(3):83-92.
[70]CUL Data Working Group.Digital Research Data Curation:Overview of Issues,Current Activities,and Opportunities for the Cornell University Library[J/OL].[2012-05-20].http://ecommons.cornell.edu/bitstream/1813/10903/1/DaWG_WP_final.pdf.
[71]Gold Anna.Data Curation and Libraries:Short-Term Developments,Long-Term Prospects[EB/OL].[2012-05-08].http://digitalcommons.calpoly.edu/lib_dean/27.
[72]M.Witt,et al.Constructing Data Curation Profiles[J].International Journal of Digital Curation,2009,4(3):137-165.
[73]Catherine Soehner,Catherine Steeves,Jennifer Ward.E-Science and Data Support Services:A Study of ARL Member Institutions[EB/OL].[2012-06-27].http://www.arl.org/bm~doc/escience_report2010.pdf.
[74]A.Swan,S.Brown.Skills,Role and Career Structure of Data Scientists and Curators:An Assessment of Current Practice and Future Needs[EB/OL].[2012-05-20].http://eprints.ecs.soton.ac.uk/26675.
[75]M.H.Cragin.et al.An Educational Program on Data Curation[EB/OL].[2012-05-03].http://www.ideals.illinois.edu/handle/2142/3493.
[76]Syracuse University.The Science Data Literacy Project[EB/OL].[2012-05-20].http://sdl.syr.edu/.
[77]Archivschule Marburg.Studiengang Master of Records Management[EB/OL].[2012-05-26].http://www.archivschule.de/master-of-records-management/.
[78]DataONE.Short Course on Data Management[EB/OL].[2012-06-23].http://www.dataone.org/data-management-short-course.
[79]M.H.Cragin.et al.Extending the Data Curation Curriculum to Practicing LIS Professionals[C].Proceedings of DigCCurr 2009.Chapel Hill:University of North Carolina at Chapel Hill,2009:92-93.
[80]王巧玲,钟永恒,江洪.我国科学数据共享研究的文献计量分析[J].情报杂志,2008(7):128-130.
[81]姜晓虹.国内科学数据相关研究进展分析[J].图书情报工作,2009,53(13):50-53.
[82]李武,董伟.国内开放存取的研究热点:基于共词分析的文献计量研究[J].中国图书馆学报,2010(6):105-115.
[83]陆宇杰,张凤仙,范并思.基于共词分析的高校图书馆核心价值研究[J].大学图书馆学报,2012(6):34-40.
[84]马费成,望俊成,张于涛.国内生命周期理论研究知识图谱绘制[J].情报科学,2010(3):334-340.
[85]张晋朝.我国高校科研人员科学数据共享意愿研究[J].情报理论与实践,2013,36(10):25-30.
[86]黄筱瑾,朱江,李菁楠.研究型图书馆参与科学数据共享服务研究[J].图书馆论坛,2009,29(6):177-179.
[87]李丽亚等.基于Ontology的科学数据共享检索体系解析[J].情报理论与实践,2009(5):81-85.
[88]左建安,陈雅.基于大数据环境的科学数据共享模式研究[J].情报杂志,2013(12).
[89]诸云强等.分布式地球系统科学数据共享平台研究[J].计算机工程与应用,2009,45(1).
[90]耿庆斋,张行南,朱星明.基于多维组合的水利科学数据分类体系及其编码结构[J].河海大学学报(自然科学版),2009(3):23.
[91]房小可.基于关联数据的高校图书馆科学数据组织研究[J].图书馆建设,2013(10):31-44.
[92]吴敏琦.Digital Curation:图书情报学的一个新兴研究领域[J].图书馆杂志,2012(3):8-12.
[93]沈婷婷,卢志国.数据监管在我国高校图书馆的应用展望[J].图书情报工作,2012,56(7):54-57.
[94]程莲娟.美国高校图书馆数据监护的实践及其启示[J].图书馆杂志,2012,31(1):76-78.
[95]洪程.国外科学数据服务现状研究[J].图书馆杂志,2012,10:31-34.
[96]肖潇,吕俊生.e-Science环境下国外图书馆科学数据服务研究进展[J].图书情报工作,2012,56(17):53-58.
[97]马文峰,杜小勇.基于数据的资源整合[J].情报资料工作,2007(1):41-45.
[98]白如江,冷伏海.“大数据”时代科学数据整合研究[J].情报理论与实践,2014(1):94-99.
[99]裴雷.我国科学数据共享政策概念一致性与政策质量评估[J].情报理论与实践,2013,36(9):28-31.
[100]陈传夫.中国科学数据公共获取机制:特点,障碍与优化的建议[J].中国软科学,2004(2):8-13.
[101]刘细文,熊瑞.国外科学数据开放获取政策特点分析[J].情报理论与实践,2009(9):5-9.
[102]黄永文等.国外开放科学数据研究综述[J].现代图书情报技术,2013(5):21-27.
[103]宋佳等.人地系统科学数据网格[J].科研信息化技术与应用,2011,2(2):82-89.
[104]张西广等.科学数据网格研究进展倡[J].计算机应用研究,2009,26(10):3601-3603.
[105]周园春等.科学数据网格中数据访问中间件的研究[J].微电子学与计算机,2006,23(11):44-46.
[106]孙巍.一种基于复合文本描述的科学数据特征表示方法[J].现代图书情报技术,2009(5):22-27.
[107]彭建波.北美人文社会科学数据管理的实践及其启示[J].大学图书馆学报,2013(6):33-37.
[108]孟祥保,钱鹏.高校社会科学数据管理的国际经验及其借鉴[J].情报资料工作,2013(2):77-80.
有关科学数据管理与共享的理论与实践的文章
科学数据管理方法研究研究者主要提出两种科学数据管理方法,即多层法和实用法。Roberts进一步探讨了电子实验室记事本和科学数据管理系统的整合方式[8]。目前,科学数据管理的实施主要借助科学数据管理软件及系统。现行数据库管理系统仍可运用于科学数据管理。云服务也逐渐成为科学数据管理的工具之一。关于本体和元数据在科学数据管理中的应用研究①本体在科学数据管理中的应用。......
2023-11-22
e-Science环境下,科学数据呈指数级增长,图书馆在发挥其科学数据保存和服务方面具有不可替代的地位和作用。麻省理工学院图书馆的HMI项目实现了对地理学科数据管理的MIT地理数据知识库的数据创建及管理[64]。科学数据管理服务中的合作机制国外图书馆在开展科学数据管理服务时大多采取合作机制,强调学科馆员与科研人员的密切合作。......
2023-11-22
《UNESCO指南》将在国家与国际层面的决策和政策制定者中得到广泛应用。至2014年9月,WDC在全球共有89个数据中心,这些数据中心几乎涵盖了地球和日地关系科学的各个领域,每个数据中心承担了汇集某个领域的科研数据并承担向科技界开放和服务的任务。②所有将要共享的数据、元数据和资料都应在最短的时间内以最低的成本提供共享。此外,WDS于2011年9月在......
2023-11-22
我们以Bio2RDF项目为例来探讨利用关联数据技术实现科学数据的集成与共享的具体方法与机制。目前,Bio2RDF项目发布了第二个版本即Bio2RDF R2。而Bio2RDF R2目前更新了第一个版本14个数据集并新增了5个数据集,具备以下新的特征。其中,namespace是数据集在数据注册中心的简称,identifier是由Bio2RDF的脚本创建和分配的标识符。在Bio2RDF关联数据的发布过程中由于资源的多样性和发布的离散性等原因面临着URI共指的问题。......
2023-11-22
与科学数据保存与共享的成本相比,数据保存与共享的成本更加难以识别和确认。基于效益分类的数据共享效益识别模型Beagrie等将数据保存与共享的效益划分为三个维度进行考察[32],见表7-12。因而,我们应全面考虑数据保存与共享所产生的成本。另一方面,相对于数据保存与共享的成本,数据共享所产生的效益较难以量化评估,但我们可以从用户通过数据共享带来的成本节省途径来进行识别和量化。......
2023-11-22
随着人们对科学数据共享重要性认识的不断提高,越来越多的科研资助机构要求受资助者在申请科研资助时提交相应的数据管理计划,阐明研究者将如何对科研过程中产生的科学数据进行管理与使用。这些机构大多在其资助指南中明确规定资助申请者须提交数据管理计划。当申请项目被批准后,管理者会对提交的年度进展和最终报告中对数据管理计划的实施进行评估。......
2023-11-22
国际科技数据委员会国际科技数据委员会是国际科学理事会于1966年建立的一个跨学科学术委员会,致力于提高科技数据的质量、可靠性、管理和可获取性,推动和鼓励对科学技术有重要价值的可靠的数值数据进行编辑、评价、传播。目前,项目先后成功召开了巴西圣保罗会议、南非普里托利亚会议和美国华盛顿会议,相关活动正按计划进行。......
2023-11-22
调查还显示,部分图书馆新设数据监护部、数字学术和服务中心等部门,专门负责科学数据管理服务的设计和实施。不仅如此,一些名称相同的岗位,其工作职责也存在较大差异。而据我们调查,著名的iSchool联盟已有25所学院开设与科学数据管理有关的课程,占成员总数近2/3。因此,建立科学数据管理人才培育体系对我国图书情报教育机构而言应是当务之急。......
2023-11-22
相关推荐