首页 理论教育数据组织与浏览:英美政府门户网站特点

数据组织与浏览:英美政府门户网站特点

【摘要】:英美政府最先启动了数据门户网站,二者门户网站的数据组织与查询功能也相对完善。从以上对Data.gov和Data.gov.uk数据组织和浏览、检索功能的分析,我们不难看出它们的一些特点。通过关联数据的RDF技术有效地解决了复杂多样的数据资源的描述和表示问题,降低了政府数据门户网站语义组织工作的难度。政府数据门户网站数据类型复杂多样,首先要制定统一的分类标准和索引机制进行描述、标引、分类和组织,以屏蔽不同实体对网站数据组织的差异性。

英美政府最先启动了数据门户网站,二者门户网站的数据组织与查询功能也相对完善。从以上对Data.gov和Data.gov.uk数据组织和浏览、检索功能的分析,我们不难看出它们的一些特点。

(1)对资源进行高质量的元数据描述

Data.gov和Data.gov.uk均由信息专业人员而不是资源提供者来创建元数据,部分数据资源还提供了资源提供者的元数据描述,因此元数据质量控制有了一定的保障。从科学数据共享平台本身的发展来看,平台之间的开放、合作、共享与互操作已是大势所趋。因此,Data.gov和Data.gov.uk并没有从头开始设计自己的元数据,而是选择DC元数据集为基础,从中选择所需的元素并引入新元素,制定了数据门户网站的元数据标准,包括网站核心元数据和特定领域核心元数据。特定领域核心元数据是在网站核心元数据的标准上制定的,更好地体现了特定领域科学数据资源的特色。

(2)多维数据分类体系与灵活的检索方式

Data.gov和Data.gov.uk的数据分类体系并没有采用固定的标准分类方法(先制定标准的分类体系,再将所需分类的目标置于体系之中),而是结合了数据资源的实际情况进行分类,具有较高的实用价值。二者均提供了多维数据分类体系,多个维度的结合有效地对数据资源进行描述和分类,用户可以方便快捷地找到所需的数据资源。另外,Data.gov网站整体上构建的二级分类体系,从宏观和微观两个层面组织数据资源,使数据资源的呈现方式清晰明了,并促进了数据的发现和高效利用。(www.chuimin.cn)

由于政府数据资源涉及领域广泛,数据类型复杂多样等特点,并且一般用户很难对某一领域的数据有全面的了解,英美政府数据门户网站均没有提供复杂的多字段组合的高级检索功能,而是提供了灵活便利的浏览检索方式。在用户数据需求不甚明确时,可以根据主题、数据类型、组织机构等分类体系浏览数据资源,并在选定数据分类的基础上进行检索,不仅为数据的精确检索带来了方便,而且可以帮助用户突破学科、专业的限制获取跨学科数据资源。

(3)数据组织新技术的应用

Data.gov和Data.gov.uk均已开始借鉴和吸收美国国会图书馆在关联数据发展实践方面的成功经验,关注数据资源之间的关联关系,以及如何创建、表示、组织和利用这些关联信息等。通过关联数据的RDF技术有效地解决了复杂多样的数据资源的描述和表示问题,降低了政府数据门户网站语义组织工作的难度。并且,关联数据继承了传统Web技术中的HTTP和URI技术,减少了将Data.gov和Data.gov.uk原来数据组织的成果统一到语义网中的成本。另外,关联数据为数据资源语义组织提供了规范的发布与关联标准,不仅在政府数据门户网站中发布规范描述的RDF文件,还通过RDF链接发掘并关联数据资源之间及其与外部数据集之间的各种关系,为Data.gov和Data.gov.uk构建了更广泛、内容更丰富的语义数据网络。

政府数据门户网站数据类型复杂多样,首先要制定统一的分类标准和索引机制进行描述、标引、分类和组织,以屏蔽不同实体对网站数据组织的差异性。其次,在数据资源有效组织的基础上要提供灵活方便的浏览、检索功能,兼顾数据资源的特点和用户的检索、浏览习惯。另外,语义网技术将从根本上改变互联网上数据组织和管理的形态,因此,要积极引入语义网技术如关联数据技术来加强网站数据组织与查询的功能,实现更深层次的数据服务和利用功能。目前,我国还没有开设一站式的政府数据门户网站,但随着国外政府数据门户网站的陆续开设和开放数据运动的深入,统一的数据门户网站的建设也势在必行。