首页 理论教育数据质量管理:元数据与质量关系

数据质量管理:元数据与质量关系

【摘要】:元数据是与数据有关的信息,将数据质量认为是与线性数据相关的部分,可视为互相无关。实际上,既有仅仅进行元数据管理的程序,也有不需说明元数据也可进行数据质量管理的程序。质量的对象虽然是数据,但在质量管理和数据间发挥媒介作用的是元数据。进行数据质量管理时,根据企业自身对必要性的认识,包括元数据在内的各种数据和事务以及内容都可进行管理,可采用自己探索的解决方法,也可引入数据质量管理的专业工具。

“元数据”的意思是“用与数据有关的结构化数据,对其他数据进行说明的数据”。从系统构建时创建的文件中实质说明书、属性(attribute)说明书、表说明书等可见,数据名称中有说明,列名称中也有说明,可见为构成表而管理多种信息。简单来说,这里说明的全部资料都可视为元数据的一部分。在该表中存储的信息虽然只是数据,但指代该表的表名就是元数据。

企业建立管理了大量数据库,各个数据库中不断生成数量庞大的表,各个表又由多个列构成。各个数据库、表、列内信息管理是基础,各自的说明、表间的连接关系、列间连接关系及各种信息在其他仓库(repository)中存储管理,叫做“元数据管理”。

如果正确管理元数据,当使用者需要在系统中查找信息时,不必问负责人员,只需在元数据管理系统中查找就可轻松知道在哪里以及怎样取得信息。ETL操作中,感知到表变更相关的错误后,任何人都可以轻松知道何时、因谁引起、表如何变更,可在短时间内恢复错误操作。

元数据是与数据有关的信息,将数据质量认为是与线性数据相关的部分,可视为互相无关。实际上,既有仅仅进行元数据管理的程序,也有不需说明元数据也可进行数据质量管理的程序。

企业中要构建全部管理数据相应的信息,虽然可以使用只管理元数据的程序,没有元数据,那么数据质量程序也就不可能存在。从数据质量管理分析阶段就应开始收集元数据相关信息,进行以元数据为中心的数据质量管理。

要进行数据质量管理,首先进行的基本管理就是元数据管理。首先要将企业内存在的全部数据相关信息登录一个仓库内管理,按各自不同的表、不同列利用工具一并将质量管理所需的信息存储在同一仓库内。质量的对象虽然是数据,但在质量管理和数据间发挥媒介作用的是元数据。(www.chuimin.cn)

数据质量可认为是种IT问题。实际上,数据质量管理程序依靠IT部门实施和维护,最大的受益者却是现行部门。并且,现行部门最了解各个应用软件中正在使用的数据用途和意义。因此,理解了企业内部数据质量管理的作用,想要达到期望值就要取得现有部门和IT部门的同意。

大部分企业数据质量管理解决方案构建失败的原因是,多个部门间互相推卸共用的数据质量管理责任。进行数据质量管理项目时,动员各部门的人员一同参与应该是解决这一问题的好方法。

IT部门和现行部门共同承担程序设计和执行的责任是成功的重要因素。

进行数据质量管理时,根据企业自身对必要性的认识,包括元数据在内的各种数据和事务以及内容都可进行管理,可采用自己探索的解决方法,也可引入数据质量管理的专业工具。品质管理的主要问题多在数据治理、法规遵守、MDM、大型项目推进、数据迁移时发生。