首页 理论教育数据标准化的定义与实践

数据标准化的定义与实践

【摘要】:数据标准化指的是确立分散在各个系统中的信息要素的定义、名称、格式和规则后将其推广应用到全公司的活动。数据标准化不仅有助于确认数据的正确含义,还可据此调整对数据的审视角度。数据名称是企业内唯一区分数据的名称,因此数据名称标准化需要对同音异义词和异音同义词进行定义。此外,数据定义应成为数据所有者的决定标准。描述数据定义时应考虑以下事项。数据格式的定义应与业务规则和使用目的一致。

数据标准化指的是确立分散在各个系统中的信息要素的定义、名称、格式和规则后将其推广应用到全公司的活动。数据标准化不仅有助于确认数据的正确含义,还可据此调整对数据的审视角度。

数据名称是企业内唯一区分数据的名称,因此数据名称标准化需要对同音异义词和异音同义词进行定义。数据名称通常应符合以下原则。

(1)唯一性。数据名称应是唯一区分特定概念的称号。为使所有用户对同一概念使用统一的用语,只允许使用同一名称。例如“客户账号”、“客户账户号”应统一为“客户账号”,“邮箱地址”、“邮箱”应统一为“邮箱地址”。

(2)业务观点的普遍性。数据名称应该是从业务观点出发具有普遍认知的名称。通常企业和组织内部成员指定相应概念的名称时,都希望使用最常用的业务用语。

(3)含义转达的充分性。数据名称应起到看到名字就能掌握数据含义和范围的作用。如果不同的业务或用户观点可能会造成不同的含义时,建议使用修饰词等具体表达方式

数据定义应指定相应数据含义的范围和资格条件。针对仅通过名称难以向用户传达准确信息的其他事项,为了使用户完全理解数据的含义,应明确指出业务观点的范围和资格条件。此外,数据定义应成为数据所有者的决定标准。描述数据定义时应考虑以下事项。

(1)为了使数据用户完全理解数据的含义,应从不了解相关业务的第三者的立场出发进行描述。

(2)只通过叙述式定义难以表达数据的含义时,应同时提供实际可能产生的数据值的描述。

(3)尽量不要按原样描述数据名称或使用缩写和专业用语描述定义。

(4)数据格式。

使用数据格式,可通过定义数据表现形态将数据输入错误和控制风险降到最低。数据格式的定义应与业务规则和使用目的一致。

·数值(numeric)

·文本(text)(www.chuimin.cn)

· 日期(date)

·字符(char)

·时间戳(timestamp)

·数据长度小数点位数

定义数据格式时应考虑以下事项。

(1)通过定义域并应用到数据标准,统一性质类似的数据之间的数据形式。

(2)数据的最大值或最大长度不固定时,定义时应留有余量。

(3)对特殊数据类型(CLOB、 long、 raw等)执行数据查询、备份、实行等操作时存在很多限制,尽量不要使用。

使用数据规则,通过预定义可能出现的数据值,将数据输入错误和控制风险降到最低。数据规则可提高数据的一致性和完整性。数据规则的类型有以下几种。

(1)默认值。用户在画面或应用程序中未输入任何值时,根据数据类型输入预定义的默认值。也就是说在未输入数据值时自动输入数据值。例如,Numeric类型的项目自动输入默认值“0” ,Char类型的项目自动输入默认值“空格”。

(2)允许值。为了与业务规则保持一致性,限制可以输入的数据值,标准代码中预定义了各数据项目相应的代码值。例如,标准代码中定义的允许值为01、02、03、04……10,而特定数据项目中可能出现的允许值为01、03、05等一部分值。

(3)允许范围。为了与业务规则保持一致性,限制可以输入的数据值的范围。例如,若特定数据项目中定义的允许范围为1~5时,则预先限制输入1~5以外的值。