首页 亿信华辰大数据知识库 数据治理的价值、原则及方法

数据治理的价值、原则及方法

|亿信华辰大数据知识库2021-09-04

数据治理的价值、原则及方法

随着大数据时代的到来,公司业务数据应用场景越来越多,而数据量也会随着业务快速增长。海量的数据可能会导致数据标准不一致,数据权限不分明,数据冗余,缺乏元数据管理机制,血缘关系查询非常困难、低效等问题。这个时候就需要对数据进行治理。

数据治理是指关于企业内部数据正式管理的过程和实践,包括数据管理、数据质量和相关的流程与标准,确保企业数据的安全和正确使用。

数据治理的目的是:保证数据的可用性、数据质量和数据安全。


数据治理的价值什么

1、降低数据使用成本,提升数据使用效率。

2、将数据规范化、标准化,保障数据建模统一性,统一标准,数据一致性

3、建立数据管理方案,提升解决问题效率。

4、提升数据质量,帮助企业用户进行高效数据驱动决策分析。

5、建立数据所有权和相关职责来提高数据安全性

6、帮助企业进行数据战略规划和部署,提高经营效率。


数据治理的原则

想从根本上改善数据的问题,还是需要做好数据治理的规范工作。简单来讲,数据治理就是要约束输入,规范输出。

约束输入:在用户输入的文本框中,省会、城市这些固定值,使用下拉列表,避免用户手动输入。对输入内容设置格式校验,比如手机号、邮箱等。将信息进行分段处理,避免事后拆分。

规范输出:统一语义,针对公司数据做一个语义字典。所有报告上的指标名称,都要在语义字典中备注,语义字典明确定义其标准和含义。不同指标必须用不同的名词。如果发现一个词已经在语义字典中有了,就必须走流程申请注册一个新词到语义字典。


数据治理方法

1、建设数据标准体系,包括数据标准、管理标准、质量标准等内容,保证各业务部门、各业务系统能得到落实与管控。包括元数据管理功能是否得到详细认真的设计、应用,助力于业务系统。例如,某银行数据标准体系建设中,元数据中除了应设有国标、行业标体系(如地理、行政区划,业务门类、分行等)的数据之外,还应涉及应用系列行标数据,如建筑物、楼宇体系等。

2、完成各业务系统的整合工作。完成用户集成、数据集成、业务集成工作,消除信息孤岛,完善数据中心建设。首先,尽可能在被集成的业务系统,即产生数据的源系统中解决数据质量问题,这对于整个体系的数据治理来说是非常高效的措施。其次,在各业务系统及平台的建设过程中,描述核心业务实体的数据,如部门、人员、入账出账、资产、财务等,交换、共享性要求较高,均要被纳入到主数据范围,形成一致的、完整的、准确的核心业务数据,由数据中心统一对外提供数据服务。最后,落实到数据治理平台上,集中反映在主数据管理是否完备,是否能以多种数据共享形式服务于各类应用。

3、评估数据质量,生成数据质量报告。以数据标准体系为基准,以数据治理平台为工具,数据管理员对数据质量进行检测,根据实际需求,利用检测数据进行单一主题或者整体进行数据质量分析,生成数据质量报告。在数据质量报告的基础上,结合系统配置好的数据管控体系,生成针对部门、业务数据管理员的各子数据集整改报告。

4、明确管控对象。实现以用户为中心,以元数据为基础,贯穿信息标准、数据采集、数据标准化、数据质量、主数据管理、数据共享等从源端到数据中心,再到应用端的全过程管理。数据在信息系统中是以不同形态体现的,需要将每种形态管理好,才有可能管好最终的数据质量。信息系统建设过程中,数据质量不佳主要原因之一是忽视了对数据的管控,这就会造成数据的设计与需求不一致,开发与设计不一致,对数据质量要求考虑缺失,不同系统对数据的定义和技术实现不一致等等诸多问题。

5、适合技术工具。工具核心作用在于知识的固化和提高数据治理人员的工作效率。比如:需要手工编写程序收集的元数据,工具帮你自动获取;需要人工识别或编写代码实现的数据质量检查,工具帮你自动识别问题;用文档管理的数据字典,工具帮你在线管理;基于邮件和线下的流程,工具帮你线上自动化。

如何选择好的数据治理工具

以上介绍的数据治理方法中,大多都需要根据企业自身的信息建设化程度来做出相应调整。但对于选择什么样的工具,目前,国内主流的数据治理工具就是亿信华辰旗下的睿治智能数据治理平台。

亿信华辰深耕商务智能和大数据领域15年,着眼于打造数据全生命周期的智能化产品线,致力于帮助企业和政府解决数据应用难题,实现企业生产力和政府治理能力的数字化转型,让数据驱动进步。睿治数据治理平台是由实时大数据管理、元数据管理、数据标准管理、数据质量管理、主数据管理、数据安全管理多产品组成的一整套解决方案,是一款智能、敏捷的数据全生命周期的管理应用平台,为企业保证了业务数据在采集、集中、转换、存储、应用整个过程中的完整性、准确性、一致性和时效性。


认为本内容有帮助
1
您可能需要的数据产品
亿信华辰助力政企数字化转型