首页 行业百科 数据治理包括哪几个方面?

数据治理包括哪几个方面?

|亿信华辰大数据知识库2022-05-27

数据治理包括哪几个方面?

数据治理专注在数据本身。数据治理的目标,是对数据质量进行提高,同时确保数据的安全性,推进数据资源的整合、共享进程。广义上讲,数据治理是对数据实现全生命周期管理。只要是为整个数据生命期而展开的业务、技术、管理活动,都属于数据治理的范畴,包括但不限于传统数据集成和存储环节的工作(如数据采集、清洗、转换等)、数据资产目录、数据标准、质量、安全、数据开发、数据价值、数据服务与应用等。

近些年来,“数据治理”这个词总是高频出现,让人们对其“身世背景”格外好奇。国际数据治理研究所(DGI)给出的定义:数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁能根据什么信息,在什么时间和情况下,用什么方法,采取什么行动。


一、数据治理治什么?

数据治理专注在数据本身。数据治理的目标,是对数据质量进行提高,同时确保数据的安全性,推进数据资源的整合、共享进程。广义上讲,数据治理是对数据实现全生命周期管理。只要是为整个数据生命期而展开的业务、技术、管理活动,都属于数据治理的范畴,包括但不限于传统数据集成和存储环节的工作(如数据采集、清洗、转换等)、数据资产目录、数据标准、质量、安全、数据开发、数据价值、数据服务与应用等。


二、数据治理包括哪几个方面?
1、数据资源梳理
从业务的角度理清组织的数据资源环境和数据资源清单,包含组织机构、业务事项、信息系统,以及以数据库、网页、文件和 API 接口形式存在的数据项资源,本步骤的输出物为分门别类的数据资源清单。
2、数据采集清洗
通过可视化的 ETL 工具将数据从来源端经过抽取 (extract)、转换 (transform)、加载 (load) 至目的端的过程,目的是将散落和零乱的数据集中存储起来。
3、元数据管理
元数据管理是对基础库和主题库中的数据项属性的管理,同时,将数据项的业务含义与数据项进行了关联,便于业务人员也能够理解数据库中的数据字段含义。
4、基础库与主题库建设
基础数据一般指的是主数据,例如智慧城市中的人口、法人、地理信息、信用、电子证照等数据。主题数据一般指的是某个业务主题数据,例如市场监督管理局的食品监管、质量监督检查、企业综合监管等数据。基础库和主题库的建设就是在对业务理解的基础上,基于一定的原则设计数据库表结构,然后再根据数据资源清单设计数据采集清洗流程,将整洁干净的数据存储到数据库或数据仓库中。
5、质量管理
数据价值的成功发掘必须依托于高质量的数据,唯有准确、完整、一致的数据才有使用价值。因此,需要从多维度来分析数据的质量,例如:非空检查、偏移量、规范性检查、值域检查、关联关系检查、重复性检查、波动检查、离群值检查等等。
6、血缘追踪
在元数据和数据资源清单之间建立关联关系,且业务团队使用的数据项由元数据组合配置而来,建立数据使用场景与数据源头之间的血缘关系。在数据被业务场景使用过程中,发现错误时,数据治理团队可以快速定位数据来源,修复数据错误。
7、数据资源目录
数据资源目录一般应用于数据共享的场景,例如政府部门之间的数据共享,数据资源目录是基于业务场景和行业规范而创建,同时依托于元数据和基础库主题而实现自动化的数据申请和使用。
8、数据共享交换
数据共享分为库表、文件和 API 接口三种共享方式,库表共享比较直接粗暴,文件共享方式通过 ETL 工具做一个反向的数据交换也就可以实现。我们比较推荐的是 API 接口共享方式,在这种方式下,能够让中心数据仓库保留数据所有权,把数据使用权通过 API 接口的形式进行了转移。API 接口共享可以使用 API 网关实现,常见的功能是自动化的接口生成、申请审核、限流、限并发、多用户隔离、调用统计、调用审计、黑白名单、调用监控、质量监控等等。

三、我们应该选择什么样的数据治理工具?
来自亿信华辰的智能数据治理平台——睿治,是目前国内功能齐全的数据治理工具,拥有实时计算存储、元数据管理、数据标准管理、数据质量管理、数据集成管理、主数据管理、数据交换管理、数据资产管理、数据安全管理、数据生命周期管理十大模块。
各模块都各有特点和使命,在企业的数据治理中有着不同的功能侧重,但是解决问题的目标是一致的——提升数据质量提高数据利用效率。当我们将以上数据治理的十大核心能力组合起来以后,就形成了一个完整的数据治理平台,能全面回答并响应“数据治理怎么治”的问题。另外,这九大模块也可以根据需求来组合,以满足不同企业不同的业务场景和需要。
认为本内容有帮助
3
您可能需要的数据产品
亿信华辰助力政企数字化转型
customer

在线咨询

在线咨询

点击进入在线咨询