首页 亿信华辰大数据知识库 数据治理与数据中台的关系

数据治理与数据中台的关系

|亿信华辰大数据知识库2021-12-03

随着信息化建设以及互联网技术的发展,数据治理及数据中台建设项目,涉及的细分领域也越来越多。下面介绍什么是数据治理,什么是数据中台,两者之间有什么关系?

    什么是数据治理
    数据治理是针对数据管理的质量控制规范,它将严密性和纪律性植入企业的数据管理、利用、优化和保护过程中。它是对数据资产管理行使权力和控制的活动集合(规划、监督和执行)。传统的数据治理内容通常包含数据标准管理、元数据管理、数据质量管理、数据安全管理、数据生命周期管理等内容。
    什么是数据中台
    而数据中台是一套可持续“让企业的数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。
    数据治理与数据中台的关系
    数据中台和数据治理工作准确来说都是一个体系性的工作。下面从它们具体落地实践中的技术领域,介绍两者的关系。
    数据仓库
    数据中台建设中,由于会和实时业务应用深度结合,对数据的实时性的要求高,因此数仓建设一般会定位为统一实时数仓的建设。并且数据中台会存储更多的用户类的行为数据及其它原始数据,它要求的数据存储量级更大,会混合使用分布式关系数据库、NoSQL、甚至分布式文件系统等多种存储服务,而数据治理更多聚焦结构化数据,主要使用一些分布式数据库及NoSQL数据库。
    数据治理中,一般将数据仓库中的数据分为4层,包括ODS(贴源层数据)、基础数仓层、MDM(主数据)、数据集市层;而数据中台会增加2层,包括标签数据层和ADS(应用数据层),以对接实时线上业务的数据应用及用户运营。
    ETL
    数据治理一般采用ETL(Extract-Transform-Load,抽取-转换-存储),而数据中台使用ELT(Extract-Load-Transform,抽取-存储-转换),先优先保障数据存储,再进行异步批量处理。采用ELT除了在处理效率方面有优势外,另一个好处是存储的数据更全面,防止遗漏一些当前无法识别出来的潜在的有价值的数据。
    数据抽取方面,数据治理工作主要聚焦于存在于应用系统中的,数据库中的企业的经营类数据,而数据中台还会关注用户行为数据、原始日志数据等,数据来源除了数据库之外,还有日志埋点、音视频等非结构化和半结构化数据。由于数据中台统一实时数仓的建设要求,所以在数据抽取上有实时抽取的需求,这涉及到数据源的实时监控以及在数据接收机处理端的数据订阅服务及消费服务。这些实时能力在数据治理中一般不涉及。
    主数据管理
    主数据是组织中需要跨业务、跨部门、跨系统共享的核心业务实体数据,是企业的核心数据,这些数据由于应用广泛,必须严格保证其唯一性、一致性、准确性、实时性。数据治理及数据中台建设都离不开主数据管理,两者使用的方法及数据定义、处理方式没有大的区别。部分数据中台产品中,会将相当一部分标签数据也纳入主数据管理范畴之中。
    元数据管理
    数据中台会包含标签及标签类目的定义及开发工作,对用户、业务、市场进行打标,在此基础上构建人、事、物的“画像”,以方便进行精细化运营业务的开展。而标签的开发必然涉及特征工程及算法的应用,这也是数据中台和数据治理很重要的一个区别,一般数据治理工作主要是为特征工程及算法开发提供准确、一致的数据,但本身并不介入特征工程及算法开发工作。
    数据安全
    数据安全管控贯彻整个数据治理及数据中台建设,一般都会采用多级授权的机制,上级数据管理员会将某一个数据域或者数据主题下的模型或者表的权限整体授权给下一级数据管理员,再由下一级数据管理员进行更细化的授权控制。数据中台由于介入业务应用,因此使用人员中增加了业务运营人员,在数据授权人群上会更广泛一些。
    数据质量
    传统数据治理工作中,对数据质量的要求会比较高。所以在数据抽取中会采用ETL模式,边抽取边检查、转换,以保证存储的数据必须是准确、完整、一致。而数据中台由于容纳的数据更多,因此在数据质量管控上会采用更灵活的策略,一般采用ELT的方式,存储全量的原始数据,允许存在一定的冗余。另外,由于数据中台存储的数据量更大,进行全量数据管控成本太高,所以一般会根据数据新鲜度及价值进行分级的质量检测管控。
    数据应用门户
    数据中台建设会介入特征工程领域及算法开发,开展数据智能、数据科研、预测分等。因此在数据应用门户上还必须为这些数据应用及开发能力提供相应的功能,所以,数据中台的应用门户的复杂度要远超数据治理。
    数据服务接口
    数据中台由于存储了大量标签数据,比数据治理多提供了实时服务接口。

如何选择数据治理平台

    目前市场上数据治理平台百花齐放,各有优缺点。其中,亿信华辰凭借雄厚的实力处于大数据领域前沿,因此,旗下自主研发的睿治数据治理平台成为国内主流。睿治数据治理平台融合数据集成、数据交换、实时计算存储、元数据管理、数据标准管理、数据质量管理、主数据管理、数据资产管理、数据安全管理、数据生命周期管理十大产品模块,打通数据治理各个环节,十大产品模块可独立或任意组合使用,快速满足政府、企业各类不同的数据治理场景。
认为本内容有帮助
0
您可能需要的数据产品
亿信华辰助力政企数字化转型