首页 亿信华辰大数据知识库 元数据管理工具选型方法

元数据管理工具选型方法

|亿信华辰大数据知识库2021-12-09

数据治理战略实施的基础就是元数据管理,BI的成功运用深度依赖于有效的元数据管理。但是,数据治理的概念在国内还并未普及,如何打好数据治理的基础更是一头雾水。

作为一名企业管理人员、一名IT人员、或者是一名数据行业从业者,理解数据治理的首要任务,就是——理解元数据,理解元数据管理。我们先看看何为元数据、何为元数据管理。

元数据与元数据管理

元数据就是关于数据的数据。元数据为数据说明其元素或属性(名称、大小、数据类型等),或结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。举个例子,如果把数据比作一本“书”,那么元数据就包含了“书名”、“作者”、“出版社”、“出版日期”等信息。在数据治理中,元数据便是对于数据的描述,存储着关于数据的数据信息。我们可以通过这些元数据去管理和检索我们想要的数据。就好比通过书名去查找书一样。
元数据有重要的应用价值,是数据管理、数据内容、数据应用的基础,在数据管理方面为集团数据提供在计算、存储、成本、质量、安全、模型等治理领域上的数据支持。例如可以利用元数据构建知识图谱,给数据打标签,清楚地知道现在有哪些数据,打通产品及应用链路,保障产品数据准确、及时产出。一般会通过元数据资料库(Metadata Repository)来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、操作和管理能达成协同和一致。

下面再说说元数据管理

元数据管理包括业务词汇表的发展,数据元素和实体的定义,业务规则和算法以及数据特征。最基础的管理是管理业务元数据的收集、组织和维持。对技术型元数据的应用,对主数据管理和数据治理项目的成功至关重要。元数据管理是企业级数据仓库中的关键组件,贯穿了数据仓库的整个生命周期,使用元数据驱动数据仓库的开发,使数据仓库自动化,可视化。管理元数据的目的,就是为了让用户能够更高效的使用数据,也是为了让平台管理人员能更加有效的做好数据的维护管理工作。

元数据管理平台管什么

数据治理的第一步,就是收集信息,很明显,没有数据就无从分析,也就无法有效的对平台的数据链路进行管理和改进。所以元数据管理平台很重要的一个功能就是信息的收集。元数据管理平台就是根据业务需求和解决目标以恰当的形式提供这些元数据信息,然后将这些元数据信息通过服务的形式提供给周边上下游系统使用,帮助大数据平台完成质量管理的闭环工作。
常见的元数据管理信息
数据的表结构Schema信息:从平台管理和业务需求的角度出发来考虑,如何整理和归纳数据,方便系统集成,实现最终的业务价值。
数据的各类统计信息:即数据内存,更新日期,使用者,访问权限等等。与表结构信息类似,对于这类Audit审计类信息的采集和管理,通常具体的底层数据存储管理组件自身的功能也无法直接满足我们的需求,需要通过专门的元数据管理平台中统一进行采集,加工和管理。
数据的血缘关系信息:血缘信息即数据从哪里来到哪里去。通过数据的血缘关系,可以建立起生产这些数据的任务之间的依赖关系,进而辅助调度系统的工作调度,或者用来判断一个失败或错误的任务可能对哪些下游数据造成影响等等。
数据的业务属性信息:为业务服务的数据,业务开发必不可少的环节。这类数据的采集和展示需要和业务环境相融合,只有这样才能真正发挥这部分元数据信息的作用。

如何选择元数据管理工具

以亿信华辰为例:
自动采集企业元数据 ,全面梳理企业信息资产

一款适合的元数据管理工具可以通过自动化的采集方式,帮助企业完成数据信息、服务信息与业务信息的采集,自动调取企业内部的元数据,为企业展现完整信息资产,从而进一步帮助企业集中管理所有信息资产,方便数据的交互和共享。

多种分析方式,迅速响应业务数据问题

亿信华辰元数据管理平台通过多种分析方式帮助企业分析数据流向,具体到字段级的数据解析,如血缘分析、影响分析、关联度分析等,帮助企业获取数据上下游、对象关联对象等等关系,快速定位问题字段,帮助企业降低数据问题的定位难度。

全方位检核机制,消除企业数据质量隐患

亿信元数据管理平台提供元数据质量检核功能,包括一致性检核、属性填充率检核和组合关系检核,是保障元数据质量的重要手段之一。

完善的版本管理,保障企业元数据一致性

亿信华辰元数据管理平台不仅区分了最新元数据和定版元数据,还提供了历史版本查看和对比,保障了元模型的稳定性,可以追踪或查看项目负责人,问责更加清晰。

元数据变更监控,方便掌握数据资产变化

实现对元数据实时地变更监控,查看明细信息。并支持变更订阅功能,让用户可随时监察,消除问题隐患。

认为本内容有帮助
0
您可能需要的数据产品
亿信华辰助力政企数字化转型