睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

常见的元数据管理系统

时间:2021-11-12来源:CSDN浏览数:1621

1、apache atlas

Apache Atlas 是 Apache 基金会的孵化项目,是 Hadoop 生态圈的数据治理和元数据框架。Atlas 是一套核心基础治理服务的集合,有很好的伸缩性和可扩展性,能够满足企业对 Hadoop 生态系统的多样性需求,并能和企业的数据生态系统集成。
它为 Hadoop 集群提供了包括数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力。 

但 atlas 的缺点是:只能对 hadoop 的元数据进行管理(虽然也是连的 Mysql ),对传统数据库的支持力度非常小;同时血缘分析也只支持特定的数据库。

2、wherehows
Wherehows 定位于元数据仓库,元数据存储于 mysql 中,它从不同的源系统中采集元数据,并进行标准化和建模,从而作为元数据仓库完成血缘分析。由 linkedin 开源。支持 Docker 部署。

优势:
支持元数据历史版本及对比分析。
一站式的元数据分析管理系统。
劣势:

支持的源系统比较少
开源版本仅支持 Azkaban 调度任务的血缘分析。其他调度任务仅能获得元数据信息,而没有血缘信息。
血缘分析较粗,不支持列级血缘。如 HDFS 仅能显示数据文件之间的血缘。
Web UI 仅提供查询能力,相关配置需要调用 API 接口。
缺乏用户、权限管理能力。

3、亿信元数据管理平台内置丰富的采集适配器,通过自动化的采集方式,帮助企业完成数据信息、服务信息与业务信息的采集,自动调取企业内部的元数据。同时,该平台通过多种分析方式帮助企业分析数据流向,具体到字段级的数据解析,如血缘分析、影响分析、关联度分析等,帮助企业获取数据上下游、对象关联对象等等关系,快速定位问题字段,帮助企业降低数据问题的定位难度。

建立元模型

元数据建模是对企业要管理的元数据进行结构化、模型化。元模型的构建要一般要参考公共仓库元模型CWM,但也不能照搬CWM,否则构建的元模型太过臃肿,不够灵活。亿信元数据管理平台中的元模型支持CWM规范的同时,提供了一套便捷的自定义管理接口功能,可完全自定义扩展,能够满足元数据管理快速实施的需要,可适应用户在不同时期的不同管理需要。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询