首页 行业百科 元数据管理工具选型指南

元数据管理工具选型指南

|亿信华辰大数据知识库2022-08-21

元数据管理工具选型指南

在各种数字化的影响下,将企业环境中的各种元数据整合利用至关重要。对于企业来说,选择适合自己的元数据管理工具将能最大化发挥元数据的作用,以协助企业完成在数据方面的战略目标。

在各种数字化的影响下,将企业环境中的各种元数据整合利用至关重要。对于企业来说,选择适合自己的元数据管理工具将能最大化发挥元数据的作用,以协助企业完成在数据方面的战略目标。


一、元数据的定义

按照传统的定义,元数据(Metadata)是关于数据的数据。在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据。


二、元数据的作用

1、元数据定义的语义层可以帮助用户理解数据仓库中的数据
用户不可能象数据仓库系统管理员或开发人员那样熟悉数据库技术,因此迫切需要有一个“翻译”,能够使他们清晰地理解数据仓库中数据的含意。元数据可以实现业务模型与数据模型之间的映射,因而可以把数据以用户需要的方式“翻译”出来,从而帮助最终用户理解和使用数据。
2、元数据是进行数据集成所必需的
数据仓库最大的特点就是它的集成性。这一特点不仅体现在它所包含的数据上,还体现在实施数据仓库项目的过程当中。一方面,从各个数据源中抽取的数据要按照一定的模式存入数据仓库中,这些数据源与数据仓库中数据的对应关系及转换规则都要存储在元数据知识库中;另一方面,在数据仓库项目实施过程中,直接建立数据仓库往往费时、费力,因此在实践当中,人们可能会按照统一的数据模型,首先建设数据集市,然后在各个数据集市的基础上再建设数据仓库。不过,当数据集市数量增多时很容易形成“蜘蛛网”现象,而元数据管理是解决“蜘蛛网”的关键。如果在建立数据集市的过程中,注意了元数据管理,在集成到数据仓库中时就会比较顺利;相反,如果在建设数据集市的过程中忽视了元数据管理,那么最后的集成过程就会很困难,甚至不可能实现。
3、元数据可以支持需求变化
随着信息技术的发展和企业职能的变化,企业的需求也在不断地改变。如何构造一个随着需求改变而平滑变化的软件系统,是软件工程领域中的一个重要问题。传统的信息系统往往是通过文档来适应需求变化,但是仅仅依靠文档还是远远不够的。成功的元数据管理系统可以把整个业务的工作流、数据流和信息流有效地管理起来,使得系统不依赖特定的开发人员,从而提高系统的可扩展性。
4、元数据是保证数据质量的关键
数据仓库或数据集市建立好以后,使用者在使用的时候,常常会产生对数据的怀疑。这些怀疑往往是由于底层的数据对于用户来说是不“透明”的,使用者很自然地对结果产生怀疑。而借助元数据管理系统,最终的使用者对各个数据的来龙去脉以及数据抽取和转换的规则都会很方便地得到,这样他们自然会对数据具有信心;当然也可便捷地发现数据所存在的质量问题。甚至国外有学者还在元数据模型的基础上引入质量维,从更高的角度上来解决这一问题。


三、如何选择适合自己的元数据工具

1、元数据查找能力
提供统一的端口对元数据进行查找的能力,完善的元数据管理工具应该能支持按照企业的各种分类方法来对元数据进行查找(有一部分分类方式蕴含在元数据本身中,需要通过对元数据进行分析之后获得)。比如你可能会按照系统、表、指标、接口等不同维度查找信息,甚至会根据自己的查找习惯新建一个完全不同的类别。
2、元数据存储能力
将采集过来的元数据进行统一存储的能力,为支持各种元数据以及元数据之间关系的存储,元数据存储需要灵活可扩展的架构支撑,另外,能够实时更新存储也是很重要的一点。
3、基于角色的访问控制和分层
元数据的增删改等权限的控制是元数据管理工具中需要特别注意的地方,工具中应该支持访问权限的控制。比如,数据管理员具有所有权限,开发人员可能更关注开发环境、测试环境元数据,而企业管理者可能只关注生产环境的元数据情况,总经理级别的用户可以访问企业多种环境下的元数据,而部门负责人可能只关注与本部门相关的元数据。
4、血缘分析/关系分析能力
分析数据的来源和数据的流向,揭示数据的上下游关系,在元数据管理工具中分析、描述并可视化其中的细节,方便用户对关键信息进行跟踪。完善的血缘分析需要是横向(当前)和纵向(历史)双向可用的,以方便对同一时期不同对象的分析和不同时期同一对象的变化。
5、元数据变更控制能力
当元数据需要变更时,提供变更审核能力,明确元数据版本,保存元数据的历史状态,在发生任何问题时可以自动恢复到之前的版本。在某个元数据项发生变更时,可能还需要对该次变更将要产生的影响进行分析和评估。
6、业务元数据管理能力
采集企业环境中的业务元数据,并完成业务元数据与技术元数据的映射,为元数据赋予业务属性,这也是发挥元数据管理工具业务价值的一个关键。
7、数据生命周期管理能力
在理想状态下,元数据管理工具应该保留数据从创建、存储,到过时被删除/备份等各种状态下的元数据,从而管理数据在整个生命周期中的流动。作为一项规则,较新的数据和那些很可能被更加频繁访问的数据,应该存储在容易被访问的位置,而那些不是很重要的数据则可以备份存储在比较便宜的,稍微慢些的媒介上。
8、元数据对比分析能力
对不同环境中的元数据进行对比分析,分析其中的异同,必要时还能根据分析结果产出相应的分析报告。
9、与其他系统的集成能力
要想让元数据管理系统发挥业务价值,还有非常重要的一点就是元数据管理工具与其他系统的集成能力。
四、亿信睿治元数据管理工具
亿信睿治元数据管理平台致力于处理技术元数据、业务元数据、管理元数据,帮助各行各业用户获得更多的数据洞察力,进而挖掘出隐藏在资源中的价值。亿信睿治数据治理平台元数据管理内置近30种采集适配器,基本支持所有的主流数据库的元数据采集,并且可自定义元模型,采集文件数据源的元数据;数据质量管百思特网理内置13中质量检查规则,满足各个场景的质检需求,是笔者目前见过最完善的数据质量管理平台。亿信元数据管理系统拥有丰富健全的元数据采集机制,支持多种适配器模式,用户可以选择相应的采集适配器,从所需的数据库源中定义采集任务,获取到用户所需的元数据,系统支持多种数据库的数据采集,具有良好的兼容性。
认为本内容有帮助
0
您可能需要的数据产品
亿信华辰助力政企数字化转型
customer

在线咨询