睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

元数据管理之定版元数据实践

时间:2023-08-31来源:互联网浏览数:117

元数据为描述数据的数据,定版元数据是指根据最新元数据发布后形成的元数据快照,带有版本信息,用于后续标准映射、评估。

此系统通过最新元数据发布后形成定版元数据,可提供定版元数据的查看、常用操作等功能。

01 需求

(1)需求背景

企业在数据治理的过程中,数据库里的元数据可能会存在频繁的更新,无稳定快照以供查询等使用,所以需要定期将数据库快照存储定版,形成版本,既可追溯元数据的变更情况,也可提供元数据的稳定服务。

(2)需求详述

最新元数据是数据库实际情况快照,而由于最新元数据会存在频繁修改,所以数据标准映射时并无确定快照内容,且变更元数据的过程若无记录,后续若想恢复或找回则再无可能,降低了容错性,无历史版本也就无法获知每次变更的内容,也无法实现变更通知,不能让用户在第一时间获知变更的对象及变更的内容,可能会间接影响业务侧。

02 产品形态和流程

(1)产品概述

在数据治理过程中并不能直接通过最新元数据去评估,于是将某一时间节点的最新元数据生成版本快照,通过记录版本的演进历程,可降低误操作的风险,版本记录可提供追溯回退历史数据

定版元数据功能可帮助用户查询当前所有版本的元数据信息,可查看各种类型的技术元数据、业务元数据、管理元数据信息,可查看全部版本内容,并支持版本对比,获知版本间差异信息。

定版元数据按照文件夹进行管理,并提供批量订阅变更、批量下线功能便于用户查询及管理元数据,在字段类型元数据中也可查看与标准的映射关系,定版元数据的查询、数据字典查看、元数据批量订阅、元数据版本对比是当前版本重点突破的问题,该版本拟通过定版元数据功能解决元数据的版本管理、变更通知等需求。

(2)产品操作流程

(3)业务实体表

03 产品详细需求

(—)查看定版元数据

(1)业务流程图

(2)页面原型和需求描述

1)定版元数据目录原型和需求详述

定版元数据用于展示带有版本信息的元数据,方便用户后续查找目标元数据。元数据对象采用树形结构展示,方便用户可保留其他数据库工具的使用惯。定版元数据的目录树结构与最新元数据的目录树结构保持一致

目录中结构如图,目录层级分别是:文件夹(根节点)名称、文件夹(二层)名称、文件夹(三层)名称、数据源名称、表/视图/函数/存储过程、具体元数据对象。其中文件夹层、数据源名称层均来自最新元数据目录,与最新元数据保持一致,表/视图/函数/存储过程为默认预置节点,具体元数据对象为发布时自动划分归属。点击不同的目录或对象,右侧则出现不同详情。

区域1为搜索,可搜索文件夹名称、数据源名称,模糊搜索

区域2为常用功能区,拥有新增、刷新、定位3个常用功能,新增为新增文件夹的根节点,刷新为刷新目录树,定位为定位当前右侧详情的对象,高亮并定位锚点。

区域4为折叠按钮,点击后可将目录树收起,将右侧详情页面最大可视化


2)定版元数据目录原型和需求详述

在左侧目录树中点击文件夹则展示文件夹信息,点击具体对象则展示对象的元数据信息,不同类型对象展示的内容不同。

定版元数据中展示的发布时的最新元数据内容,是一个带有版本号、发布时间的冻结版本。

文件夹详情如下,如实展示信息即可:

数据源详情:比最新元数据在基本信息中多了“元数据版本”“发布时间”两个字段,其他内容就是最新元数据在发布时的快照。

表/视图对象详情:比最新元数据在基本信息中多了“元数据版本”“发布时间”两个字段,其他内容就是最新元数据在发布时的快照。表对象还包括表血缘图谱

函数/存储过程对象详情:比最新元数据在基本信息中多了“元数据版本发布时间”两个字段,其他内容就是最新元数据在发布时的快照

各种类对象的管理属性详情如下,与最新元数据的差异是去掉了操作按钮

查看字段元数据原型及需求详述

点击字段名称后右侧展示该字段的详情信息,包括技术属性、业务属性管理属性。除以上内容外,字段还包括字段血缘图谱、版本信息、数据标准

(二)批量订阅定版元数据变更通知

(1)业务流程图

(2)页面原型和需求描述

元数据在版本演进过程中,版本与版本间会存在或大或小的差异,使用该数据的用户为了不影响业务使用,则需要随着变化而变化,及时根据最新版本的元数据调整该元数据的相关代码等,保证线上或实际业务中数据正确性,为了及时让用户获取到元数据的变更情况,则需要有变更订阅功能支撑该需求。

用户可使用批量订阅功能对关注的数据进行变更订阅,订阅的数据的属性、属性值与上一版本存在差异时,则会向指定用户邮箱推送变更通知邮件。点击“批量订阅”进入订阅管理页面

搜索筛选处可支持关键字(对象名称)搜索,订阅时间过滤,已订阅列表可查看当前用户存在的订阅信息,支持多选操作,用户可选择多个进行取消订阅、变更收件人。

点击“新增”打开新增订阅弹窗

用户可搜索目标元数据进行订阅,也可通过文件夹、类型选择目标对象选择完毕后,可输入邮箱地址,同一对象的收件邮箱最多100个,用于收取变更邮件。

(三)批量下线定版元数据

(1)业务流程图

(2)页面原型和需求描述

在业务场景发展过程中,可能会因为业务调整等原因,停用部分元数据不再使用该数据,也不再更新该数据的元数据信息,也不再需要对该对象评估标准的映射情况。

点击批量下线按钮,会出现批量下线的弹窗。弹窗顶部为版本过滤功能,可帮助用户快速定位需要下线的目标对象,并支持快速选中功能

中部为下线对象选择页面,展示的是当前定版元数据目录及对象列表。用户可选择文件夹、单个/多个对象,但不可选择字段(字段不显示),最小单位为表。

选择完毕点击“确认”可对此次选择的内容进行下线。下线成功的对象则在该定版文件夹中不再显示,此操作不影响最新元数据,同时解除与相关标准的关联关系,下线后,需对下线结果进行提醒

(四)定版元数据对比

(1)业务流程图

(2)页面原型和需求描述

1) 定版元数据历史版本查看原型及需求详述

表/视图/字段/函数/存储过程的最新元数据均可通过发布后形成不同的版本,版本管理可以帮助掌握数据治理的进度,也可帮助用户浏览所有版本的历史记录及版本内容,如有人员误操作、业务关系调整等场景时,也可通过恢复等功能快速回退到历史版本,提高容错性。

版本信息包括版本号、描述、操作类型、操作人、操作时间、操作版本信息常用操作包括:对比、下载、恢复。下载是指将此版本该对象的全部属性全部导出为Exce1文件到本地,对比是指选择两个版本开始对比差异可被点击的事件为复选框内选择的内容数量=2。版本列表(定版元数据)规则:显示当前元数据全部历史版本列表,按照操作时间新-日排序。

2)多个版本对比原型及需求详述

版本对比后,可在对比结果中查看俩版本间差异内容,不同种类对象的对比结果页面内显示的内容不同,但以详情页为准。对比时是针对技术属性、业务属性、管理属性的属性及属性值的一致性对比。

对于新旧版本中不一致的属性、属性值则需要高亮显示,便于获知版本间差异。

版本对比结果查看页面,左侧显示相对旧的版本,并可通过下拉框进行版本切换对比查看,对比的范围为元数据的技术元数据、业务元数据、管理元数据、血缘关系(表、字段)、数据标准(字段)中内容,当技术元数据、业务元数据、管理元数据、血缘关系(表、字段)、数据标准(字段)中任一属性或属性值存在不一致,该类型前都出现异常标记,若全部一致,则无任何标记

在对比完成后,可在当前页面选择是否使用左侧版本恢复,点击恢复后打开确认弹窗,与上一章节中恢复页面的区别是此处的选择历史版本。

统计类信息,不参与恢复。只恢复属性类。若仅查看版本间差异,查看完毕点击确认即可关闭此页面,返回进入前的页面。

(五)恢复定版元数据版本

(1)业务流程图

(2)页面原型和需求描述

在发布过新版本后,可能存在新版本的元数据在部分业务系统适配情况不理想,或不符合标准,需要回退到历史中某一版本中,所以需要有恢复元数据版本的功能。因为恢复操作需指定具体恢复的版本,所以无批量操作.

点击恢复按钮,会出现恢复操作的弹窗,同一对象在同一文件夹内多次恢复,恢复后使用旧版本的内容,重新进行发布,恢复可理解为是另一种形式的发布。弹窗顶部为搜索框,可帮助用户快速定位需要恢复的目标元数据;中部为下线对象选择页面,展示的是当前定版元数据目录及对象列表。用户可选择单个对象进行恢复,但不可选择字段,最小单位为表。

对象选择完毕需选择要恢复到旧版本号内容,因同一对象可在多个文件夹下存在多个版本,所以此处下拉框内仅显示当前对象所在文件夹路径中的该对象的版本列表,回复也需定义版本号,版本号的规则与发布时一致,填写完恢复原因描述后,点击“确认”开始恢复操作。恢复后会在该对象的版本记录新生成一条记录,操作类型显示为“恢复”,版本列表按最新一最旧倒序展示

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询