睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据质量管理趋势

时间:2019-11-15来源:知乎浏览数:662

关注数据质量的同时,还要进一步关注覆盖范围更加广泛、涉及层面更加深入的信息质量,这也是数据管理需要思考的问题。苏联数学家Kolmogorov对信息的定义是:“信息是在给内数据集内的对客观事物的语义描述”。进一步信息又可分为物理信息和语义信息两类,其中物理层面的信息反映基础的数据结构;语义信息属于进阶有含义的语义数据结构,反映人类的视角。

目前数据质量管理方法中对于语义信息的关注较少,更多的是关注常规物理信息,以及可以转化为物理信息的语义信息,其原因在于信息质量更为复杂。错误的数据能导致错误的信息,物理信息容易度量,语义信息相对较难用简单的规则度量。在一个数据挖掘应用中,错误的语义信息会来源于知识发现过程中的数据集选择、模型选择、参数选择、验证方式选择,基本上所有的过程都需要加入人为的理解因素。从传统软件开发质量保障角度,也需要对语义相关的信息质量进行考虑,确保数据价值的不被曲解或者损失。在移动计算、物联网、大数据等新理念趋势下,信息质量面临的问题更加值得关注。

从整体数据管理角度来看,语义信息的质量保障依赖于整体数据管理水平,数据治理、元数据、数据标准等活动都会发挥作用。数据治理定义数据质量相关角色、职责,元数据、数据标准为一致性的语义理解提供参考作用。近年来软件即服务(SaaS)和云计算应用(Cloud-Based)趋势日益明显,信息技术新趋势的影响也促使数据质量管理从独立的闭环机制拓展到完整的宏观数据质量管理体系。银监会于2011年发布银行监管统计数据质量管理良好标准,该标准以数据质量为目标涵盖组织、制度、系统和流程建设,是银行开展全面数据质量管理的有益参考。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询