首页 行业百科 浅谈数据质量管理

浅谈数据质量管理

|亿信华辰大数据知识库2022-06-06

浅谈数据质量管理

数据质量管理是指对数据从产生、获取、存储、共享、维护、应用等各个阶段可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使数据质量获得进一步提高。

一、什么是数据质量管理?
数据质量管理是指对数据从产生、获取、存储、共享、维护、应用等各个阶段可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使数据质量获得进一步提高。


二、数据质量评估维度

1、一致性
多源数据的数据模型不一致,例如:命名不一致、数据结构不一致、约束规则不一致。数据实体不一致,例如:数据编码不一致、命名及含义不一致、分类层次不一致、生命周期不一致……。相同的数据有多个副本的情况下的数据不一致、数据内容冲突的问题。
2、完整性
数据完整性问题包括:模型设计不完整,例如:唯一性约束不完整、参照不完整;数据条目不完整,例如:数据记录丢失或不可用;数据属性不完整,例如:数据属性空值。不完整的数据所能借鉴的价值就会大大降低,也是数据质量问题最为基础和常见的一类问题。
3、唯一性
用于识别和度量重复数据、冗余数据。重复数据是导致业务无法协同、流程无法追溯的重要因素,也是数据治理需要解决的最基本的数据问题。
4、准确性
准确性也叫可靠性,是用于分析和识别哪些是不准确的或无效的数据,不可靠的数据可能会导致严重的问题,会造成有缺陷的方法和糟糕的决策。
5、真实性
数据必须真实准确的反映客观的实体存在或真实的业务,真实可靠的原始统计数据是企业统计工作的灵魂,是一切管理工作的基础,是经营者进行正确经营决策必不可少的第一手资料。
6、及时性
数据的及时性(In-time)是指能否在需要的时候获到数据,数据的及时性与企业的数据处理速度及效率有直接的关系,是影响业务处理和管理效率的关键指标。
7、关联性

数据关联性问题是指存在数据关联的数据关系缺失或错误,例如:函数关系、相关系数、主外键关系、索引关系等。存在数据关联性问题,会直接影响数据分析的结果,进而影响管理决策。

三、数据质量管理的价值
建设一个完整的数据质量管理平台,对数据进行检核与统计,从制度、标准、监控、流程几个方面提升数据信息的管理能力,解决项目面临的数据标准问题、数据质量问题,为数据治理提供准确的数据信息。完成从发现数据问题到最后解决数据问题,不断提高数据质量,形成数据产生、数据交换、到数据应用过程中数据质量的统一管理与控制。
四、工具:统一的数据质量管理平台
有很多数据准备和管理工具可以提供多种好处来对抗不良数据。但其中只有少数涵盖了所有人的数据质量。这些专门的、独立的数据质量管理工具通常具有复杂的用户界面,需要深厚的专业知识才能成功部署。当然,这些工具可能很强大,但如果团队只有短期的数据质量处理优先级,那么项目的进度将大打折扣。以下是数据质量工具可以支持您的数据驱动型企业的方式:
安全共享质量数据:使用本地或基于云的应用程序有选择地共享生产质量数据,而不会将个人身份信息 (PII) 暴露给未经授权的人员。
分析您的数据环境: 数据剖析——衡量整个企业中以各种形式存储的数据的特征和状况的过程——通常被认为是获得对企业数据的控制权的重要第一步。
快速准备和共享数据:太多人仍然花费太多时间在 Excel 中处理数据或期望他们的同事代表他们这样做。数据准备工具可能允许任何人访问数据集,然后清理、标准化、转换或丰富数据——这种共享所有权最终推动了业务和 IT 之间的协作。
管理数据生命周期: 数据管理是定义和维护数据模型、记录数据、清理数据以及定义其规则和策略的过程。它支持实施定义明确的数据治理流程,涵盖多项活动,包括监控、协调、优化、重复数据删除、清理和聚合,以帮助向应用程序和最终用户提供高质量的数据。
不良数据质量的可能造成市场竞争能力的下降、错误的决策以及寻找、清理和纠正不良错误所需的时间、人力、资源、经济成本。亿信华辰提供 数据质量管理平台工具来帮助您实现数据质量目标并帮助您的企业真正实现数据驱动。
认为本内容有帮助
0
您可能需要的数据产品
亿信华辰助力政企数字化转型
customer

在线咨询