- 产品
- 产品解决方案
- 行业解决方案
- 案例
- 数据资产入表
- 赋能中心
- 伙伴
- 关于
全程“零”编码,高效实现主数据模型、主数据维护、主数据分发、主数据质量的全过程管理,为企业主数据管理落地提供有效支撑,实现各业务系统间的主数据共享,保障企业主数据的唯一性、准确性、一致性。
覆盖数据建模、采集、处理、集成、共享、交换、安全脱敏于一体,一站式解决数据开发所有的问题。
统一指标定义,实现“一变多变、一数多现”的数据管理效果,为企业提供强有力的数字化保障和驱动效应。
企业级多智能体平台,低门槛搭建智能体,灵活编排流程,融合 LLM 实现“问数”、“问知识”
面向企业级数据资产交易运营场景,助力企业实现数据资产的价值挖掘、升值和资产变现。
时间:2019-01-07来源:亿信华辰浏览数:1861次
数据质量问题主要包含四个问题域:技术问题、信息问题、流程问题、管理问题。
1、技术问题
由于具体数据处理的各技术环节异常所造成的数据质量问题,它产生的直接原因是技术实现上的某种缺陷。技术类数据质量问题产生的环节主要包括:数据创建、数据获取、数据传递、数据装载、数据使用、数据维护等方面:
数据创建质量问题主要包括:创建数据默认值使用不当和数据录入的校验规则不当,导致指标统计结果不一致、数据无效、记录重复等;
数据传递质量问题主要包括:接口数据及时率低、接口数据漏传、网络传输过程不可靠,如包丢失、文件传输方式错误、传输技术问题、协议使用不当导致的数据不完整等;
数据装载质量问题主要包括:数据清洗算法、数据转换算法和数据加载算法的错误;
2、信息问题
由于对数据本身的描述、理解及其度量标准的偏差而造成的数据质量问题。产生这类数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质得不到保证、变化频度不恰当等。
元数据描述及理解错误中的相关元数据主要包括:
业务元数据——主要包括业务描述、业务规则、业务术语、业务指标口径等;
技术元数据——主要包括接口规范、执行顺序、依赖关系、ETL转换、数据建模和工具等方面的内容。
数据度量和变化频度提供了衡量数据质量好坏的手段。数据度量主要包括完整性、唯一性、一致性、准确性、合法性。变化频度主要包括业务系统数据的变化周期和实体数据的刷新周期。
3、流程问题
由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程等各环节:
创建流程质量问题主要指操作员数据录入时缺乏审核流程;
传递流程质量问题主要指通信流程沟通不畅;
装载流程质量问题主要指清洗流程缺乏/不当、调度流程逻辑错误、数据加载流程逻辑错误及数据转换流程逻辑错误;
使用流程质量问题主要指数据使用流程缺乏流程管理;
维护流程质量问题主要指缺乏变更维护流程、缺乏错误数据维护流程、缺乏数据测试流程以及对人工后台调整数据没有严格的流程监控;
4、管理问题
由于人员素质及管理机制方面的 原因 造成的数据质量问题如:
数据库设计原则不严谨,数据使用不规范导致的业务数据重复,数据不一致。
人员培训所产生的质量问题主要指对数据质量相关人员缺少长期培训计划。
没有建立管理数据质量的专门机构,出现数据质量问题后无专人负责
没有明确的数据质量目标;
缺少管理数据质量的管理办法等。
此对数据质量产品的问题进行了部分的描述,高质量的数据都是一致的,差质量的数据却各有不同。可能因为行业的不同,数据的复杂程度不同,产生的问题也会各有差别。但都可以在四个问题域里找到对应的问题。所有这个总结,还是很全面的解释了相关数据质量产生的相关问题。
全面覆盖数据治理9大领域,采用微服务架构,融合度高,延展性强
实现数据从创建到消亡全生命周期的可视化,也实现全角色的可视化
丰富的智能元素和功能,大大缩短数据管理周期、减少成本浪费