首页 亿信华辰大数据问答 据质量问题#09:缺乏数据完整性
我要提问
写回答

据质量问题#09:缺乏数据完整性

数据质量管理 共 1 个回答
  • 白衣俊郎
    白衣俊郎

    2024-09-29

    数据完整性是指数据集中存在必要的字段。数据集的完整性可以垂直(属性级别)或水平(记录级别)计算。通常,字段被标记为必填以确保数据集的完整性,因为并非所有字段都是必需的。

    通常会在大量字段留空的数据集中发现此数据质量问题–大量记录。但空并不一定意味着不完整。数据集的完整性只能通过首先对数据模型的每个字段进行如下分类来准确衡量:

    字段是必填项吗?意思是,它不能留空;例如,客户的名称。

    该字段是可选的吗?意思是,它不一定需要填写;例如,客户的爱好字段。

    该字段在某些情况下不适用吗?意思是,根据记录的上下文,它变得无关紧要,应该留空;例如,未婚客户的配偶姓名。

您可能需要的数据产品
亿信华辰助力政企数字化转型

现在申请试用亿信华辰数据软件,马上可获得:

50+

领导驾驶舱、大屏分析等BI模板

100+

多行业数字化转型解决方案

1500+

海量工具及行业应用学习视频

立即申请试用
customer

在线咨询