睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据治理,到底为什么这么难?

时间:2023-07-17来源:小情歌浏览数:55

众所周知,数据治理对企业来说意义干系重大,数据治理不好,数据质量得不到保障,下游的数据应用都是空谈。

DAMA的知识体系中,对数据治理的定义非常抽象,其对数据治理的定义是:对数据资产管理行使权力和控制的活动集合。

其实从生产实践来看,通俗地说,数据治理其实就是在做改善数据质量的工作,为数据应用打基础,做准备。

通过数据治理,企业可以达到如下效果:

1.搞清楚自己都有哪些数据;

2.搞清楚这些数据是什么含义,怎么用;

3.搞清楚数据的质量状况如何

4.对数据质量进行力所能及的提升。

然而,目标很清晰,现实很残酷。数据治理对于大多数企业来说,及枯燥,又困难,想做出成绩很难。

为何这样讲呢?

数据治理经常是盲目的,缺少目标性和方向性。很多数字化转型中的企业,数据量非常大,数据系统也非常多,数据链路错综复杂,十分混乱。

在领导的层面,经常遇到同一个问题,当询问不同的业务出口时,竟然得到截然不同的数据回答。

因此顺利成章地理解为,既然的一个取数工作都做不好,那么数据治理工作仿佛势在必行!很多治理项目就这样因为领导的耐心突然崩溃,匆匆上马了。

然而,数据治理工作不光是说说,而是要投入真金白银。数据治理项目虽然不一定涉及到大量的IT系统开发,但是其对于人力成本的投入甚至更加令人惊骇。

对于一张普通的人员名单数据表,仅仅为了确认这些人员是否还在真实的岗位上,就需要动用大量的组织人力来逐一核实。

类似的事情,数不胜数,这对于业务人员的消耗是不可估量的,为主营业务的正常运营带来非常多的额外“负担”。

数据治理,治理的其实不是数据,而是信息。

数据治理的成本消耗能力,成为推广的最大阻力,因此,在面对数据治理任务时,人力资源永远是稀缺的。这就导致一个结果,数据治理必须是有选择的。

凝练数据治理的范围、目标,就成为挡在前面的第一个难题。

数据治理是应用导向的,知道数据怎么用,数据用在哪,才能“倒推”出来究竟需要治理什么内容,怎么治理,以及治理到什么程度才算够用。

再次强调,数据质量不是越优越好,而是够用即可。

如果企业层面并不觉得数据应用和数据质量是有关系的,这个逻辑关系链路想不通,参不透,那么治理项目就一定推不动。

很多企业主在探讨到数据治理以及数据中台建设的必要性,难以下决心,也正是这样的原因,归根到底,是因为对数据的认知不足,不理解到底为什么数据质量好坏会对当前的业务,甚至未来的业务产生影响。

数据如果乱,但是对我没影响,那么我为什么要治理,又为什么要花钱?

当然,除了目标层面难以统一思想,难以坚定推动,执行层面同样困难。数据质量包括完整性、唯一性、一致性、准确性、规范性、及时性。

这里面每一项都极具挑战。数据治理包括数据问题识别和数据问题整改两个关键步骤。

对于准确性,光识别出问题就十分困难。数据能否准确地反映客观事实,是需要验证的,如果有其他来源的数据库交叉验证,则是最好,否则就只能投入人力现场进行核验。

一致性的问题同样困难。

同样的数据对象,在不同业务系统都有记录,应当以哪个为主?

究竟应当如何确立权威数据源,这就涉及到对整个IT架构的全面梳理,这又要去触碰企业那些不愿意面对的历史问题:

厂商换了一拨又一波;系统之间互相嫁接复用;人工超越权限直接对数据源手动“打补丁” ... ...

关于数据治理,第三个问题在于,很难做到真正形成“长效机制"。

一方面,数据治理很难实际落地。数据治理的过程十分繁琐,而且不一定有机会通过业务场景马上得到有效性的验证,因此数据治理任务很难长期得到业务上的重视。

其次,业务人员通常对数据标准的理解不到位,数据质量责任也经常难以贯彻落实,数据治理工作经常是“被动”的,出了问题才治理,难以在数据源头把控数据质量问题;

第三方面,也是最难的问题,就是治不了。很多问题即使发现了,也没有办法解决,数据问题历史久远,难以对产生数据的原因和责任人溯源,再或者,整改数据的成本远大于数据质量提升所带来的收益。

因此,为了真正做好数据治理工作,很多时候要关注的不是治理本身,而是数据管理机制的建设,数据责任的落实,数据质量评价和整改的自动化处理技术,以及数据系统的流程控制与审核等等

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询