睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

企业构建数据中台是否存在一个量化或判断的标准?

时间:2021-02-01来源:知乎浏览数:167

对这个问题有几种解读,第一种解读是说企业是否要构建自己的数据中台,这个问题有没有标准?以这个问题来讲的话,我们认为所有的企业它都需要数据中台,因为他需要从数据里面获得洞察,从数据里面获得它业务经营的指导。

那么这个问题的第二个解读就是如何去度量和判断数据中台做得好不好?数据中台做得好不好,有没有给企业带来价值?我们有一个非常简单粗暴的度量方法,就是数据服务被业务系统和业务人员使用的满意度如何?构建好的数据API继续回答那个问题,第一我们认为数据中台本身应该具备快速的将数据变成API的能力,而不需要让技术人员一个一个去开发API。

数据中台里面的六个能力里,数据中台很重要的一个能力,就是数据服务的构建和治理。数据中台要具备一键式的数据API的生成和一键式的发布,包括数据API的治理,比如说数据API的搜索,数据API的编排,数据API的发现监控,都要有。数据中台之外,还有哪些方法进行优化?如何能更好的以业务驱动数据?除数据中台之外,还有哪些方法来进行优化?我们认为数据中台是一个体系,除了技术的因素之外,有一个非常重要的因素,那就是数据思维。

所以在构建数据中台的同时,企业一定要加强培训,让业务人员具备数据思维。数据思维是数字化的系统里面的这种语言和交流方法,所以我们在构建数据中台的同时,一定要有配套的培训,配套的技能培训、理念培训。配套的这种案例分享,让业务人员知道行业里面其他的这种公司,其他的行业再用数据做什么,只有这样的话,数据中台能得到更广泛地使用,才能得到业务部门的认可,否则的话会像原来的传统数据湖那样不被业务所接受。在这一点上我们又会发现,现在数据中台所受到的欢迎,不仅仅是受业务人员的欢迎,它也很受技术人员的欢迎。那些原来做数据仓库,做数据湖的技术人员,离业务太远,他们做的东西开发出来了,然后给到业务,业务说不行,这东西不是我要的,但实际上他们很苦逼的是在最早的时候,这就是业务部门提供给他的需求,等于是前面提的需求后面又发生了变化,他们就很痛苦。

所以根本的原因是什么?根本原因是他们太依赖于数据本身,业务人员不懂数据,技术人员不懂业务,这是原来数据平台的这种团队和业务团队脱节的地方。那么数据中台,我们认为它从结构上,从理念解决了这些问题。

第二点是业务驱动数据
但是业务要懂数据,数据要懂业务,它俩之间是要拉通的,否则的话业务提供出来的需求很多时候是不具可行性的,或者说它是用原来的技术和方法思维再提需求,它在提需求的本身已经提出了对这个问题的设计。所以它俩之间一定要是拉通的,所以业务价值出发。

第三点是小步迭代,不断的去优化和演进的,而不是做大而全的这种数据系统。

第四点是要持续的改进,持续的去运营。
数据的系统有一个特别典型的特点,那就是不确定性。每个企业都希望自己的河水跑得更快,如何在这样河水里面去做系统?怎么去操作?怎么样去产生业务价值?很重要的一点就是不断的持续优化,随着你河流水的速度,水的温度,水的配方,就是它的里面的元素不一样,你要产生不同的应对的方法。
数据中台的产品化和定制化比例,是个很好的问题。刚才我们回到这个图,还是回到这个图,这个图就很清楚。这里面灰色的部分我们认为是存储、采集,除了集成工作之外这些东西,这些部分相对是比较标准的,结构化,有结构化的存法,非结构化有非结构化的存法,然后你的IOT的数据有IOT的产品去存储,所以这一部分基本上可以产品化,可以用开源的套装或者是产品化去解决。然后在这个数据资产的共享和协作这一块,基本上百分之百都是要定制的,因为不同企业的数据模型,企业里的数据安全的管理方式都是不一样的,所以这一部分数据资产从规划到治理到共享到协作这一块,可能里面有的小部分的组件可以产品化,但是对于数据资产的管理来讲,一定是要控制在企业自己的手里,也就是说它的知识产权和它的技术核心是要掌握在企业自己手里面的,因为数据资产未来是一个最重要的资产,它的数据安全性是企业里面重要的命脉,然后至于业务价值的探索和分析,这个相对来讲可以有一部分的产品化,比如说像现在行业里面的data库这样的数据科学平台,比如说像有的行业里的这种机器学习平台,它部分跟你的业务关联,但是业务关联不是那么的大,它是比较偏技术的,这部分是可以用。然后你的数据服务的构建和发布,还有治理这一块,我们觉得有技术能力的企业尽可能的还是自己研发,你可以用开源的产品,因为你从数据到数据产品的构建过程,实际上也是非常核心的企业的竞争力。

最后数据服务的度量和运营,这个一定是客户化的,因为凡是涉及到数据资产的,当然这里面我们再提另外一个概念,数据资产在很多时候被认为是原数据,那些绕Z是数据资产,但是我们现在认为数据资产不仅仅是包括地产,还包括那些二次加工的数据产品,还包括我们的数据报表,包括我们的数据服务,所有能够产生价值的数据的资源都叫数据资产,所以与数据资产相关的我们认为尽可能的定制,因为它是企业的核心资产,它要变成企业的核心能力。所以这样来看,我们总结一下,基本上产品化和定制化的比例,我们认为可能在三七,也就是30%的纯产品,70%的定制。
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询