睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

关于数据和数据思维的一些思考

时间:2022-05-18来源:寂寞夜晚浏览数:271

当前正当红的数字化潮流,在更大的范围内,将客观现实记录保存下来,这必将导致数据量的爆炸式增长,今后我们面临的不是没有数据,而是太多的数据,如何选择的问题。

数据和数据思维是一个很大,很严肃的话题,应该在学校或者一些学术性的场合讲会更适合一些。

对于这样严肃的话题,小伙伴们在工作以后就被各种繁琐的事故缠身,很少有时间在去深入思考和学习这样看着不切实际的东西,更多关注的是,这个事情怎么做,这个功能怎么实现,你就告诉我实现的步骤就可以了,步骤1,2,3……, 至于为什么,及其背后的原理都懒得的了解一下了。

我自己也是在踩了很多坑以后,才不得不重新回来思考这样的问题,看着很多小伙伴还在不断的踩坑,所以就试着个人的一些理解来给大家讲讲,就当时抛砖引玉,有不妥之处,大家尽管拍砖!

数据到底是撒?

那么首先来讲: 什么是数据,相信在看的小伙伴,对数据接触的应该是最多的。可能这是一个不是问题的问题。大家也可以在心里默默的思考一下,看看最后给出的答案是否符合心中的预期……

在回答什么是数据前,先来看看 什么是 “数”

数的概念源自人类的计数活动。有人就有数,有生活就有数,看看先哲们对“数”的解读


数字就在人类的生产,生活的活动中产生

从“数”到“数据”,先看看下面这些问题

从广义上来说,所有对生活,生产活动的记录,都应该被算成数据,视频,音频,图片,文章,书籍等都可以被看成数据,只是他们的表现形式略有不同而已,或者说是承受的载体不同而已,然而目前这个阶段,或者说对于我们大多数普通人来说,这些离我们还是比较遥远的,或者或是不切实际的,为什么呢?因为我们不能分析“他们”,如果我们不能分析,那么就算是数据,又能有什么意思呢?


所以,最后的大家都能懂的结论来了,就是仅以数据表的形式存储在计算机上的,才能被视作数据。


对于数据表,大家应该都很熟悉的吧,其实不然,在这方面我们也踩过很多坑,只是有人已经感觉到了,有人还没意识到而已。

数据表,粗略的看起来,数据表包含3个部分:表头,记录和字段,这个大家应该都清楚的。


让我们来重新认识一下“数据表” 来做个小练习,看看对数据表掌握的怎么样?

红色框起来的都不是严格意义上的数据表,具体缘由限于篇幅,就不展开了。

数据如何产生

请牢记:

被记录下来的才是数据

被记录下来存储到计算机磁盘上的才是数据

在企业与社会活动中,随着业务活动的展开,数据被不断的增加或修改的过程,就是不断描述和记录该事件的动态过程。

会计行业是数据现代化发展的奠基石

围绕着企业经营活动展开的同时,从投资起始,原料采购,加工制造,销售,回款的资金流向这一主线,企业内所有的业务行为都被借贷记账的形式,记录在会计账簿上。最后被用以进行企业的销售,成本,盈利结算。


202X年了,记账会计已经基本被主流企业所淘汰,逐步被管理会计取而代之!

数据分析师在职能上覆盖了管理会计,而且更广,所以管理会计的抬头没有火就被取代了。

数据的基本特征

数据分析的核心是比较,没有比较,就没有伤害! 曾经有一个笑话,大家可能都听过的。

快过年,老王回到家,告诉老婆说,今年单位效益不错,发了1万块年终奖。老婆听了,很是高兴,因为往年的话,只能拿5000元左右的水平,所以相比往年来说,已经double了当然很开心。

然后,老婆问老王,“那个老李这次分了多少?”,老王回答,“老李这次的考核得了A,大概拿了2万块吧。”听到这,老婆的心情瞬间跌倒谷底,这算什么事啊,你们不是干一样的活嘛,凭什么他拿的比你多这么多呢?


有了比较,就能看出差距!比较是数据分析的核心!


数据思维

有了数据,再来聊聊什么是数据思维,在日常工作和生活中大家经常会遇到一些人,他们对数据特别敏感,面对一堆杂乱无章的数据时,他们很快能理清思路,或者你随便问一个问题,比如这个月的业绩怎么样,他们很快就能回答你的问题,好好在哪里,差的话,有差在哪里,不足在哪里,改进方向在哪里, 都如数家珍……那么你是不是很羡慕这样的人,也希望能拥有这样能力呢?

那么,我们会认为这样的人,拥有数据思维的能力,最不济也能被定义为:对数据敏感!

这其实是很难达到的,需要不断地积累!

接着再来拆解一下,到底什么是数据思维,以及随着时代,科技的进步,数据思维也呈现一定的发展趋势。

数据的从无到有

数据需要被记录保存下来,才能被分析,才能称之为数据!

从大约十年前,就不断有人喊,数据时代,这应该是毫无疑问的,我们每个人的手机,记录了你几乎大部分生活轨迹,好的,不好的……

工厂里,生产制造的各种参数,产品的各种测量数据,都被记录下来……


当前正当红的数字化潮流,在更大的范围内,将客观现实记录保存下来,这必将导致数据量的爆炸式增长,今后我们面临的不是没有数据,而是太多的数据,如何选择的问题。 太多的选择性困难,回答同样一个问题,我们可能会面临好几份不同来源的数据,该如何抉择……, 这个问题就先放下。

从另一个方面来讲,如果一份数据太干净,质量太高,我们不得不怀疑这是一份“假数据”,就像当我们看到一个可以打10分的美女时,不得不感叹!这是整过的吧!这可能是我们选择数据的考量之一。

从小数据时代到大数据时代的过度,思考数据方式也应当做出相应改变:

全数据思维要全体不要抽样

容错性思维要效率不要精确

相关性思维从相关到因果

数据能代表一切吗?

爱情,一直都是说不清道不明的存在!只要是人,数据永远不能代表全部!

......


我们应该怎么做?

很多时候,大家都在说,拿数据来说话,可是真的当你拿着数据出来说的时候,别人也同样拿出他们的数据来,理所当然,理直气壮的反驳你。

有句话,说的好,历史是个任人打扮的小姑娘,那么数据也是,数据也是一个任人打扮的小姑娘而已。

因为数据,就像是历史,社会和生活构成了“数据”本身。

此时,我们要怎么办呢?培养良好的数据意识,但不能一味盲目的相信数据!

一点思考,与大家共勉!

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询