- 产品
- 产品解决方案
- 行业解决方案
- 案例
- 数据资产入表
- 赋能中心
- 伙伴
- 关于
时间:2022-05-08来源:反差帅浏览数:145次
数据质量的高低其实是一种感知,很大程度上不在于数据提供方、数据治理方,而是在于数据消费方,只有数据消费方能准确定义数据需求的满足度
今天早上刚起来,我发现朋友圈和多个专业聊天群里被一条博文刷屏了:
该博文宣称3月全国个人所得税同比下降51.3%,和2020年3月、2021年3月比,显著暴跌,然后开始感叹经济凋敝、民不聊生,得到了我朋友圈里的财经界、科技界人士的共情,并迅速成为十万加热文。我在一个朋友的朋友圈里提醒他,这条信息可能不太准确,还被反唇相讥了。
作为咨询顾问,我自然对财经数据很敏感,个税的确是和经济紧密相关的,直观地想,就算是经济再不景气,同比暴跌51.3%肯定是不可能的,另一方面,我朋友圈里情绪比较大主要是因为对上海疫情处置,但是这也是3月份底以后的事情啊。所以,我判断今年3月份的个税同比变化,肯定是一个异常数据。
我思考的问题很容易就找到了答案——如果当我们把数据分析窗口拉大,不是“同月”对比,而是用“YTD(year to date)”数据来比的话, 我们会发现数据变动并没有那么大——我找到了一个数据(下图),今年1-2月份,个税同比大增了46.8%。
所以大家来做个算术吧,今年一季度中国的个税收入和去年同比变化是多少?
这个例子带给我们在数据治理和数据分析的启示是:
一、数据质量的高低其实是一种感知,很大程度上不在于数据提供方、数据治理方,而是在于数据消费方,只有数据消费方能准确定义数据需求的满足度
二、数据会骗人,尤其是数据使用者预设了心理假设,他总能通过数据分析来证明他想象中的真相;数据使用者要具备利用数据进行事实探测的能力,而不是被“投喂信息”(数据->信息->知识的过程优化)
三、数据分析不适合使用固定指标和固定格式,要充分利用数据源和数据仓库,根据数据分析的业务思考,灵活调整分析维度(例如本例的时间维度)
四、数据分析的水平,跟用啥工具没太大关系,跟用数据的人的水平有关系。
最后,这个给我们带来的启发是:上网需智商,喷人要谨慎。