睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据分析中“如何形成分析思路”一些思考和见解

时间:2022-06-26来源:兮昕浏览数:140

确认数据真实性,了解整体数据情况数据质量是数据分析的生命线,在开始着手分析前,一定要确认数据的真实性:DAU环比/同步下降30%的准确性。我们经常会遇到数据服务、数据上报、数据统计上的BUG,在数据报表上就会出现异常值。所以,先去找数据流相关的产品和研发确认下数据的真实性。

‍当生活拿锤子抡向你的时候,只要捶不死你,你就有机会抡回去。‍

前言 

数据分析中该如何落地?“定义问题”是首要的,但在定义问题的同时就需要形成一个体系化的分析思路,有体系化的分析思路可以将复杂的数据分析工作进行拆解,让数据分析的过程更加严谨,使结论落地执行,提高工作效率。因此,在数据分析应用过程中,“分析思路”相当重要在实际场景中,如何形成体系化的分析思路呢?本篇以实际场景为例,梳理在数据分析中,如何形成分析思路的一些思路和见解!

1实际场景中“问题”

在实际工作场景中,一般情况下,数据分析人员大部分时间做数据处理等相关工作,在形成体系化分析思路就会被忽视。当面对具体业务问题时,突然间头脑中的思绪仍是一团乱麻,看着数据却不知道怎么用数据来论证业务问题。杂乱无章的分析思路只能帮助我们找到一些片面原因,甚至会把我们带离正确的方向。

因此,懂得如何形成一个体系化的数据分析思路是每个数据分析人员必须具备的能力。“分析思路”本质上就是站在一定高度去的多维度分析或者拆解业务逻辑等相关问题。

那么,我们以一个实际的工作场景为例来梳理一下“如何分析思路”的具体操作:

互联网产品公司,产品运营同事找到数据分析师说:“DAU下降了,帮忙分析一下原因”

2如何形成分析思路?与业务沟通后,根据【如何定义问题】的步骤,进一步明确了问题:2021年4月DAU环比/同步下降30%,而正常波动范围是±10%,因此认为有显著下降。此次分析的目标在于找出下降的主要原因,并在下个月(5月)解决。那么,根据前面用户行为分析如何落地—【如何形成系统化的分析思路】的步骤,具体思路如下: 

第一、确认数据真实性,了解整体数据情况数据质量是数据分析的生命线,在开始着手分析前,一定要确认数据的真实性:DAU环比/同步下降30%的准确性。我们经常会遇到数据服务、数据上报、数据统计上的BUG,在数据报表上就会出现异常值。所以,先去找数据流相关的产品和研发确认下数据的真实性。 了解整体数据情况,如,pv、日均访问量、用户总数、订单数、会员数、总销售额、用户来源分布及占比、有购买行为的用户数量、用户的客单价、复购率分别是多少?等等整体用户概况数据。了解到活跃用户的规律。市场政策的变化,节假日、电商节等节日,常见的运营策略调整都能引发活跃数据变化。找到一些明显的规律后,根据未来要发生的时间,预计指标波动情况,及时调整运营策略。如下图,可看出活跃用户数在周末以及十一节假日呈阶梯式下降,有对应事件发生以及对应波动形态,可见具有周期性规律,在周末时可调整营销活动等运营策略,使增长趋势平稳,但要综合考虑产品属性和用户属性。 注:为某考勤类APP十月份活跃数据趋势图,已做数据脱敏处理。 

第二、确定结合具体业务场景,拆解日活(DUA)指标常见的初步拆分维度,通过初步拆分,定位原因大致范围。如下图: 

第三、通过对比分析方法,DUA同比/环比/占比观察,区分活跃数的异常变化情况通过DUA同比/环比/占比观察,出现阶梯式、持续性、非规律性等活跃波动为异常。但不是所有的异常波动都值得排查,但是要记录发生时间,观察走势,当问题出现恶化时容易溯源。这就是为什么要建立数据监控体系。 如下图,可看出活跃用户数在10月22日到10月24日红框区域出现活跃异常波动,首先要了解日活究竟跌了多少,其次通过通过DUA同比/环比/占比观察,跌幅是否在合理的范围,最后确定为非规律性异常。 注:为某考勤类APP十月份活跃数据趋势图,已做数据脱敏处理。 

第四、异常范围定位后,挖掘异常变化的原因,进一步做假设针对初步定位的影响范围,进行进一步的排查。分三个维度来做假设,建议针对数据异常问题专门建一个群,拉上相应的产品、技术、运营人员一起,了解数据异常时间点附近做了什么产品、运营、技术侧调整。 综合考虑以往数据异常原因、产品运营技术侧调整、初步定位影响范围可能由什么原因造成,再结合自身业务经验确定几个最可能的原因假设,给这些假设排数据验证的优先级,逐一排查。 

第五、细分假设,确立原因除了上述,可以细分分析的维度实在太多了,逻辑上说核心点在于一个假设得到验证后,在这个假设为真的基础上,进行更细维度的数据拆分。 我们需要记住这种分析方式,当猜测是某种原因造成数据异常时,只要找到该原因所代表的细分对立面做对比,就可以证明或证伪我们的猜测,直到最后找到真正原因。 

第六,进行问题点测试,验证分析结果拆分新老用户活跃量(因为如果不是产品异常,最有可能的是新用户影响的)通过分析,如果确定是新用户问题,我们再把新用户日活按渠道进行拆分:新用户=渠道1+渠道2+渠道3+其他渠道 通过渠道拆分,我们会发现是具体哪个渠道效果发生的问题,验证分析结果。然后去联系此渠道的负责人一起定位具体原因,是渠道转化率降低?还是渠道平台的问题?等等找出原因后,再针对原因解决问题,制定渠道优化策略。

小结

分析思路其实是在做数据分析的从头到尾的流程,是对业务分析目标的细化以及拆解。但要解决实际业务场景中遇到的问题,要先明确具体需要解决的问题,才能针对性的思考相关解决思路。分析的问题如果都不清晰,就会造成分析思路的偏离。

“分析思路”直接奠定了数据分析结论准确、是否实用、是否落地。我们还要学会运用系统的分析方法来辅助“分析思路”,可以高效迅速地达成目标。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询