睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据分析的九大常用基本方法

时间:2022-11-24来源:落秋凉浏览数:1378

数据分析是针对某个具体的问题,将获取后的数据用分析手段加以处理,并发现业务价值的过程。学习数据分析理论知识时,除了高等数学、统计学、算法原理等专业知识以及必要的SQL、R、Python等技术语言和工具使用能力外,有一套常用的基础分析方法,可以不局限于特定的业务场景或分析对象,具有普适性。

本文将围绕数据分析的九大常用基本方法进行介绍:

1.周期性分析法

周期性分析法指从日常杂乱的数据中发现周期性规律,通常用来避免低级分析错误的产生,或者用于发现数据中的异常情况。周期性分析常见的有两者:自然周期和生命周期。自然周期,指业务指标会随着时间自然变化,如节假日用户/业绩出现下滑、产品销售额随季节变动等,适合具有自然规律波动的分析对象,比如保暖用品有淡旺季,吃喝娱乐有节假日的聚集等,随着业务的特性而表现不尽相同。生命周期,在进行分析或运营过程中经常可以见到譬如“商品生命周期”、“APP生命周期”、“用户生命周期”等描述,这些都是由时间轴+指标走势组合出来的,如一款新商品上市,其销量和上市时间,经常有如下图的表现规律,通过分析定位产品发展周期,及时调整经营策略。2.结构分析法

结构分析法是通过了解关键指标的构成方式,跟踪关键指标的走势和结构变化情况,在关键指标出现明显上升/下降的时候,找到变化最大的结构分类,分析问题原因。通过结构分析可以认识总体构成的特征。如2022年某市生产总值100万,其中第一产业占4%、第二产业占20%、第三产业占21%、高新技术产业占比55%;且该市近五年来高新技术产品比重第一年占20%,第三年占32%,第五年占55%,这些信息可以揭示该市生产总值各产业的变动趋势,研究总体结构变化过程,表明产业结构向高新技术产业转变的规律性。3.分层分析法

分层分析一般用来处理平均值失效的场景,如一个人或是少部分人群数值过高或过低,导致把人均数值过分拉高的情况,这就是典型的平均值失效。分层分析法处理这个问题的思路是将人群按层级划分,即数值偏离程度较大的人群单独分层,每个阶层单独统计平均收入,这样就解决了平均值失效的问题。分层分析的实施步骤一般为:第一步:明确分层对象和分层指标。如区分销售能力场景下,分层对象就是销售员,分层指标就是销售业绩。第二步:查看数据,确认是否需要分层。分层是应对平均值失效的情况的,原则上最大值和最小值之间差异越大(10倍以上),越值得做分层。第三步:设定分层的层级。有些时候到底多少业绩算“高”,并没有一个明确的阈值去定义,这时候可以参考“二八法则”,如下图示意:分层的最大作用是帮我们看清楚到底谁是主力,谁是长尾;但也存在缺点,如果只考虑一个分层指标,可能无法全面说明问题,因此通常需要和其他方法结合使用。

4.矩阵分析法

矩阵分析法,指通过交叉两个指标,构造分析矩阵,并利用平均值切出四个象限,从而发现问题的方法。很多咨询公司倾向于使用这种方法,如Gartner的魔力四象限图、KANO模型和波士顿矩阵,其本质就是找到了两个较好的评价指标,通过交叉这两个两指标构造矩阵,实现对业务的分类。矩阵分析法中还可以叠加时间维度,比较不同对象在矩阵分区中的位置差异,来分析各自的发展迁移情况。5.指标拆解法

指标分解法是将一个相对复杂的指标分解成若干个子指标,再对每一个子指标进行研究,从而达到易于分析、便于实行的目的。常用的指标分解法为总分法,即直接把核心数据拆分成若干个子指标,这些子指标通过运算组合起来就可得到核心数据。比如:

这样的拆解,能够帮助企业快速看清楚利润来源和收支结构,从而优化企业经营。又如零售行业常讲的:人货场模型,其实就是将销售收入按用户、员工(人)商品(货)渠道(场)进行拆解,从而分析业绩好坏变动与哪部分密切相关。

6.漏斗分析法

漏斗分析法是一套流程式数据分析,可以理解为把最终目标放到漏斗最下方,并将各个中间环节按照顺序依次放入漏斗中,然后从上往下,寻找每个环节的流失严重点。因此,漏斗分析法常常被用来分析用户转化问题、用户流失问题等,探究用户路径上阻碍用户转化的关键环节,从而快速定位影响用户体验的关键步骤,进行针对性优化策略。例如广告投放时,可以进行广告用户转化、新手引导流失等分析,这就经常会使用到漏斗分析法。以广告转化为例进行说明,广告用户从看到广告到进入APP有一个转化路径,可以把这个路径看做一个漏斗,因为每一个步骤都会漏掉一批用户,如果想要提升用户转化的比例,毫无疑问需要减少每个步骤漏掉的用户,企业通过分析用户在每一关键步骤漏掉的原因,并针对每一个原因逐一对产品进行优化,进而提升用户转化率。

7.相关分析法

相关分析法是研究两个或两个以上处于同等地位的变量间的相关关系的分析方法,可分为直接相关和间接相关。以下三种关系被称为直接相关:

在结构分析法中,整体指标与部分指标之间的关系

在指标拆解法中,主指标与子指标之间的关系

在漏斗分析法中,前后步骤指标之间的关系 直接相关不需要数据计算,通过指标梳理就能看清楚关系。直接相关的指标通常表现为同增同减,步调一致。间接相关又称为理论相关,例如广告投入和销售额的关系。常规认知中,广告投放的越多,知名度越高,销量越高。分析间接相关关系,有两种常用方法,一种是散点图法,通过绘制散点图,观察二者的相关关系。如果散点图显示图像是有一定规律的线条(如下图所示),则说明存在相关关系。另一种是计算相关系数,获得的相关系数越接近1,则相关性越大。在此案例中,计算发现广告投入与销售两个指标之间确有相关关系。至于具体是怎么相关的,可以再做进一步研究。但相关分析也有两大不足,一是得到的相关关系不等于因果,二是相关分析不能解决非量化指标问题。

8.标签分析法

标签分析,特指用打标签的方式,把难以量化的因素转化为标签,进而分析该因素与其他变量的关系。一般分为以下五个步骤:

明确要分析的影响因素

把影响因素制作成标签

明确要分析的指标

对比不同标签下指标的差异

得出分析结论 有时我们分析的关系无法通过指标表达,如:是不是私域流量比公域流量,转化更佳?是不是晴天比雨天的信用卡地推效果更好?私域流量/晴天,是难以衡量的数据指标。但这些因素确实会对企业经营产生影响,这时可以通过打标签的方式进行分析。

9.MECE分析法

MECE(Mutually Exclusive Collectively Exhaustive,相互独立、完全穷尽),其中“相互独立”指问题的细分是在同一维度上的并有明确区分、不可重迭,“完全穷尽” 则意味着全面和周密。这种方法通常用于帮助分析人员找到所有影响预期效益或目标的关键因素,并找到所有可能的解决办法,有助于管理者对问题或解决方案进行排序和分析,并从中找到令人满意的解决方案。通常做法有两种。一是在确立问题的时候,通过类似鱼刺图的方法,首先确立主要问题,再逐个往下层层分解,直至所有的疑问都找到,通过问题的层层分解,可以分析出关键问题和初步的解决思路;另一种方法是通过头脑风暴找到主要问题,然后在不考虑现有资源的限制基础上,梳理解决该问题的所有可能方法。在这个过程中,要注意分析方法不是单一的,在实操过程中往往需要将多种方法进行融合使用,再深入分析每种解决方法所需要的各种资源,最后通过分析比较,从多个方案中找到目前状况下最可行、效果最好的答案。这九种基础方法可以相互独立,也可相互组合,需要结合经验在工作中多实践、多运用,找到最优解。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询