睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

赶快收藏!7个常见的数据分析项目模型

时间:2022-04-05来源:生气叻浏览数:129

本文为《数据挖掘与数据化运营实战:思路、方法、技巧与应用》一书第三章的笔记与总结。

最近在做数据挖掘的项目,但是由于本人资历尚浅,想着借鉴一下前人经验,就找到了这本书,看了一阵,虽然这本书是13年出版的,但是干货很多,作者经验丰富,里面的实战案例给了我很多启发,是一本不可多得的好书~

一个成功的数据挖掘项目,首先要有准确的业务需求描述,之后则要求项目相关人员自始至终对业务有正确的理解和判断 对业务的理解和思考,永远高于项目的分类和分析技术的选择。

1目标客户的特征分析

目的:找准目标客户,目标受众,才能进行精细化运营

在目标客户的典型特征分析中,有两种业务场景:

试运营前的虚拟特征探索

试运营后的真实数据探索

试运营前:没有真实的业务环境,没有真实的用户数据,需要寻找类似的业务场景中的历史数据来进行模拟和推断。根据产品设计理念、产品定位、经验推测等因素来输出期望的目标客户典型特征,后续根据试运营后的真实数据再作调整。

试运营后:基于真实的业务场景中的用户数据进行数据分析,提取出的目标用户特征更准确更可行,也更贴近业务。最终输出该产品的核心目标用户特征分析报告,为运营团队的精准营销提供支撑。

2目标客户预测(相应、分类)模型

包括:

流失预警模型

付费预测模型

续费预测模型

运营活动相应模型

......

目的:预测个体相应的概率,展示变量之间的关系

例:建立预测响应模型,判断特定时间段发生交易的概率

输入变量:近一个月曝光,店铺评分,...

输出变量:是否在线交易

最终发现近一个月曝光,店铺评分两个变量和输出变量最大正相关,则有理由相信,提高曝光,提高评分可以促进交易量。

3运营群体活跃度定义

活跃度的定义没有统一标准,一般是根据特定的业务场景和运营需求来量身定做的。其中定义活跃度最常见的两个基本点是:

活跃度组成指标应该是该业务场景中最核心的行为因素

衡量活跃度的定义合适与否的重要判断依据是其能否有效回答业务需求的终极目标

例:某产品可以向卖家提供与买家洽谈功能,免费版提供基本功能,付费版提供所有功能。现在需要为该产品定义一个用户活跃度,来促进用户从免费版转化为付费版。

关键指标:用户登陆次数,用户使用核心功能次数

评判该定义是否合适,需要看按照该定义出来的活跃用户中,覆盖了多少实际付费的用户。覆盖率越高,则该定义越好。也可以理解为该定义是否有效的分离了免费用户和付费用户。

4用户路径分析

主要分析用户在网页/app上流转的规律和特点,发现频繁访问的路径模式,这些路径的发现可以有很多业务用途,包括提炼特定用户群体的主流路径、网页设计的优化和改版、特定群体的浏览特征等。

路径分析的目的:

监控运营活动(或目标客户)的典型路径,通过分析调整运营策略,最终提升用户点击页面的效率

发现并提炼新的有价值的频繁路径模式,提升运营效率和特定效果

5交叉销售模型

理论依据:客户付费后,企业会想办法保留或延长客户对企业的生命周期和利润贡献。

两个运营方向:

延缓客户流失

提高顾客消费

第一个方向,通常是客户流失预警模型发挥作用,利用流失预警模型,提前锁定可能会流失的有价值客户,通过各种手段挽留客户,降低流失率。

第二个方向,通过数据挖掘,找出客户的潜在消费需求,从而更好引导、满足、迎合客户需求,最终促使客户更多的消费。其中主要用到交叉销售模型。

交叉销售模型通过对用户历史消费数据的分析挖掘,找出有明显关联性质的商品组合,然后用不同的建模方法,去构建消费者购买这些关联商品组合的可能性模型,再用其中优秀的模型去预测新客户中购买特定组合商品的可能性。

4种思路:

购物篮分析(有针对性的促销和捆绑)

对重要商品建立预测响应模型,向可能性最高的前5%顾客进行精准营销和推广

让重要商品两两组合,建立预测响应模型,找出最有可能消费的潜在客户进行推广

决策树

其中的建模技术包括:

关联分析(Apriori)

序列分析(在关联分析基础上增加先后顺序)

预测(响应、分类)模型:逻辑回归,决策树

6信息质量模型

举个例子:在同等条件下,一个要素齐备,布局合理,界面友好的店铺或商品详情页一定比不具备核心要素,布局不合理,界面不友好的更加容易达成交易,更容易获得买家的好感。这其中就体现了信息质量的重要价值。

信息质量模型主要应用场合包括:

商品Offer优化

网店质量优化

论坛发帖质量优化

违禁信息的过滤优化

其他设计信息质量监控和优化的场景

策略:专家打分,模型拟合

信息质量模型师电子商务和网上交易的基本保障,其主要目的是确保商品基本信息的优质和高效,让买家更容易全面、清楚、高效的了解商品主要细节,让卖家更容易,更高效的展示自己的商品。

7服务保障模型

作用:为卖家提供有价值的服务去支持、保障卖家生意的发展。

举例:

让卖家购买合适的增值产品

让卖家续费合适的增值产品

卖家商业信息的违禁过滤

卖家社区发帖的冷热判断

模型:预测(响应、分类)模型

8用户(买家、卖家)分层模型

分层模型是介于粗放式运营与基于个体概率预测模型之间的一种折中和过渡模型,其既兼顾了(相比较粗放运营而言)精细化的需要,又不需要(太多资源)投入到预测模型的搭建和维护中

常用场景:

客户服务团队需要根据分层模型来针对不同的群体提供不同的说辞和相应的服务套餐

企业管理层需要基于在线交易卖家数量来形成以其为核心的卖家分层进化视图

运营团队用客户分层模型指导相应运营方案的制定和执行,从而提高运营效率和付费转化率

这些分层模型既可以为管理层、决策层提供基于特定目的的的统一进化视图,又可以给业务部门做具体的数据化运营提供分群(分层)依据和参考。

分层模型的关键:根据实际业务经验定义不同层级的含义,根据实际经验及数据划分不同层级间的阈值。

比较常见的分层模型:RFM

9卖家(买家)交易模型

目的:为买卖双方服务,帮助卖家获得更多的买家反馈,促进卖家完成更多的交易、获得持续的商业利益

其中涉及的主要分析类型包括:

自动匹配(预测)买家感兴趣的商品(即商品推荐模型)

交易漏斗分析(找出交易环节的流失漏斗,帮助提升交易效率)

买家细分(帮助提供个性化的商品和服务)

优化交易路径设计(提升买家消费体验)

......

10信用风险模型

包括:

欺诈预警

纠纷预警

高位用户判断

......

一般的信用风险模型由专门的风控团队负责,但从数据挖掘的角度来看,信用风险模型搭建和常规的数据挖掘没有太大区别,算法思路基本相同,其中的区别在于业务背景。相比于常规的数据挖掘,信用风险分析有以下特点

分析结论或欺诈模型的时效更短,需要优化(更新)的频率更高

行骗手段是随机性的,所以欺诈预警模型对及时性和准确度要求很高

对预测模型提炼出的因子进行规则梳理和罗列,可以在风控管理的初期阶段有效锁定潜在目标群体

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询