睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

商业数据分析案例:星巴克是如何优化促销活动的?

时间:2022-02-07来源:三七浏览数:240


       比如,星巴克的数据科学家是如何通过选择不同的价格、产品、持续时间、内容等因素,组合出效果最好的促销活动。

       今天我们就通过这篇分析,来尝试了解用户统计信息与促销活动之间的关系,并最大程度增加收入。

       01 目标

       分析的目标是确定优惠信息和受众之间的重要关系。共有 10 个优惠,如下所示:


       ▲促销优惠为了细分哪些受众与哪些促销有关,我们将对这10个优惠进行启发式分析和回归分析。具体来说,我们要: 确定每个细分市场对哪些促销活动最为敏感 根据预期收入确定要发送给每个细分市场的促销信息 

       02 第 0 部分:预处理和探究

       任何数据分析的第一步都是检查数据集的质量并进行预处理,以解决那些可能导致分析混乱的问题。观察数据可以发现十分奇怪的一点,有一大批用户的年龄显示为“118”,这些用户也碰巧没有指明收入的值。我的猜测是,因为缺少相关的年龄和收入数据,所以只有在考虑性

       别对购买行为的影响时才用得上这些数据。

       又因为我们只考虑年龄和收入,不包括性别,所以我将这些数据排除在分析之外。在仔细观察数据集的大小和分布之后,我认为最合适的细分方法是按年龄组和性别进行划分。尽管从技术上讲我们可以进一步细分(例如按收入、加入日期),但分到这一步就已经能很好地理解两者的关系。

       除此之外,还可以执行一些其他的数据预处理方法,确保数据集便于分析,包括: 将分类变量转为虚拟变量(dummy variable) 统一日期格式 从数据中提取特征 进行特征工程以确定细分条件

         03 第 1 部分:促销敏感程度

       为了确定每个细分市场对 10 个优惠的敏感程度,我们需要观察优惠被查看后的购买情况,这其中不包括用户没看到优惠但依然购买的情况,也就是说他们总得花那么多钱。

       ▲不同人群的购买情况综上所述,有几个关键点:

       1. 一般情况 

       在所有细分市场中,优惠5–8响应率很高,这些也都碰巧是通过社交渠道(以及网络、电子邮件、移动设备)提供的优惠。可以把社交渠道单拎出来验证它是不是会对反应率造成影响。 优惠7的整体响应率特别高,而且它就是一个优惠的通知信息。但是和同类的优惠2相比,响应率存在明显差异——这进一步强调了社交渠道的有效性。 难度最高(10天之内最低消费为20美元)且奖励最高(5美元折扣)的优惠4的整体响应率最低,这很可能是由于只通过网络和移动设备发送的关系

         2. 细分市场 

       女性细分受众群(2、5、8、11)的平均响应率比男性细分受众群的更高,尤其是那些通过移动设备和社交渠道传播的优惠。 细分1(千禧一代,男性)的响应率特别低(40%左右,而其他大多数都> 50%)。 其他性别的细分(3、6、9、12)的响应率分布情况大为不同,这很可能与样本量极低有关。 总结来说,高响应率与通过社交渠道(尤其是女性群体)提供的优惠有关。

       04 第 2 部分:哪种促销?

       由于促销响应程度只是整个分析的一部分,因此我们需要更好地了解每个细分市场的财务情况所造成的影响。为了评估财务指标,需要进行回归分析。从考虑的候选模型中,2阶多项式最为合适,因为它的训练和测试得分相对较高。

       通过使用2阶多项式回归,我确定了每个细分受众群对优惠最多肯花多少钱:

       最后我针对每个细分市场得出了热门优惠:

       从这些结果中我们可以认识到: 优惠4(5 美元折扣、10 天内花 20 美元)对大多数细分市场最为有效。 一般来说,优惠 0、1 和 9效果也很好,紧随优惠4之后。 前十种优惠的优惠类型不是“折扣”就是“买一送一”,几乎均等。

 

       收入与支出金额为正相关关系,与直觉相符。

       “沉默的一代”细分市场预期收益最高,其次是“婴儿潮”和“千禧一代”。(“沉默的一代”:二十世纪二十年代中期至四十年代早期出生的人, “婴儿潮”:1946-1964年出生的人,“千禧一代”:八十年代早期至九十年代中期出生的人)

 

       总的来说,高潜力的优惠(优惠4)可能由于其传播渠道和目标人群的选择而表现不佳。

       05 结论

       该分析提供了一些重要的看法,有助于缩小未来的分析范围和制定总体促销策略。根据目前的优惠组合,最好的促销策略是向高收入女性(尤其是“千禧一代”和“沉默的一代”)提供优惠0和优惠1,因为她们的优惠购买率高,而且预期支出也相对较高。但是,在制定强有力的促销策略之前,还得做一些其他实验和分析,其中包括: 验证购买率和传播渠道之间的关系。 具体来说,如果通过社交渠道提供优惠4(最高回报,最低购买率)会发生什么? 对于每个细分市场,要发送的优惠的最佳组合是什么? 探究“意外购买”(没查看优惠,但依然购买)的价值——它是否会导致未来的支出行为发生变化吗? 进行类别分析(例如K-Means聚类)来验证、确认识别出的细分市场。 有什么方法可以提高男性的购买率(因为他们的预期支出很高)? 用更大的样本数据对其他性别(3、6、9、12)进行细分。 原文:https://towardsdatascience.com/starbucks-promotion-optimization-ca56e29fb584


(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询