希望和快乐的倾向是真正的财富;一是恐惧和悲伤真正的贫困。 — 大卫·休谟 抽象的 营销人员花费大量时间谈论在完美的时间将正确的信息传递给完美的人的重要性。当用户不感兴趣时通知或发送电子邮件可能会导致许多用户关闭应用程序通知或报告垃圾邮件,从而阻止所有未来的通信。 营销是以财务和用户体验为代价的。如果平台上有 10 万用户,明智的做法是只为可能有兴趣购买/转换的一部分用户付出努力。 识别受众中谁最有可能实际购买、接受报价或注册服务的最佳方法是 。让我们通过研究一个问题陈述来更好地理解倾向模型: 倾向模型 建立一个倾向模型来确定用户是否会在回访时购买。 目标 客观的 倾向模型来确定一个人在回访时购买产品的可能性。 我们需要确定每个用户的转化概率。 业务成果 倾向得分将有助于细分用户并开展不同的营销活动,从而提高转化率。 我们可能会向高倾向用户共享移动通知或电子邮件,以提供独家优惠,帮助企业提高对话率。 方法 什么是倾向得分? 倾向是一种以某种方式表现的自然倾向。我们都有倾向——我们倾向于做的事情。 倾向建模试图预测访问者、潜在客户和客户执行某些操作的可能性。 倾向得分可以定义为 P(Target = 1 | Z),其中 Z 是用户在网站上的行为特征特征。 所需功能 数据分析 分析您的数据,了解正面类别(用户在回访时购买)和负面类别(用户在回访时不购买)的百分比。 正面类 (1) 即用户回访购买:1.53% [高倾向客户] 负类 (0) 即用户在回访时不购买:98.47% [低倾向客户] 指标选择 对于我们提高转化率的营销用例: Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High) 因此我们的指标应该是这样的:召回比精度更重要 Beta 值为 2 将更多地关注召回而不是精度,这被称为 F2 度量。 F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall) 模型训练 倾向模型是一个二元分类问题,我们将为我们的模型使用逻辑回归。 模型训练模式 模型输出 是事件发生的逻辑回归 ,在我们的例子中,事件是用户是否在回访时购买。 prob: 概率 实验 我们使用逻辑回归进行了 3 个不同的特征集实验,发现第二个在我们的指标上表现最好。 模型评估的视觉效果(最佳模型:上述实验表中的第 2 位 | 正类阈值:0.0217) 正类的最佳阈值 = 0.0217 意味着逻辑回归概率≥阈值是正类(用户将在回访时购买),否则为负类。 倾向模型测试数据集的结果 在测试具有 Bounce、OS、TimeOnSite、Pageviews 和 Country 功能的实验模型 2。我们得到了 91.7% 的召回率和 3.9% 的准确率。高召回率与低 False Negative 案例有关,低精度与高 False Positive 案例有关。 测试数据集上的混淆矩阵 注意:为了建立这个模型,我们的目标是最大化转化率。我们更加重视召回,即成本(假阴性)> 成本(假阳性) 如果营销传播成本很高并且业务需求(等于 Precision 和 Recall),那么我们需要更改正类阈值和指标,使得 Recall = Precision(以 F1 分数作为指标)。 模型改进范围 用户是否在网站上登录。 添加流量来源;自然或广告将他们带到网站 使用时间特性:部分用户喜欢晚上购物( ) 案例学习链接 使用技术特征:设备品牌和型号来更好地定位用户。有多个案例研究表明,拥有昂贵/高端设备的用户转化率更高。 ( ) 案例研究链接 考虑通过添加更多用户的地理信息(即城市/州)来试验该模型。来自人均较高的一级城市或州访问网站的用户具有较高的转化倾向。 结论 现在,使用这种倾向模型营销和受众定位可以更智能地完成,用户从平台转换(购买)的机会更高。此外,它还可以帮助营销团队降低成本,因为他们不再需要针对所有访问者运行活动/通知/电子邮件,而是只关注倾向得分较高的用户子集。 我希望你从这个博客中学到了一些新东西。如果你喜欢它,点击👏并分享这篇文章。请继续关注下一个! 作者: ://www.linkedin.com/in/shaurya-uppal/ https 时事通讯: ://www.linkedin.com/newsletters/problem-solving-data-science-6874965456701198336/ https 也在 发布。 这里