希望和快乐的倾向是真正的财富;一是恐惧和悲伤真正的贫困。 — 大卫·休谟
营销人员花费大量时间谈论在完美的时间将正确的信息传递给完美的人的重要性。当用户不感兴趣时通知或发送电子邮件可能会导致许多用户关闭应用程序通知或报告垃圾邮件,从而阻止所有未来的通信。
营销是以财务和用户体验为代价的。如果平台上有 10 万用户,明智的做法是只为可能有兴趣购买/转换的一部分用户付出努力。
识别受众中谁最有可能实际购买、接受报价或注册服务的最佳方法是倾向模型。让我们通过研究一个问题陈述来更好地理解倾向模型:建立一个倾向模型来确定用户是否会在回访时购买。
分析您的数据,了解正面类别(用户在回访时购买)和负面类别(用户在回访时不购买)的百分比。
对于我们提高转化率的营销用例:
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
因此我们的指标应该是这样的:召回比精度更重要
Beta 值为 2 将更多地关注召回而不是精度,这被称为 F2 度量。
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
倾向模型是一个二元分类问题,我们将为我们的模型使用逻辑回归。
模型训练模式
模型输出
prob:是事件发生的逻辑回归概率,在我们的例子中,事件是用户是否在回访时购买。
我们使用逻辑回归进行了 3 个不同的特征集实验,发现第二个在我们的指标上表现最好。
模型评估的视觉效果(最佳模型:上述实验表中的第 2 位 | 正类阈值:0.0217)
正类的最佳阈值 = 0.0217 意味着逻辑回归概率≥阈值是正类(用户将在回访时购买),否则为负类。
在测试具有 Bounce、OS、TimeOnSite、Pageviews 和 Country 功能的实验模型 2。我们得到了 91.7% 的召回率和 3.9% 的准确率。高召回率与低 False Negative 案例有关,低精度与高 False Positive 案例有关。
测试数据集上的混淆矩阵
注意:为了建立这个模型,我们的目标是最大化转化率。我们更加重视召回,即成本(假阴性)> 成本(假阳性)
如果营销传播成本很高并且业务需求(等于 Precision 和 Recall),那么我们需要更改正类阈值和指标,使得 Recall = Precision(以 F1 分数作为指标)。
现在,使用这种倾向模型营销和受众定位可以更智能地完成,用户从平台转换(购买)的机会更高。此外,它还可以帮助营销团队降低成本,因为他们不再需要针对所有访问者运行活动/通知/电子邮件,而是只关注倾向得分较高的用户子集。
我希望你从这个博客中学到了一些新东西。如果你喜欢它,点击👏并分享这篇文章。请继续关注下一个!
作者: https ://www.linkedin.com/in/shaurya-uppal/
时事通讯: https ://www.linkedin.com/newsletters/problem-solving-data-science-6874965456701198336/
也在这里发布。