Une propension à l'espérance et à la joie est une vraie richesse ; quelqu'un qui craint et s'afflige de la vraie pauvreté. —David Hume
Les spécialistes du marketing passent beaucoup de temps à parler de l'importance de transmettre les bons messages aux personnes idéales au moment idéal. La notification ou l'envoi d'un e-mail lorsque l'utilisateur n'est pas intéressé peut amener de nombreux utilisateurs à désactiver les notifications d'application ou à signaler des e-mails indésirables qui bloquent toutes les communications futures.
Le marketing a un coût à la fois financier et d'expérience utilisateur. S'il y a 100 000 utilisateurs sur la plate-forme, il est sage de ne s'efforcer que pour un sous-ensemble d'utilisateurs susceptibles d'être intéressés par l'achat/la conversion.
Le meilleur moyen d'identifier qui, parmi votre public, est le plus susceptible d'effectuer un achat, d'accepter une offre ou de s'inscrire à un service est un modèle de propension . Comprenons mieux le modèle de propension en travaillant sur un énoncé de problème : créez un modèle de propension pour déterminer si un utilisateur achètera lors de sa prochaine visite.
Analysez vos données en comprenant combien de % de la classe positive (l'utilisateur achète lors d'une visite de retour) et de la classe négative (l'utilisateur n'achète pas lors d'une visite de retour).
Pour notre cas d'utilisation marketing visant à améliorer le taux de conversion :
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
Par conséquent, notre métrique devrait être telle que : Le rappel est plus important que la précision
Une valeur bêta de 2 pèsera plus sur le rappel que sur la précision et est appelée mesure F2.
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
Le modèle de propension est un problème de classification binaire, nous utiliserions une régression logistique pour notre modèle.
Modèle de schéma de formation
Sortie du modèle
prob: est la probabilité de régression logistique qu'un événement se produise, dans notre cas, l'événement est l'achat par l'utilisateur lors d'une visite de retour ou non.
Nous avons effectué 3 expériences d'ensembles de fonctionnalités différentes avec régression logistique et avons trouvé que la 2e était la plus performante sur nos métriques.
VISUEL de l'évaluation du modèle (Meilleur modèle : 2e dans le tableau d'expériences ci-dessus | Seuil de classe positif : 0,0217)
Le meilleur seuil pour la classe positive = 0,0217 signifie que la probabilité de régression logistique ≥ le seuil est la classe positive (l'utilisateur achètera lors d'une prochaine visite), sinon la classe négative.
Lors du test du modèle d'expérience 2 avec les fonctionnalités Bounce, OS, TimeOnSite, Pageviews et Country. Nous avons obtenu un rappel de 91,7 % et une précision de 3,9 %. Un rappel élevé concerne les cas de faux négatifs faibles et une faible précision concerne les cas de faux positifs élevés.
Matrice de confusion sur le jeu de données Test
REMARQUE : Pour construire ce modèle, notre objectif était de maximiser le taux de conversion. Nous avons donné plus d'importance au rappel, c'est-à-dire Coût (faux négatif)> Coût (faux positif)
Si le coût de la communication marketing est élevé et les exigences commerciales (égales à la précision et au rappel), nous aurions besoin de modifier le seuil de classe positif et la métrique de sorte que Rappel = Précision (prenez le score F1 comme métrique).
Désormais, en utilisant ce modèle de propension, le marketing et le ciblage d'audience peuvent être effectués de manière plus intelligente lorsque les chances de conversion d'un utilisateur (achat) à partir de la plate-forme sont plus élevées. En outre, cela aide l'équipe marketing en termes de coût car elle n'a plus à exécuter de campagnes/notifications/emailers sur tous les visiteurs, mais se concentre plutôt uniquement sur un sous-ensemble d'utilisateurs dont le score de propension est élevé.
J'espère que vous avez appris quelque chose de nouveau sur ce blog. Si vous l'avez aimé, appuyez sur 👏 et partagez cet article. Restez à l'écoute pour le prochain!
AUTEUR : https://www.linkedin.com/in/shaurya-uppal/
Bulletin : https://www.linkedin.com/newsletters/problem-resolution-data-science-6874965456701198336/
Également publié ici .