Una propensión a la esperanza ya la alegría es riqueza real; uno para temer y afligir la pobreza real. —David Hume
Los profesionales del marketing invierten mucho tiempo hablando de la importancia de hacer llegar los mensajes correctos a las personas perfectas en el momento perfecto. Notificar o enviar correos electrónicos cuando el usuario no está interesado puede hacer que muchos usuarios desactiven las notificaciones de la aplicación o informen correos electrónicos no deseados que bloquean todas las comunicaciones futuras.
El marketing tiene un costo tanto financiero como de experiencia del usuario. Si hay 100 000 usuarios en la plataforma, es aconsejable esforzarse solo por un subconjunto de usuarios que podrían estar interesados en comprar/convertir.
La mejor manera de identificar quién de su audiencia tiene más probabilidades de realizar una compra, aceptar una oferta o suscribirse a un servicio es un modelo de propensión . Entendamos mejor el modelo de propensión trabajando en una declaración del problema: construya un modelo de propensión para determinar si un usuario comprará en su visita de regreso.
Analice sus datos comprendiendo cuántos % de la clase positiva (el usuario compra en una visita de regreso) y la clase negativa (el usuario no compra en una visita de regreso).
Para nuestro caso de uso de marketing para mejorar la tasa de conversión:
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
Por lo tanto, nuestra métrica debe ser tal que: La recuperación es más importante que la precisión.
Un valor beta de 2 prestará más atención a la recuperación que a la precisión y se denomina medida F2.
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
El modelo de propensión es un problema de clasificación binaria, estaríamos usando una regresión logística para nuestro modelo.
Esquema de entrenamiento modelo
Salida del modelo
prob: es la probabilidad de regresión logística de que ocurra un evento, en nuestro caso, el evento es si el usuario compra en una visita de regreso o no.
Ejecutamos 3 experimentos de conjuntos de características diferentes con regresión logística y encontramos que el segundo tenía el mejor desempeño en nuestras métricas.
VISUAL de evaluación del modelo (Mejor modelo: 2º en la tabla de experimentos anterior | Umbral de clase positivo: 0,0217)
El mejor umbral para la clase positiva = 0,0217 significa que la probabilidad de regresión logística ≥ el umbral es una clase positiva (el usuario comprará en la visita de regreso) de lo contrario, una clase negativa.
Al probar el modelo de experimento 2 con características Bounce, OS, TimeOnSite, Pageviews y Country. Obtuvimos un Recall de 91.7% y una Precisión de 3.9%. Un alto recuerdo se relaciona con casos bajos de falsos negativos y una baja precisión se relaciona con casos altos de falsos positivos.
Matriz de confusión en el conjunto de datos de prueba
NOTA: Para construir este modelo, nuestro objetivo era maximizar la tasa de conversión. Le dimos más importancia a recordar, es decir, Costo (Falso Negativo)> Costo (Falso Positivo)
Si el costo de la comunicación de marketing es alto y las demandas comerciales (precisión y recuperación iguales), entonces tendríamos que cambiar el umbral de clase positivo y la métrica de modo que Recall = Precision (tome F1 Score como métrica).
Ahora, el uso de este modelo de propensión, el marketing y la orientación de la audiencia se pueden hacer de manera más inteligente cuando las posibilidades de conversión (compra) de un usuario desde la plataforma son mayores. Además, ayuda al equipo de marketing en términos de costos, ya que ya no tienen que ejecutar campañas/notificaciones/mensajes de correo electrónico para todos los visitantes, sino centrarse solo en un subconjunto de usuarios cuyo puntaje de propensión es alto.
Espero que hayas aprendido algo nuevo de este blog. Si te gustó, dale 👏 y comparte este artículo. ¡Estad atentos para la próxima!
AUTOR: https://www.linkedin.com/in/shaurya-uppal/
Boletín: https://www.linkedin.com/newsletters/problem-resolving-data-science-6874965456701198336/
También publicado aquí .