Uma propensão à esperança e à alegria é uma riqueza real; alguém para temer e lamentar a pobreza real. —David Hume
Os profissionais de marketing investem muito tempo falando sobre a importância de enviar as mensagens corretas para as pessoas certas no momento certo. Notificar ou enviar e-mails quando o usuário não está interessado pode fazer com que muitos usuários desativem as notificações do aplicativo ou denunciem e-mails de spam que bloqueiam todas as comunicações futuras.
O marketing tem um custo financeiro e de experiência do usuário. Se houver 100 mil usuários na plataforma, é aconselhável se esforçar apenas para um subconjunto de usuários que possam estar interessados em comprar/converter.
A melhor maneira de identificar quem do seu público tem maior probabilidade de realmente fazer uma compra, aceitar uma oferta ou se inscrever em um serviço é um modelo de propensão . Vamos entender melhor o modelo de propensão trabalhando em uma declaração de problema: Construir um modelo de propensão para determinar se um usuário comprará em sua visita de retorno.
Analise seus dados entendendo quantos % da classe positiva (o usuário compra na visita de retorno) e na classe negativa (o usuário não compra na visita de retorno).
Para nosso caso de uso de Marketing para melhorar a taxa de conversão:
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
Portanto, nossa métrica deve ser tal que: Recall é mais importante que precisão
Um valor beta de 2 pesará mais atenção na recordação do que na precisão e é referido como a medida F2.
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
O modelo de propensão é um problema de classificação binária, estaríamos usando uma regressão logística para o nosso modelo.
Esquema de treinamento de modelo
Saída do modelo
prob: é a probabilidade de regressão logística de um evento ocorrer, no nosso caso o evento é o usuário comprando em uma visita de retorno ou não.
Executamos 3 experimentos de conjunto de recursos diferentes com regressão logística e descobrimos que o segundo tem o melhor desempenho em nossas métricas.
VISUAL de Avaliação do Modelo (Melhor Modelo: 2º na Tabela Experimental acima | Limite de Classe Positivo: 0,0217)
O melhor limite para classe positiva = 0,0217 significa probabilidade de regressão logística ≥ o limite é classe positiva (o usuário comprará na visita de retorno), caso contrário, classe negativa.
Ao testar o modelo de experimento 2 com os recursos Bounce, OS, TimeOnSite, Pageviews e Country. Obtivemos um Recall de 91,7% e uma Precisão de 3,9%. Uma alta rechamada está relacionada a casos falsos negativos baixos e uma precisão baixa está relacionada a casos altos de falsos positivos.
Matriz de confusão no conjunto de dados de teste
NOTA: Para construir este modelo nosso objetivo era maximizar a taxa de conversão. Demos mais importância ao recall, ou seja, Custo(Falso Negativo) > Custo(Falso Positivo)
Se o custo da comunicação de marketing for alto e as demandas de negócios (Precisão e Recall iguais), precisaríamos alterar o limite de classe positiva e a métrica de forma que Recall = Precisão (considere F1 Score como métrica).
Agora, usando esse modelo de propensão, o marketing e a segmentação de público podem ser feitos de maneira mais inteligente onde as chances de conversão (compra) do usuário na plataforma são maiores. Além disso, ajuda a equipe de marketing em termos de custo, pois não precisa mais executar campanhas/notificações/enviadores de e-mail para todos os visitantes, mas sim se concentrar apenas em um subconjunto de usuários cuja pontuação de propensão é alta.
Espero que você tenha aprendido algo novo com este blog. Se você gostou, clique em 👏 e compartilhe este artigo. Fique ligado no próximo!
AUTOR: https://www.linkedin.com/in/shaurya-uppal/
Boletim informativo: https://www.linkedin.com/newsletters/problem-resolution-data-science-6874965456701198336/
Publicado também aqui .