希望と喜びへの傾向は真の富です。本当の貧困を恐れ、悲しむ人。 — デビッド・ヒューム
マーケティング担当者は、適切なタイミングで適切なメッセージを適切な個人に届けることの重要性について、多くの時間を費やしています。ユーザーが興味を持っていないときに通知または電子メールを送信すると、多くのユーザーがアプリの通知をオフにしたり、電子メールのスパムを報告したりして、今後のすべての通信がブロックされる可能性があります。
マーケティングには、金銭面とユーザー エクスペリエンスの両方が犠牲になります。プラットフォームに 10 万人のユーザーがいる場合は、購入/コンバージョンに関心がある可能性のあるユーザーのサブセットのみに努力することが賢明です。
オーディエンスの中で、実際に購入する、オファーを受け入れる、またはサービスにサインアップする可能性が最も高いのは誰かを特定する最善の方法は、傾向モデルです。問題文に取り組み、傾向モデルをよりよく理解しましょう:傾向モデルを構築して、ユーザーが再訪問時に購入するかどうかを判断します。
データを分析して、ポジティブ クラス (ユーザーが再訪問時に購入) とネガティブ クラス (ユーザーが再訪問時に購入しない) の何%を把握します。
コンバージョン率を改善するためのマーケティングの使用例:
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
したがって、メトリクスは次のようになる必要があります。再現率は精度よりも重要です
ベータ値 2 は、精度よりもリコールに重点を置き、F2 尺度と呼ばれます。
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
傾向モデルはバイナリ分類問題であり、モデルにはロジスティック回帰を使用します。
モデル トレーニング スキーマ
モデル出力
prob:発生するイベントのロジスティック回帰確率です。この場合、イベントは、再訪問時にユーザーが購入するかどうかです。
ロジスティック回帰を使用して 3 つの異なる機能セットの実験を実行したところ、2 番目がメトリクスで最高のパフォーマンスを発揮することがわかりました。
モデル評価のビジュアル (ベストモデル: 上記の実験表の 2 番目 | 正のクラスのしきい値: 0.0217)
ポジティブ クラスの最適なしきい値 = 0.0217 は、ロジスティック回帰確率 ≥ しきい値がポジティブ クラス (ユーザーは再訪問時に購入する)、それ以外の場合はネガティブ クラスであることを意味します。
機能 Bounce、OS、TimeOnSite、Pageviews、および Country を使用した実験モデル 2 のテストについて。再現率は 91.7%、適合率は 3.9% でした。高い再現率は低い偽陰性ケースに関連し、低い精度は高い偽陽性ケースに関連します。
テスト データセットの混同行列
注: このモデルを構築する目的は、コンバージョン率を最大化することでした。コスト(偽陰性) > コスト(偽陽性)を思い出すことをより重要視しました。
マーケティング コミュニケーション コストが高く、ビジネス ニーズ (Precision と Recall が等しい) の場合は、Recall = Precision (指標として F1 スコアを取る) のように正のクラスのしきい値と指標を変更する必要があります。
現在、この傾向モデルを使用すると、プラットフォームからのユーザー コンバージョン (購入) の可能性が高い場合に、マーケティングとオーディエンス ターゲティングをよりインテリジェントに行うことができます。また、マーケティング チームは、すべての訪問者に対してキャンペーン/通知/メールを実行する必要がなくなり、傾向スコアが高いユーザーのサブセットのみに集中できるため、コストの面でも役立ちます。
このブログから何か新しいことを学んでいただければ幸いです。気に入ったら、👏 を押して、この記事を共有してください。次回もお楽しみに!
著者: https://www.linkedin.com/in/shaurya-uppal/
ニュースレター: https://www.linkedin.com/newsletters/problem-solving-data-science-6874965456701198336/
ここにも掲載されています。