आशा और आनंद की प्रवृत्ति ही वास्तविक धन है; एक डर और दुःख असली गरीबी। — डेविड ह्यूम
विपणक सही समय पर सही व्यक्तियों को सही संदेश प्राप्त करने के महत्व के बारे में बात करने में बहुत समय लगाते हैं। जब उपयोगकर्ता की रुचि नहीं होती है तो उसे सूचित करने या ईमेल करने से कई उपयोगकर्ता ऐप सूचनाएं बंद कर सकते हैं या ईमेल स्पैम की रिपोर्ट कर सकते हैं जो भविष्य के सभी संचारों को अवरुद्ध कर देता है।
मार्केटिंग वित्तीय और उपयोगकर्ता अनुभव दोनों की कीमत पर आती है। यदि प्लेटफ़ॉर्म पर 100k उपयोगकर्ता हैं, तो केवल उन उपयोगकर्ताओं के सबसेट के लिए प्रयास करना बुद्धिमानी है, जो खरीदारी / रूपांतरण में रुचि रखते हैं।
यह पहचानने का सबसे अच्छा तरीका है कि आपके दर्शकों में से कौन वास्तव में खरीदारी करने, किसी ऑफ़र को स्वीकार करने या किसी सेवा के लिए साइन अप करने की सबसे अधिक संभावना है, एक प्रवृत्ति मॉडल है । आइए समस्या कथन पर काम करके प्रवृत्ति मॉडल को बेहतर ढंग से समझें: यह निर्धारित करने के लिए एक प्रवृत्ति मॉडल बनाएं कि कोई उपयोगकर्ता अपनी वापसी यात्रा पर खरीदारी करेगा या नहीं।
अपने डेटा का विश्लेषण करके समझें कि कितने% सकारात्मक वर्ग (उपयोगकर्ता वापसी यात्रा पर खरीदारी करते हैं) और नकारात्मक वर्ग (उपयोगकर्ता वापसी यात्रा पर खरीदारी नहीं करते हैं)।
रूपांतरण दर में सुधार के लिए हमारे मार्केटिंग उपयोग के मामले के लिए:
Cost of False Negative (marking High Propensity as Low) > Cost of False Positive (marking a Low Propensity Customer as High)
इसलिए हमारा मीट्रिक ऐसा होना चाहिए कि: प्रेसिजन से रिकॉल अधिक महत्वपूर्ण है
2 का बीटा मान सटीकता की तुलना में रिकॉल पर अधिक ध्यान देगा और इसे F2 माप के रूप में संदर्भित किया जाता है।
F2-Measure = ((1 + 2²) * Precision * Recall) / (2² * Precision + Recall)
प्रवृत्ति मॉडल एक द्विआधारी वर्गीकरण समस्या है, हम अपने मॉडल के लिए एक लॉजिस्टिक रिग्रेशन का उपयोग करेंगे।
मॉडल प्रशिक्षण योजना
मॉडल आउटपुट
प्रोब: किसी घटना के घटित होने की लॉजिस्टिक रिग्रेशन संभावना है, हमारे मामले में घटना उपयोगकर्ता द्वारा वापसी यात्रा पर खरीदारी करना है या नहीं।
हमने लॉजिस्टिक रिग्रेशन के साथ 3 अलग-अलग फीचर सेट प्रयोग चलाए और पाया कि दूसरा हमारे मेट्रिक्स पर सबसे अच्छा प्रदर्शन कर रहा है।
मॉडल मूल्यांकन का दृश्य (सर्वश्रेष्ठ मॉडल: उपरोक्त प्रयोग तालिका में दूसरा | सकारात्मक वर्ग सीमा: 0.0217)
सकारात्मक वर्ग के लिए सर्वोत्तम सीमा = 0.0217 का अर्थ है लॉजिस्टिक प्रतिगमन संभाव्यता - दहलीज सकारात्मक वर्ग है (उपयोगकर्ता वापसी यात्रा पर खरीदेगा) अन्यथा, नकारात्मक वर्ग।
बाउंस, ओएस, टाइमऑनसाइट, पेजव्यू और देश सुविधाओं के साथ प्रयोग मॉडल 2 के परीक्षण पर। हमें 91.7% का रिकॉल और 3.9% का प्रेसिजन मिला। एक उच्च रिकॉल कम झूठे नकारात्मक मामलों से संबंधित है और कम सटीकता उच्च झूठे सकारात्मक मामलों से संबंधित है।
परीक्षण डेटासेट पर भ्रम मैट्रिक्स
नोट: इस मॉडल को बनाने के लिए हमारा उद्देश्य रूपांतरण दर को अधिकतम करना था। हमने रिकॉल को अधिक महत्व दिया यानी लागत (गलत नकारात्मक)> लागत (गलत सकारात्मक)
यदि विपणन संचार लागत अधिक है और व्यावसायिक मांग (समान परिशुद्धता और रिकॉल) है तो हमें सकारात्मक वर्ग सीमा और मीट्रिक को इस तरह बदलना होगा कि रिकॉल = प्रेसिजन (मैट्रिक के रूप में F1 स्कोर लें)।
अब, इस प्रवृत्ति मॉडल मार्केटिंग और ऑडियंस लक्ष्यीकरण का उपयोग करके अधिक समझदारी से किया जा सकता है जहां प्लेटफॉर्म से उपयोगकर्ता रूपांतरण (खरीद) की संभावना अधिक होती है। साथ ही, यह मार्केटिंग टीम को लागत के मामले में मदद करता है क्योंकि उन्हें अब सभी आगंतुकों पर अभियान/सूचनाएं/ईमेलर चलाने की ज़रूरत नहीं है, बल्कि केवल उन उपयोगकर्ताओं के सबसेट पर ध्यान केंद्रित करना है जिनके प्रवृत्ति स्कोर अधिक हैं।
मुझे उम्मीद है कि आपने इस ब्लॉग से कुछ नया सीखा होगा। अगर आपको यह पसंद आया है, तो दबाएं और इस लेख को साझा करें। अगले एक के लिए बने रहें!
लेखक: https://www.linkedin.com/in/shaurya-uppal/
न्यूज़लेटर: https://www.linkedin.com/newsletters/problem-solving-data-science-6874965456701198336/
यहाँ भी प्रकाशित हो चुकी है।.