paint-brush
डेटा साइंटिस्ट द्वारा उजागर किए गए ये Google मैप्स इनसाइट्स अविश्वसनीय हैंद्वारा@shauryauppal
923 रीडिंग
923 रीडिंग

डेटा साइंटिस्ट द्वारा उजागर किए गए ये Google मैप्स इनसाइट्स अविश्वसनीय हैं

द्वारा Shaurya Uppal4m2023/01/11
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

एक डेटा वैज्ञानिक के रूप में, मुझे खोज वैयक्तिकरण और रैंकिंग एक जटिल और दिलचस्प चुनौती लगती है। Google मैप्स मेरे स्थान को पहचानता है और शीर्ष पांच सबसे लोकप्रिय स्थानों को प्रदर्शित करता है, जिन लोगों ने पहले "ईआई" टाइप किया है या उन लोगों द्वारा क्लिक किया गया है, सभी परिणाम मेरे स्थान के पास हैं (चित्र 1 देखें)।
featured image - डेटा साइंटिस्ट द्वारा उजागर किए गए ये Google मैप्स इनसाइट्स अविश्वसनीय हैं
Shaurya Uppal HackerNoon profile picture
0-item


Google मानचित्र एक अद्भुत उत्पाद है, और यह लोगों के जीवन में बहुत अधिक मूल्य लाता है। आज, मैंने अपने विचार साझा करने के बारे में सोचा कि कैसे कोई इस तरह का उत्पाद स्क्रैच से बना सकता है।


हालांकि यह सच है कि खोज में इंजीनियरिंग और डेटा विज्ञान दोनों शामिल हैं, कई कंपनियां खोज में डेटा विज्ञान के महत्व को कम आंक सकती हैं। खोज केवल एक दी गई क्वेरी के लिए परिणामों को संसाधित करने और वापस करने के लिए एक तकनीकी बुनियादी ढांचे के निर्माण के बारे में नहीं है, बल्कि उपयोगकर्ताओं की जरूरतों और प्राथमिकताओं को समझने और अनुमान लगाने और व्यक्तिगत उपयोगकर्ताओं के लिए खोज अनुभव को अनुकूलित करने के लिए डेटा का उपयोग करने के बारे में भी है।


एक डेटा वैज्ञानिक के रूप में, मुझे खोज वैयक्तिकरण और रैंकिंग एक जटिल और दिलचस्प चुनौती लगती है। उपयोगकर्ता की खोज क्वेरी, पिछला खोज इतिहास और क्लिक डेटा की जांच करके हम उपयोगकर्ताओं की रुचि को कैप्चर करते हैं।


यह न्यूज़लेटर आपके सभी सवालों के जवाब देगा:


  • कौन सा डेटा आवश्यक है?
  • मानचित्रों में रैंकिंग और प्रासंगिकता की आवश्यकता?
  • कोई विशेष परिणाम क्यों दिखाई देता है?


अस्वीकरण: कृपया इस रणनीति को अन्य प्लेटफार्मों पर दोबारा पोस्ट करने से पहले डीएम करें, क्योंकि यह मेरे लिए पूरी तरह से मूल है और इसकी नकल नहीं की गई थी। मैं किसी ब्रांड का समर्थन नहीं करता; साझा किए गए उदाहरण केवल सीखने के लिए हैं। इस अवधारणा का उपयोग करके कोई भी व्यक्ति स्क्रैच से अपना मानचित्र बना सकता है।

अगर कोई मुझसे परामर्श चाहता है तो यहां पहुंचें

यह रिजल्ट क्यों और कैसे?

हम क्या ढूंढ रहे हैं: मैं गुरुग्राम में रहता हूं और "एफिल टॉवर, पेरिस" की खोज कर रहा हूं

आइए मैप्स पर "ईआई" टाइप करना शुरू करें और विश्लेषण करें। हमें क्वेरी से नीचे सूचीबद्ध शीर्ष-5 परिणाम मिले।

Fig.1 खोज विश्लेषण


केवल पांच परिणाम ही क्यों हैं? खोज रैंकिंग और प्रासंगिकता के बारे में है। एल्गोरिथ्म का उद्देश्य उपयोगकर्ता को न्यूनतम क्वेरी लंबाई के साथ उसका वांछित परिणाम प्राप्त करना है। दूसरी ओर, एल्गोरिथ्म के लिए अधिक संदर्भ "ईआई" क्वेरी द्वारा लौटाए गए परिणामों की लंबी सूची के माध्यम से स्क्रॉल करने के प्रयास के लिए बेहतर है।


चित्र एक। खोज विश्लेषण


इस परिणाम का कारण: लोकप्रियता और प्रासंगिक संकेत यहां दिए गए हैं। Google मानचित्र मेरे स्थान की पहचान करता है और उन शीर्ष पांच सबसे लोकप्रिय स्थानों को प्रदर्शित करता है, जिन लोगों ने पहले "ईआई" टाइप किया है या उन लोगों ने उन पर क्लिक किया है। सभी परिणाम मेरे स्थान के पास हैं (चित्र 1 देखें)। क्वेरी "eif" अपने उच्च लोकप्रियता स्कोर के कारण एफिल टॉवर को तीसरे स्थान पर रखती है। (चित्र 2 देखें)


Fig.2 लोकप्रियता और दूरी आधारित खोज

उपयोगकर्ता की स्थान-आधारित खोज कैसे तैयार करें?

हमारे पास क्या है?


  • हम उपयोगकर्ता के स्थान को जानते हैं
  • पंजीकृत सभी संस्थाओं के स्थान - दुकानें, कैफे, रेस्तरां, होटल, आदि।

भोला दृष्टिकोण

Haversine सूत्र का उपयोग करके, किसी शहर या ज़िप कोड के भीतर उपयोगकर्ता अक्षांश/देशांतर और अन्य स्थानों के बीच की दूरी की गणना करें। (चित्र 3 देखें)


Fig.3 Haversine सूत्र


GMaps स्तर पर, जहाँ अरबों संस्थाएँ और लाखों उपयोगकर्ता हैं, यह दृष्टिकोण मापनीय नहीं है।

डीएस इंटेलिजेंस के साथ बेहतर दृष्टिकोण

  • बता दें कि हम यह सर्च बिल्ड-अप केवल बैंगलोर क्षेत्र के लिए कर रहे हैं।
  • हम पंजीकृत प्रत्येक इकाई को क्लस्टर करते हैं - पूरे क्षेत्र को छोटे उप-इकाई समूहों में तोड़ते हैं, आइए हम 50 कहते हैं। (चित्र 4 देखें)।

Fig.4 उप-इकाई समूहों में बैंगलोर


  • जब कोई उपयोगकर्ता ऑनलाइन आता है तो बस क्लस्टर के भीतर लोकप्रियता के आधार पर अपनी लेट-लांग और रैंक इकाइयों की जांच करें। यह दृष्टिकोण हमारे खोज परिणामों में दूरी और लोकप्रियता दोनों आधारित तत्वों को जोड़ता है।

पुनश्च। आप में से कुछ पूछ सकते हैं कि क्या यह लोचदार खोज के भीतर किया जा सकता है। जियो-सॉर्टिंग देखें

Fig.5 ES जियो-सॉर्टिंग

खोज को अधिक प्रासंगिक या वैयक्तिकृत कैसे करें?

खोज को अधिक प्रासंगिक या वैयक्तिकृत बनाने के लिए, आप डेटा-आधारित दृष्टिकोणों का उपयोग करने पर विचार कर सकते हैं जो उपयोगकर्ता की विशिष्ट आवश्यकताओं या प्राथमिकताओं को ध्यान में रखते हैं। उदाहरण के लिए, यदि श्री वुल्फ रेस्तरां खोज रहे हैं और उन्होंने बहुत कम समय या एक ही सत्र में रेस्तरां से संबंधित कई प्रश्न किए हैं, तो आप उन्हें ऐसे परिणाम दिखाने को प्राथमिकता दे सकते हैं जो उनके स्थान के लिए वैयक्तिकृत हैं और उनके पिछले खोज इतिहास पर भी विचार करें। इसमें खोज परिणामों में उसके निकट के रेस्तराँ को उच्च स्थान देना और उसे ऐसे विकल्प प्रस्तुत करना शामिल हो सकता है जो उसके स्वाद या वरीयताओं या विभिन्न स्थानों पर उसकी पिछली यात्राओं के अनुरूप हों।


डेटा-आधारित दृष्टिकोणों का उपयोग करके, आप केवल लोकप्रिय या दूरी-आधारित मानदंडों पर भरोसा करने के बजाय श्री वुल्फ को अधिक प्रासंगिक और लक्षित खोज परिणाम प्रदान कर सकते हैं।

कोई पूछ सकता है, शौर्य आपने खोज में लोकप्रियता पहलू के बारे में बात की है लेकिन लोकप्रिय के रूप में किसी स्थान की पहचान करने के कुछ अलग तरीके क्या हैं?

  • पिछले 1 महीने में देखे जाने/क्लिक की संख्या
  • पिछले 1 महीने में किसी स्थान पर जाने वाले लोगों की संख्या
  • प्रॉक्सी क्रॉस-प्लेटफ़ॉर्म: Google पे लेनदेन विश्लेषण, लेन-देन की मात्रा अधिक होने पर एक व्यापारी की दुकान को लोकप्रिय माना जाता है

पिछली संचित खोजों से अनुशंसाएँ

कोई डेटा साइंस मॉडल कैशिंग एल्गोरिदम के साथ अच्छी तरह से प्रस्तुत ऐतिहासिक डेटा (चित्र 6 देखें) की सादगी को हरा नहीं सकता है: एलएफयू (कम बार-बार उपयोग किया जाता है) या डायनेमिक एजिंग के साथ एलएफयू (डायनेमिक एजिंग स्पष्टीकरण के साथ विस्तृत एलएफयू के लिए नीचे दिए गए लिंक की जांच करें)।


मेरा ब्लॉग यहां देखें: https://shauryauppal.medium.com/thinking-data-strategies-in-fintech-universe-build-payments-recommendation-system-for-google-95c746e3dd0e

अंजीर। 6 कैश्ड खोज

हमारे विश्लेषण का सारांश

1. हमने चर्चा की कि खोज परिणाम सूची में 5 परिणाम क्यों दिखाए जाते हैं

2. लोकप्रियता + दूरी स्कोरिंग के आधार पर परिणामों की रैंकिंग

3. इलास्टिक सर्च में जियो-सॉर्टिंग

4. प्रश्नों की ऐतिहासिक श्रेणी के आधार पर खोज में वैयक्तिकरण

5. आप किसी इकाई को एक लोकप्रिय स्थान के रूप में कैसे पहचानते हैं?

6. पिछले खोज प्रश्नों और विज़िट किए गए स्थानों के कैशिंग पर आधारित अनुशंसाएँ


मुझे यह पुरस्कार देने के लिए आप सभी का धन्यवाद


नूनीज टेक 2022


लिंक्डइन पर मुझे कनेक्ट करें, फॉलो करें या एंडोर्स करें अगर आपको यह पढ़ने में उपयोगी लगे। मेरे बारे में अधिक जानने के लिए यहाँ जाएँ: यहाँ


मुझे एक दिलचस्प लीड/सीनियर डेटा साइंटिस्ट की भूमिका की तलाश है: यदि आपके पास मेरे लिए कुछ है, तो [email protected] पर कनेक्ट करें


मेरे न्यूज़लेटर से पुनर्प्रकाशित करें: यहाँ और यहाँ