यह सारांश और मेरी मुख्य बातें है लिंक्डइन द्वारा एनएलपी का उपयोग कैसे किया जा रहा है ( तक) इसकी सहायता खोज प्रणाली को डिजाइन करने में। यह समस्या कथन और उनकी कमियों के साथ अपनाए गए समाधानों के विभिन्न पुनरावृत्तियों पर प्रकाश डालता है। मूल पोस्ट 2019 समस्या का विवरण: किसी उपयोगकर्ता द्वारा एक प्रश्न को देखते हुए, डेटाबेस से सबसे प्रासंगिक सहायता आलेख प्राप्त करें। पुनरावृति 1: प्रारंभिक समाधान का उपयोग करके डेटाबेस में सभी सहायता लेखों (दस्तावेजों) को अनुक्रमित किया। संक्षेप में, यह एक उल्टा शब्दकोश उत्पन्न करता है जो उन सभी दस्तावेज़ों के लिए शब्दों को मैप करता है जिनमें यह दिखाई देता है। ल्यूसीन इंडेक्स 2. दी गई क्वेरी का उपयोग ल्यूसीन इंडेक्सिंग का उपयोग करके सभी प्रासंगिक दस्तावेजों (हिट) को लाने के लिए किया जाता है। 3. प्रत्येक हिट को एल्गोरिथम का उपयोग करके स्कोर किया जाता है, जो को ध्यान में रखता है, में हिट को उच्चतम भार देता है, फिर और फिर में हिट करता है, और एक भारित स्कोर देता है। BM25F दस्तावेज़ संरचना शीर्षक कीवर्ड बॉडी 4. सर्वश्रेष्ठ स्कोर वाले लेख लौटाएं। यह विफल क्यों हुआ चूंकि दस्तावेज़ पुनर्प्राप्ति प्रणाली ) है, को ध्यान में रखे बिना, निम्नलिखित दो उदाहरण विफलता मामले हैं: शब्द आधारित ( वाक्यविन्यास शब्दार्थ पुनरावृति 2: अंतिम समाधान चरण 1: पाठ सामान्यीकरण " करना" को " " के लिए सामान्यीकृत किया गया मेरे प्रीमियम खातों को तुरंत कैसे रद्द प्रीमियम खाता रद्द करना चरण 2: क्वेरी मैपिंग ऐसा हो सकता है कि सामान्यीकृत क्वेरी में लेखों के शब्दों के साथ कोई शब्द समान न हो। इसलिए, उपयोगकर्ता की शब्दावली और लेख की शब्दावली के बीच के अंतर को भरने के लिए प्रत्येक क्वेरी को अधिक प्रतिनिधि क्वेरी के लिए मैप किया जाता है। निम्नलिखित दो चरणों में किया गया: समानता मेट्रिक्स के आधार पर प्रश्नों को एक साथ समूहीकृत किया जाता है क्वेरी ग्रुपिंग: क्वेरी समूह में प्रत्येक क्वेरी के लिए, एक की गणना की जाती है और शीर्ष K क्वेरी को रेप क्वेरी के रूप में चुना जाता है 2. टॉपिक माइनिंग और रेप स्कोरिंग: रिपस्कोर समूह में कच्ची क्वेरी और अन्य क्वेरी के बीच समानता है सिम (आरक्यू, क्यू 2) Q2 और शीर्षक से किसी एक विषय के बीच अधिकतम समानता है (इसी तरह शरीर के लिए) sim(Q2, title) चरण 3: इरादा वर्गीकरण लंबी-पूंछ वाले प्रश्नों में एक प्रतिनिधि क्वेरी नहीं हो सकती है, इस मामले में एक का उपयोग क्वेरी के को वर्गीकृत करने के लिए किया जाता है। सीएनएन इरादे उदाहरण के लिए: "अपनी प्रीमियम सदस्यता रद्द करना" और "आपके Apple डिवाइस पर खरीदी गई प्रीमियम सदस्यता को रद्द करना या अपडेट करना" को "प्रीमियम रद्द करें" का एक ही इरादा माना जाता है। कुल प्रवाह भी प्रकाशित यहाँ