2,801 रीडिंग

पाठ एंबेडिंग समझाया: एआई शब्दों को कैसे समझता है

द्वारा Louis Bouchard8m2022/12/03

बहुत लंबा; पढ़ने के लिए

बड़े भाषा मॉडल। ये शब्द आपने पहले भी सुने होंगे। वे एक विशिष्ट प्रकार के मशीन लर्निंग-आधारित एल्गोरिदम का प्रतिनिधित्व करते हैं जो भाषा को समझते हैं और उत्पन्न कर सकते हैं, एक क्षेत्र जिसे अक्सर प्राकृतिक भाषा प्रसंस्करण या एनएलपी कहा जाता है। आपने निश्चित रूप से सबसे प्रसिद्ध और शक्तिशाली भाषा मॉडल के बारे में सुना होगा: GPT-3। GPT-3, जैसा कि मैंने वीडियो को कवर करते हुए बताया है कि यह भाषा लेने, इसे समझने और बदले में भाषा उत्पन्न करने में सक्षम है। लेकिन यहां सावधान रहें; यह वास्तव में इसे नहीं समझता है। वास्तव में, यह समझ से कोसों दूर है। GPT-3 और अन्य भाषा-आधारित मॉडल केवल उन शब्दों का उपयोग करते हैं जिन्हें हम शब्दों के शब्दकोश कहते हैं, उन्हें संख्याओं के रूप में प्रस्तुत करने के लिए, वाक्य में उनकी स्थिति को याद रखें, और बस इतना ही। आइए उन शक्तिशाली मशीन लर्निंग मॉडल में गोता लगाएँ और यह समझने की कोशिश करें कि वे शब्दों के बजाय क्या देखते हैं, जिसे शब्द एम्बेडिंग कहा जाता है, और कोहेरे द्वारा प्रदान किए गए उदाहरण के साथ उन्हें कैसे तैयार किया जाए।

featured image - पाठ एंबेडिंग समझाया: एआई शब्दों को कैसे समझता है

बड़े भाषा मॉडल।

ये शब्द आपने पहले भी सुने होंगे। वे एक विशिष्ट प्रकार के मशीन लर्निंग-आधारित एल्गोरिदम का प्रतिनिधित्व करते हैं जो भाषा को समझते हैं और उत्पन्न कर सकते हैं, जिसे अक्सर प्राकृतिक भाषा प्रसंस्करण या एनएलपी कहा जाता है।

आपने निश्चित रूप से सबसे प्रसिद्ध और शक्तिशाली भाषा मॉडल के बारे में सुना होगा: ।

GPT-3, जैसा कि मैंने वीडियो कवरिंग में वर्णित किया है, यह भाषा लेने, इसे समझने और बदले में भाषा उत्पन्न करने में सक्षम है। लेकिन यहां सावधान रहें; यह वास्तव में इसे नहीं समझता है। दरअसल, यह समझ से कोसों दूर है। GPT-3 और अन्य भाषा-आधारित मॉडल केवल उन शब्दों का उपयोग करते हैं जिन्हें हम शब्दों का शब्दकोश कहते हैं, उन्हें संख्याओं के रूप में प्रस्तुत करने के लिए, वाक्य में उनकी स्थिति को याद रखने के लिए, और बस इतना ही।

आइए उन शक्तिशाली मशीन लर्निंग मॉडल में गोता लगाएँ और यह समझने की कोशिश करें कि वे शब्दों के बजाय क्या देखते हैं, जिसे शब्द एम्बेडिंग कहा जाता है, और कोहेरे द्वारा प्रदान किए गए उदाहरण के साथ उन्हें कैसे तैयार किया जाए।

वीडियो में और जानें...

संदर्भ

►पूरा लेख पढ़ें: https://www.louisbouchard.ai/text-embedding/
►BERT वर्ड एंबेडिंग ट्यूटोरियल: https://mccormickml.com/2019/05/14/BERT-word-embeddings-tutorial/#why-bert-embeddings
►Cohere's Notebook from the code example: https://colab.research.google.com/github/cohere-ai/notebooks/blob/main/notebooks/Basic_Semantic_Search.ipynb
►Cohere Repos एम्बेडिंग पर केंद्रित है: https://github.com/cohere-ai/notebooks
►मेरा न्यूज़लेटर (एक नया एआई एप्लिकेशन आपके ईमेल पर साप्ताहिक रूप से समझाया गया है!): https://www.louisbouchard.ai/newsletter/