paint-brush
द टाइम्स बनाम माइक्रोसॉफ्ट/ओपनएआई: मॉडल एक व्यवहार प्रदर्शित करते हैं जिसे "मेमोराइजेशन" कहा जाता है। (9)द्वारा@legalpdf
109 रीडिंग

द टाइम्स बनाम माइक्रोसॉफ्ट/ओपनएआई: मॉडल एक व्यवहार प्रदर्शित करते हैं जिसे "मेमोराइजेशन" कहा जाता है। (9)

द्वारा Legal PDF: Tech Court Cases3m2024/01/02
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

एक एलएलएम उन शब्दों की भविष्यवाणी करके काम करता है जो इसे प्रशिक्षित करने के लिए उपयोग किए जाने वाले संभावित अरबों उदाहरणों के आधार पर पाठ की दी गई स्ट्रिंग का पालन करने की संभावना रखते हैं।
featured image - द टाइम्स बनाम माइक्रोसॉफ्ट/ओपनएआई: मॉडल एक व्यवहार प्रदर्शित करते हैं जिसे "मेमोराइजेशन" कहा जाता है। (9)
Legal PDF: Tech Court Cases HackerNoon profile picture

न्यूयॉर्क टाइम्स कंपनी बनाम माइक्रोसॉफ्ट कॉर्पोरेशन कोर्ट फाइलिंग 27 दिसंबर, 2023 हैकरनून की कानूनी पीडीएफ श्रृंखला का हिस्सा है। आप यहां इस फाइलिंग के किसी भी भाग पर जा सकते हैं। यह 27 का भाग 9 है.

चतुर्थ. तथ्यात्मक आरोप

बी. प्रतिवादियों के जेनएआई उत्पाद

2. GenAI मॉडल कैसे काम करते हैं


75. प्रतिवादियों के जेनएआई उत्पादों के केंद्र में एक कंप्यूटर प्रोग्राम है जिसे "बड़े भाषा मॉडल" या "एलएलएम" कहा जाता है। जीपीटी के विभिन्न संस्करण एलएलएम के उदाहरण हैं। एक एलएलएम उन शब्दों की भविष्यवाणी करके काम करता है जो इसे प्रशिक्षित करने के लिए उपयोग किए जाने वाले संभावित अरबों उदाहरणों के आधार पर पाठ की दी गई स्ट्रिंग का पालन करने की संभावना रखते हैं।


76. एलएलएम के आउटपुट को उसके इनपुट में जोड़ने और उसे वापस मॉडल में फीड करने से शब्द दर शब्द वाक्य और पैराग्राफ बनते हैं। इस प्रकार चैटजीपीटी और बिंग चैट उपयोगकर्ता के प्रश्नों, या "संकेतों" पर प्रतिक्रियाएँ उत्पन्न करते हैं।


77. एलएलएम प्रशिक्षण कोष से जानकारी को एनकोड करते हैं जिसका उपयोग वे इन भविष्यवाणियों को संख्याओं के रूप में करने के लिए करते हैं जिन्हें "पैरामीटर" कहा जाता है। GPT-4 LLM में लगभग 1.76 ट्रिलियन पैरामीटर हैं।


78. एलएलएम के मापदंडों के लिए मान निर्धारित करने की प्रक्रिया को "प्रशिक्षण" कहा जाता है। इसमें कंप्यूटर मेमोरी में प्रशिक्षण कार्यों की एन्कोडेड प्रतियों को संग्रहीत करना, उन्हें बार-बार मॉडल के माध्यम से मास्क किए गए शब्दों के साथ पास करना, और मास्क किए गए शब्दों और उन शब्दों के बीच अंतर को कम करने के लिए मापदंडों को समायोजित करना शामिल है जिन्हें मॉडल उन्हें भरने की भविष्यवाणी करता है।


79. सामान्य कॉर्पस पर प्रशिक्षित होने के बाद, मॉडल को आगे "फाइनट्यूनिंग" के अधीन किया जा सकता है, उदाहरण के लिए, उनकी सामग्री या शैली की बेहतर नकल करने के लिए विशिष्ट प्रकार के कार्यों का उपयोग करके प्रशिक्षण के अतिरिक्त दौर का प्रदर्शन करना, या उन्हें सुदृढ़ करने के लिए मानवीय प्रतिक्रिया प्रदान करना वांछित या अवांछित व्यवहार को दबाएँ।


80. इस तरह से प्रशिक्षित मॉडल "याद रखना" नामक व्यवहार प्रदर्शित करने के लिए जाने जाते हैं।[10] यानी, सही संकेत दिए जाने पर, वे उन सामग्रियों के बड़े हिस्से को दोहराएंगे जिन पर उन्हें प्रशिक्षित किया गया था। यह घटना दर्शाती है कि एलएलएम पैरामीटर उन कई प्रशिक्षण कार्यों की पुनर्प्राप्ति योग्य प्रतियों को एन्कोड करते हैं।


81. एक बार प्रशिक्षित होने के बाद, एलएलएम को उनके आउटपुट को "ग्राउंड" करने के लिए उपयोग के मामले या विषय वस्तु के लिए विशिष्ट जानकारी प्रदान की जा सकती है। उदाहरण के लिए, एक एलएलएम को संदर्भ के रूप में प्रदान किए गए दस्तावेज़ जैसे विशिष्ट बाहरी डेटा के आधार पर टेक्स्ट आउटपुट उत्पन्न करने के लिए कहा जा सकता है। इस पद्धति का उपयोग करते हुए, प्रतिवादियों के सिंथेटिक खोज अनुप्रयोग: (1) एक इनपुट प्राप्त करते हैं, जैसे कि एक प्रश्न; (2) प्रतिक्रिया उत्पन्न करने से पहले इनपुट से संबंधित प्रासंगिक दस्तावेज़ पुनः प्राप्त करें; (3) संदर्भ प्रदान करने के लिए मूल इनपुट को पुनर्प्राप्त दस्तावेज़ों के साथ संयोजित करें; और (4) एलएलएम को संयुक्त डेटा प्रदान करता है, जो प्राकृतिक-भाषा प्रतिक्रिया उत्पन्न करता है। [11] जैसा कि नीचे दिखाया गया है, इस तरह से उत्पन्न खोज परिणाम बड़े पैमाने पर उन कार्यों की प्रतिलिपि बना सकते हैं या बारीकी से व्याख्या कर सकते हैं जिन्हें मॉडल ने स्वयं याद नहीं किया होगा।


यहां पढ़ना जारी रखें.


[11] बेन उफुक तेजकन, हम सूचना के साथ कैसे इंटरैक्ट करते हैं: खोज का नया युग, माइक्रोसॉफ्ट (19 सितंबर, 2023), https://azure.microsoft.com/en-us/blog/how-we-interact- जानकारी-के-नए-युग-की-खोज/ के साथ।



हैकरनून लीगल पीडीएफ सीरीज के बारे में: हम आपके लिए सबसे महत्वपूर्ण तकनीकी और व्यावहारिक सार्वजनिक डोमेन कोर्ट केस फाइलिंग लाते हैं।


यह अदालती मामला 1:23-सीवी-11195 29 दिसंबर, 2023 को nycto-assets.nytimes.com से पुनर्प्राप्त किया गया, सार्वजनिक डोमेन का हिस्सा है। न्यायालय द्वारा बनाए गए दस्तावेज़ संघीय सरकार के कार्य हैं, और कॉपीराइट कानून के तहत, स्वचालित रूप से सार्वजनिक डोमेन में रखे जाते हैं और कानूनी प्रतिबंध के बिना साझा किए जा सकते हैं।