न्यूयॉर्क टाइम्स कंपनी बनाम माइक्रोसॉफ्ट कॉर्पोरेशन कोर्ट फाइलिंग 27 दिसंबर, 2023 हैकरनून की कानूनी पीडीएफ श्रृंखला का हिस्सा है। आप यहां इस फाइलिंग के किसी भी भाग पर जा सकते हैं। यह 27 का भाग 9 है.
2. GenAI मॉडल कैसे काम करते हैं
75. प्रतिवादियों के जेनएआई उत्पादों के केंद्र में एक कंप्यूटर प्रोग्राम है जिसे "बड़े भाषा मॉडल" या "एलएलएम" कहा जाता है। जीपीटी के विभिन्न संस्करण एलएलएम के उदाहरण हैं। एक एलएलएम उन शब्दों की भविष्यवाणी करके काम करता है जो इसे प्रशिक्षित करने के लिए उपयोग किए जाने वाले संभावित अरबों उदाहरणों के आधार पर पाठ की दी गई स्ट्रिंग का पालन करने की संभावना रखते हैं।
76. एलएलएम के आउटपुट को उसके इनपुट में जोड़ने और उसे वापस मॉडल में फीड करने से शब्द दर शब्द वाक्य और पैराग्राफ बनते हैं। इस प्रकार चैटजीपीटी और बिंग चैट उपयोगकर्ता के प्रश्नों, या "संकेतों" पर प्रतिक्रियाएँ उत्पन्न करते हैं।
77. एलएलएम प्रशिक्षण कोष से जानकारी को एनकोड करते हैं जिसका उपयोग वे इन भविष्यवाणियों को संख्याओं के रूप में करने के लिए करते हैं जिन्हें "पैरामीटर" कहा जाता है। GPT-4 LLM में लगभग 1.76 ट्रिलियन पैरामीटर हैं।
78. एलएलएम के मापदंडों के लिए मान निर्धारित करने की प्रक्रिया को "प्रशिक्षण" कहा जाता है। इसमें कंप्यूटर मेमोरी में प्रशिक्षण कार्यों की एन्कोडेड प्रतियों को संग्रहीत करना, उन्हें बार-बार मॉडल के माध्यम से मास्क किए गए शब्दों के साथ पास करना, और मास्क किए गए शब्दों और उन शब्दों के बीच अंतर को कम करने के लिए मापदंडों को समायोजित करना शामिल है जिन्हें मॉडल उन्हें भरने की भविष्यवाणी करता है।
79. सामान्य कॉर्पस पर प्रशिक्षित होने के बाद, मॉडल को आगे "फाइनट्यूनिंग" के अधीन किया जा सकता है, उदाहरण के लिए, उनकी सामग्री या शैली की बेहतर नकल करने के लिए विशिष्ट प्रकार के कार्यों का उपयोग करके प्रशिक्षण के अतिरिक्त दौर का प्रदर्शन करना, या उन्हें सुदृढ़ करने के लिए मानवीय प्रतिक्रिया प्रदान करना वांछित या अवांछित व्यवहार को दबाएँ।
80. इस तरह से प्रशिक्षित मॉडल "याद रखना" नामक व्यवहार प्रदर्शित करने के लिए जाने जाते हैं।[10] यानी, सही संकेत दिए जाने पर, वे उन सामग्रियों के बड़े हिस्से को दोहराएंगे जिन पर उन्हें प्रशिक्षित किया गया था। यह घटना दर्शाती है कि एलएलएम पैरामीटर उन कई प्रशिक्षण कार्यों की पुनर्प्राप्ति योग्य प्रतियों को एन्कोड करते हैं।
81. एक बार प्रशिक्षित होने के बाद, एलएलएम को उनके आउटपुट को "ग्राउंड" करने के लिए उपयोग के मामले या विषय वस्तु के लिए विशिष्ट जानकारी प्रदान की जा सकती है। उदाहरण के लिए, एक एलएलएम को संदर्भ के रूप में प्रदान किए गए दस्तावेज़ जैसे विशिष्ट बाहरी डेटा के आधार पर टेक्स्ट आउटपुट उत्पन्न करने के लिए कहा जा सकता है। इस पद्धति का उपयोग करते हुए, प्रतिवादियों के सिंथेटिक खोज अनुप्रयोग: (1) एक इनपुट प्राप्त करते हैं, जैसे कि एक प्रश्न; (2) प्रतिक्रिया उत्पन्न करने से पहले इनपुट से संबंधित प्रासंगिक दस्तावेज़ पुनः प्राप्त करें; (3) संदर्भ प्रदान करने के लिए मूल इनपुट को पुनर्प्राप्त दस्तावेज़ों के साथ संयोजित करें; और (4) एलएलएम को संयुक्त डेटा प्रदान करता है, जो प्राकृतिक-भाषा प्रतिक्रिया उत्पन्न करता है। [11] जैसा कि नीचे दिखाया गया है, इस तरह से उत्पन्न खोज परिणाम बड़े पैमाने पर उन कार्यों की प्रतिलिपि बना सकते हैं या बारीकी से व्याख्या कर सकते हैं जिन्हें मॉडल ने स्वयं याद नहीं किया होगा।
यहां पढ़ना जारी रखें.
[11] बेन उफुक तेजकन, हम सूचना के साथ कैसे इंटरैक्ट करते हैं: खोज का नया युग, माइक्रोसॉफ्ट (19 सितंबर, 2023), https://azure.microsoft.com/en-us/blog/how-we-interact- जानकारी-के-नए-युग-की-खोज/ के साथ।
हैकरनून लीगल पीडीएफ सीरीज के बारे में: हम आपके लिए सबसे महत्वपूर्ण तकनीकी और व्यावहारिक सार्वजनिक डोमेन कोर्ट केस फाइलिंग लाते हैं।
यह अदालती मामला 1:23-सीवी-11195 29 दिसंबर, 2023 को nycto-assets.nytimes.com से पुनर्प्राप्त किया गया, सार्वजनिक डोमेन का हिस्सा है। न्यायालय द्वारा बनाए गए दस्तावेज़ संघीय सरकार के कार्य हैं, और कॉपीराइट कानून के तहत, स्वचालित रूप से सार्वजनिक डोमेन में रखे जाते हैं और कानूनी प्रतिबंध के बिना साझा किए जा सकते हैं।