सुनिये सब लोग!   मैं नटराज हूं  और आपकी ही तरह, मैं भी कृत्रिम बुद्धिमत्ता की हालिया प्रगति से रोमांचित हूं। यह महसूस करते हुए कि मुझे हो रहे सभी विकासों से अवगत रहने की आवश्यकता है, मैंने सीखने की एक निजी यात्रा शुरू करने का फैसला किया, इस प्रकार ,   एआई के 100 दिन पैदा हुआ था! इस श्रृंखला के साथ, मैं एलएलएम के बारे में सीखूंगा और अपने ब्लॉग पोस्ट के माध्यम से विचार, प्रयोग, राय, रुझान और सीख साझा करूंगा। आप HackerNoon पर यात्रा का अनुसरण कर सकते हैं   यहाँ या मेरी निजी वेबसाइट   यहाँ .  पिछली पोस्टों में से एक में, हमने फ़ाइनट्यूनिंग के बारे में बात की थी और यह महत्वपूर्ण क्यों है। इस पोस्ट में हम एक विशिष्ट प्रकार की फ़ाइनट्यूनिंग पर नज़र डालेंगे जिसे  इंस्ट्रक्शन फ़ाइनट्यूनिंग कहा जाता है।  पूर्व-प्रशिक्षित बेस मॉडल की सीमाएँ:  जीपीटी-3 जैसे पूर्व-प्रशिक्षित बेस मॉडल को बड़ी मात्रा में डेटा पर प्रशिक्षित किया जाता है। जीपीटी-3 के मामले में यह इंटरनेट पर मौजूद सारा डेटा है। ठीक है, हम निश्चित रूप से यह नहीं जानते हैं, लेकिन इनमें से अधिकांश मॉडलों को काफी मैन्युअल सफाई और फ़ॉर्मेटिंग के बाद इंटरनेट स्केल डेटा पर प्रशिक्षित किया जाता है। जैसे-जैसे उन्हें प्रशिक्षित किया जाता है, आधारित मॉडल सीखते हैं कि अगले टोकन की भविष्यवाणी कैसे करें और टोकन भविष्यवाणी में वास्तव में अच्छे हो जाते हैं। लेकिन शुद्ध टोकन भविष्यवाणी उतनी उपयोगी नहीं है जितना आप सोचते हैं। यदि आप पूर्व-प्रशिक्षित बेस मॉडल से पूछें कि "   "यह उत्तर के साथ उत्तर नहीं देगा लेकिन इनपुट वाक्य को "   " के साथ पूरा कर सकता है। इसलिए भले ही gpt-3 जैसा मॉडल टोकन भविष्यवाणी में शक्तिशाली है, लेकिन यह चैटबॉट या सह-पायलट के रूप में काम नहीं करेगा। तो हम पूर्व-प्रशिक्षित मॉडल को चैट-जीपीटी जैसे उपयोगी चैटबॉट में कैसे परिवर्तित करें? इसका उत्तर फाइनट्यूनिंग है, मुख्य रूप से एक विशिष्ट प्रकार की फाइनट्यूनिंग जिसे "   " कहा जाता है। मेक्सिको की राजधानी क्या है?" कोलंबिया की राजधानी क्या है इंस्ट्रक्शन फाइनट्यूनिंग  इंस्ट्रक्शन फ़ाइनट्यूनिंग क्या है?  इंस्ट्रक्शन फ़ाइनट्यूनिंग को "इंस्ट्रक्शन-फ़ॉलोइंग" के रूप में भी जाना जाता है, यह एक पूर्व-प्रशिक्षित बेस मॉडल को चैट बॉट की तरह व्यवहार करने के लिए सिखाने की एक प्रक्रिया है।     लिए डेटा सेट की आवश्यकता होती है जो प्रश्न और उत्तर के रूप में होते हैं। आप सार्वजनिक डेटा सेट या अपनी कंपनियों के डेटा सेट का उपयोग कर सकते हैं जो प्रश्नोत्तर के रूप में है। यदि आपका डेटा सेट Q&A के रूप में नहीं है, तो आप अल्पाका जैसी विभिन्न तकनीकों का उपयोग करके या अन्य LLM पर कस्टम संकेतों का उपयोग करके डेटा को Q&A में परिवर्तित कर सकते हैं। ध्यान दें कि निर्देश फ़ाइनट्यूनिंग मॉडल को न केवल उस डेटा पर सवालों के जवाब देने का एक नया व्यवहार देता है जिसे आप फ़ाइनट्यूनिंग में उपयोग करते हैं, बल्कि यह नया व्यवहार मॉडल के पास पहले से मौजूद मौजूदा ज्ञान पर लागू होता है जो फ़ाइनट्यूनिंग को एक शक्तिशाली तकनीक बनाता है। निर्देश फ़ाइनट्यूनिंग के  लैमिनी का उपयोग करके फ़ाइनट्यूनिंग निर्देश:  लामिनी एक एआई कंपनी है जो डेवलपर्स को होस्टिंग, प्रशिक्षण और अन्य जटिल पहलुओं की जटिलता को दूर करते हुए भाषा मॉडल से आसान तरीके से निपटने की अनुमति देती है।   इसकी पूरी क्षमताएं देखें। हम   नामक छोटे भाषा मॉडल को प्रशिक्षित करने के लिए लामिनी का उपयोग करेंगे, जो   द्वारा बनाया गया एक ओपनसोर्स मॉडल है और अल्पाका नामक कंपनी डेटासेट का उपयोग करके इस पर   करेंगे। यहां पाइथिया एलुथर एआई अनुदेश फाइनट्यूनिंग   चरण 1: इंस्ट्रक्शन फ़ाइनट्यूनिंग डेटासेट को आरंभ और लोड करें  इस चरण में आवश्यक मॉड्यूल को आरंभ करने दें और अल्पाका प्रशिक्षण डेटा सेट को भी देखें। यहाँ कोड है.   import itertools import jsonlines from datasets import load_dataset from pprint import pprint from llama import BasicModelRunner from transformers import AutoTokenizer, AutoModelForCausalLM from transformers import AutoModelForSeq2SeqLM, AutoTokenizer ## we are using alpaca data set, which is an open source fine tuning data set instruction_tuned_dataset = load_dataset("tatsu-lab/alpaca", split="train", streaming=True) m = 5 print("Instruction-tuned dataset:") top_m = list(itertools.islice(instruction_tuned_dataset, m)) for j in top_m: print(j)  निर्देश ट्यूनिंग डेटा सेट इस प्रकार दिखता है। इसमें प्रश्न और उत्तर के रूप में डेटा शामिल है।   चरण 2: संकेतों को हाइड्रेट करें  इस चरण में हम अल्पाका सेट से डेटा लेते हैं और उन्हें नीचे दिए गए संकेतों में डालते हैं।   prompt_template_with_input = """Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request. ### Instruction: {instruction} ### Input: {input} ### Response:""" prompt_template_without_input = """Below is an instruction that describes a task. Write a response that appropriately completes the request. ### Instruction: {instruction} ### Response:""" ## hydrate prompts - meaning add data to the above prompts processed_data = [] for j in top_m: if not j["input"]: processed_prompt = prompt_template_without_input.format(instruction=j["instruction"]) else: processed_prompt = prompt_template_with_input.format(instruction=j["instruction"], input=j["input"]) processed_data.append({"input": processed_prompt, "output": j["output"]})  ऐसा करने के बाद डेटा सेट इस प्रकार दिखेगा.   हम मूल रूप से कच्चे प्रश्नोत्तर डेटा ले रहे हैं और इसे एक ऐसे प्रारूप में परिवर्तित कर रहे हैं जो एलएलएम के लिए समझ में आता है कि जब कोई प्रश्न पूछा जाता है तो उस प्रश्न का उत्तर कैसा दिखना चाहिए। हम इसे पुनरावृत्त रूप से करते हैं और एक   फ़ाइल में संग्रहीत करते हैं। jsonl   with jsonlines.open(f'alpaca_processed.jsonl', 'w') as writer: writer.write_all(processed_data)  चरण 3 - गैर-फ़ाइनट्यून्ड आउटपुट  चरण 1 और 2 में हमने कच्चा डेटा लोड किया और उसे हाइड्रेट किया और   प्रारूप में संग्रहीत किया। लेकिन लामिनी के पास यह हाइड्रेटेड डेटा उपयोग के लिए तैयार है, इसलिए तकनीकी रूप से चरण 1 और 2 आवश्यक नहीं हैं। लेकिन यह समझने के लिए कि निर्देश फाइनट्यूनिंग कैसे काम करती है, यह दिखाना आवश्यक था। आइए पहले देखें कि पाइथिया मॉडल का एक गैर-परिष्कृत संस्करण एक साधारण प्रश्न का उत्तर कैसे देगा। jsonl   tokenizer = AutoTokenizer.from_pretrained("EleutherAI/pythia-70m") #70M parameter model that is not instruction tuned. model = AutoModelForCausalLM.from_pretrained("EleutherAI/pythia-70m") def inference(text, model, tokenizer, max_input_tokens=1000, max_output_tokens=100): # Tokenize input_ids = tokenizer.encode( text, return_tensors="pt", truncation=True, max_length=max_input_tokens ) # Generate device = model.device generated_tokens_with_prompt = model.generate( input_ids=input_ids.to(device), max_length=max_output_tokens ) # Decode generated_text_with_prompt = tokenizer.batch_decode(generated_tokens_with_prompt, skip_special_tokens=True) # Strip the prompt generated_text_answer = generated_text_with_prompt[0][len(text):] return generated_text_answer ## the 70M model doesnt have any company specific data, we will use the alpace data set from hosted on lamini and fine tune this model # load alpaca dataset finetuning_dataset_path = "lamini/lamini_docs" finetuning_dataset = load_dataset(finetuning_dataset_path) #print(finetuning_dataset) test_sample = finetuning_dataset["test"][0] print(test_sample) print("untrained output sample") print(inference(test_sample["question"], model, tokenizer))  यह वह आउटपुट है जो मुझे मिला। आप देखेंगे कि आउटपुट मददगार नहीं है और मॉडल टोकन पूरा करने का प्रयास कर रहा है और वास्तविक उत्तर नहीं दे रहा है।    चरण 4 - अनुदेश फ़ाइनट्यून्ड आउटपुट  एक बार जब हम पिछले चरण में देखे गए प्रश्नोत्तरी डेटा का उपयोग निर्देश को ठीक करने के लिए करते हैं तो वही मॉडल एक चैट बॉट की तरह व्यवहार करना शुरू कर देगा और आपके प्रश्नों के सटीक उत्तर प्रदान करेगा, दोनों बारीक किए गए डेटा के साथ-साथ उस डेटा पर भी जो मॉडल पहले से ही मौजूद है। बंद होता है. यह लगभग वैसा ही है जैसे जब कोई बच्चा पहली बार कोई भाषा सीखता है, तो वह अब भाषा प्रशिक्षण के कारण सीखी गई नई चीजों के साथ-साथ अपनी भावनाओं को भी व्यक्त करने में सक्षम होगा। मॉडल के पूर्व-प्रशिक्षित संस्करण की तरह, अनुदेश फाइनट्यून मॉडल भी लामिनी पर होस्ट किया गया है और नीचे दिखाए गए अनुसार एक कमांड के साथ अनुमान लगाया जा सकता है। (हाँ लामिनी बढ़िया है!)   ## finetuned output instruction_model = AutoModelForCausalLM.from_pretrained("lamini/lamini_docs_finetuned") print("instruction finetuned output") print(inference(test_sample["question"], instruction_model, tokenizer))  आउटपुट इस प्रकार दिखेगा. आप देखेंगे कि पिछले चरण में हमने जो अस्पष्टता देखी थी उसके बजाय हमारे पास अधिक सटीक आउटपुट है।   इस पोस्ट का लक्ष्य   का परिचय देना है और बेस मॉडल को अधिक उपयोगी संस्करण बनाने के लिए इसका उपयोग कैसे किया जाता है। भविष्य की पोस्टों में मैं  निर्देश फ़ाइनट्यूनिंग इंस्ट्रक्शन फ़ाइनट्यूनिंग करने की वास्तविक प्रक्रिया के बारे में गहराई से बताऊंगा।   एआई के 100 दिनों के 13वें दिन के लिए बस इतना ही।   मैं एबव एवरेज नाम से एक समाचार पत्र लिखता हूं जहां मैं बड़ी तकनीक में होने वाली हर चीज के पीछे दूसरे क्रम की अंतर्दृष्टि के बारे में बात करता हूं। यदि आप टेक में हैं और औसत नहीं बनना चाहते हैं,   । तो इसकी सदस्यता लें  एआई के 100 दिनों पर नवीनतम अपडेट के लिए मुझे   ,   पर फॉलो करें। यदि आप तकनीक में हैं तो आपको   तकनीकी पेशेवरों के मेरे समुदाय में शामिल होने में रुचि हो सकती है। ट्विटर लिंक्डइन यहां    भी दिखाई देता है. यहाँ

Product & Engineering @Microsoft Azure | On Deck Fellow |
Partner at planbcapital.co

2021 - HackerNoon Contributor of the Year - CROWDFUNDING

2022 - HackerNoon Contributor of the Year - Business Strategy

2022 - HackerNoon Contributor of the Year - India

2022 - HackerNoon Contributor of the Year - Netflix

2022 - Startup Blogger of the Year

Listen to Startup Project Podcast

Subscribe to Startup Project newsletter

Follow me @natarajsindam

Meet the Writer: HackerNoon Contributor Nataraj Sindam on Experimenting With AI 

यह ऑडियो कहानी की मूल भाषा में निर्मित है!

एआई के 100 दिन, दिन 13: कैसे निर्देश फाइनट्यूनिंग एक पूर्व-प्रशिक्षित एलएलएम को बेहतर बनाता है

About Author

टिप्पणियाँ

लेबल

इस लेख में चित्रित किया गया था

Related Stories

हैकरनून कोडेड: शीर्ष 10 देश जहां हैकरनून सबसे अधिक सक्रिय है

AI की शक्ति को उन्मुक्त करना। अत्याधुनिक तकनीकों की एक व्यवस्थित समीक्षा: सार और परिचय

अपने वर्कफ़्लो को 10 गुना बेहतर कैसे बनाएं: 17 ज़रूरी ऐप्स

State of the Noonion: A New Era For Brands and Writers

हैकरनून कोडेड: शीर्ष 10 देश जहां हैकरनून सबसे अधिक सक्रिय है

AI की शक्ति को उन्मुक्त करना। अत्याधुनिक तकनीकों की एक व्यवस्थित समीक्षा: सार और परिचय

अपने वर्कफ़्लो को 10 गुना बेहतर कैसे बनाएं: 17 ज़रूरी ऐप्स

State of the Noonion: A New Era For Brands and Writers

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps