paint-brush
PrivateGPT कैसे स्थापित करें: एक स्थानीय ChatGPT- जैसा उदाहरण जिसमें इंटरनेट की आवश्यकता नहीं हैद्वारा@nodegree
31,229 रीडिंग
31,229 रीडिंग

PrivateGPT कैसे स्थापित करें: एक स्थानीय ChatGPT- जैसा उदाहरण जिसमें इंटरनेट की आवश्यकता नहीं है

द्वारा Nerdy_techie4m2023/05/25
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

PrivateGPT एक शक्तिशाली उपकरण है जो आपको इंटरनेट कनेक्शन की आवश्यकता के बिना दस्तावेजों को स्थानीय रूप से क्वेरी करने की अनुमति देता है। यह ट्यूटोरियल एक Youtube वीडियो के साथ आता है, जहाँ आप इंस्टालेशन प्रक्रिया का चरण-दर-चरण प्रदर्शन पा सकते हैं। सबसे पहले, चलिए एक आभासी वातावरण बनाते हैं। फिर जीथब से कोड रेपो कॉपी करें।
featured image - PrivateGPT कैसे स्थापित करें: एक स्थानीय ChatGPT- जैसा उदाहरण जिसमें इंटरनेट की आवश्यकता नहीं है
Nerdy_techie HackerNoon profile picture
0-item
1-item

इस लेख की मुख्य छवि हैकरनून केएआई इमेज जेनरेटर द्वारा "एक पुराने डेस्कटॉप कंप्यूटर का उपयोग करने वाला एक रोबोट" के माध्यम से तैयार की गई थी।


एआई स्पेस में कुछ नया है। इस पोस्ट में, मैं आपको PrivateGPT को स्थापित करने और स्थापित करने की प्रक्रिया के बारे में बताऊँगा।


प्राइवेटजीपीटी क्या है?

एक शक्तिशाली उपकरण जो आपको इंटरनेट कनेक्शन की आवश्यकता के बिना स्थानीय रूप से दस्तावेज़ों को क्वेरी करने की अनुमति देता है। चाहे आप एक शोधकर्ता हों, विकासकर्ता हों, या केवल दस्तावेज़ पूछताछ उपकरण तलाशने के बारे में उत्सुक हों, PrivateGPT एक कुशल और सुरक्षित समाधान प्रदान करता है। यह ट्यूटोरियल एक Youtube वीडियो के साथ आता है, जहाँ आप इंस्टालेशन प्रक्रिया का चरण-दर-चरण प्रदर्शन पा सकते हैं!


पूर्वापेक्षाएँ:

  • पायथन 3.10 या बाद में आपके सिस्टम या वर्चुअल एनवी पर स्थापित

  • कमांड लाइन इंटरफेस (सीएलआई/टर्मिनल) का उपयोग करने का बुनियादी ज्ञान

  • गिट स्थापित


सबसे पहले, चलिए एक आभासी वातावरण बनाते हैं। आप अपने डेस्कटॉप पर एक फोल्डर बना सकते हैं। नीचे दिए गए स्क्रीनशॉट में आप देख सकते हैं कि मैंने 'blog_projects' नामक फ़ोल्डर बनाया है। उस फ़ोल्डर से कमांड लाइन खोलें या टर्मिनल/कमांड लाइन का उपयोग करके उस फ़ोल्डर में नेविगेट करें। वर्चुअल वातावरण बनाने के लिए नीचे दिए गए चरणों का पालन करें।


1. एक आभासी वातावरण बनाएँ:

  • अपना टर्मिनल खोलें और वांछित निर्देशिका पर नेविगेट करें।
  • वर्चुअल वातावरण बनाने के लिए निम्नलिखित कमांड चलाएँ (myenv को अपने पसंदीदा नाम से बदलें):


python3 -m venv myenv

आपके आभासी वातावरण का नाम 'myenv' होगा


2. आभासी वातावरण को सक्रिय करें:

  • macOS और Linux पर, निम्न कमांड का उपयोग करें:

स्रोत myenv/bin/active


  • विंडोज़ पर, निम्न आदेश का प्रयोग करें:

myenv\Scripts\active


3. रिपॉजिटरी को क्लोन करने के लिए git क्लोन कमांड चलाएँ:

गिट क्लोन https://github.com/imartinez/privateGPT.git


रिपॉजिटरी की क्लोनिंग से पहले आभासी वातावरण बनाने और सक्रिय करने से, हम यह सुनिश्चित करते हैं कि परियोजना निर्भरताएँ इस वातावरण में स्थापित और प्रबंधित की जाएँगी। यह इस परियोजना के लिए विशिष्ट एक स्वच्छ और पृथक विकास वातावरण को बनाए रखने में मदद करता है।

रिपॉजिटरी की क्लोनिंग के बाद, आप प्रोजेक्ट डिपेंडेंसी को स्थापित करने के लिए आगे बढ़ सकते हैं और सक्रिय वर्चुअल वातावरण के भीतर प्रोजेक्ट पर काम करना शुरू कर सकते हैं।


फिर जीथब से कोड रेपो कॉपी करें, और अपनी निर्देशिका या फ़ोल्डर में जाएं जहां आप चाहते हैं कि आपका प्रोजेक्ट लाइव हो। टर्मिनल खोलें या कमांड लाइन से अपने फ़ोल्डर में नेविगेट करें।

एक बार जब सब कुछ लोड हो जाता है, तो आप आवश्यक निर्भरताओं को स्थापित करने के लिए इंस्टॉल आवश्यकताएँ कमांड चला सकते हैं।

  • उस निर्देशिका पर नेविगेट करें जहाँ आप PrivateGPT स्थापित करना चाहते हैं।

सीडी <फ़ोल्डर का नाम>


  • आवश्यक निर्भरताएँ स्थापित करने के लिए निम्न कमांड चलाएँ:

पाइप इंस्टॉल -r आवश्यकताएँ। txt


  • अगला, एलएलएम मॉडल डाउनलोड करें और इसे अपनी पसंद की निर्देशिका में रखें। डिफ़ॉल्ट मॉडल 'ggml-gpt4all-j-v1.3-groovy.bin' है, लेकिन यदि आप एक भिन्न GPT4All-J संगत मॉडल पसंद करते हैं, तो आप इसे डाउनलोड कर सकते हैं और इसे अपनी .env फ़ाइल में संदर्भित कर सकते हैं।


  • 'Example.env' फ़ाइल को '.env' में पुनर्नामित करें और चरों को उचित रूप से संपादित करें।


आपके द्वारा उपयोग किए जा रहे मॉडल के आधार पर 'MODEL_TYPE' चर को या तो 'LlamaCpp' या 'GPT4All' पर सेट करें।


  • 'PERSIST_DIRECTORY' चर को उस फ़ोल्डर में सेट करें जहाँ आप चाहते हैं कि आपका वेक्टर स्टोर संग्रहीत हो।
  • 'MODEL_PATH' चर को अपने GPT4All या LlamaCpp समर्थित LLM मॉडल के पथ पर सेट करें.
  • LLM मॉडल के लिए 'MODEL_N_CTX' चर को अधिकतम टोकन सीमा पर सेट करें।
  • 'EMBEDDINGS_MODEL_NAME' वेरिएबल को SentenceTransformers एम्बेडिंग मॉडल नाम पर सेट करें ( https://www.sbert.net/docs/pretrained_models.html देखें)।


आपके द्वारा डाउनलोड किए गए मॉडल को रखने के लिए सुनिश्चित करें कि आपने अपने प्रोजेक्ट में एक मॉडल फ़ोल्डर बनाया है।


PrivateGPT एक नमूना डेटासेट के साथ आता है जो एक उदाहरण के रूप में 'स्टेट ऑफ़ द यूनियन ट्रांसक्रिप्ट' का उपयोग करता है। हालाँकि, आप अपने स्वयं के डेटासेट को भी ग्रहण कर सकते हैं। मुझे आपको बताने दो कि कैसे।


  1. अपनी सभी फाइलों को 'source_documents' डायरेक्टरी में रखें।
  2. सुनिश्चित करें कि आपकी फ़ाइलों में समर्थित एक्सटेंशन में से एक है: CSV, Word Document (docx, doc), EverNote (enex), ईमेल (eml), EPub (epub), HTML फ़ाइल (html), Markdown (md), आउटलुक संदेश ( msg), ओपन डॉक्यूमेंट टेक्स्ट (odt), पोर्टेबल डॉक्यूमेंट फॉर्मेट (PDF), पॉवरपॉइंट डॉक्यूमेंट (pptx, ppt), टेक्स्ट फाइल (txt)।
  3. सभी डेटा को निगलना करने के लिए निम्न कमांड चलाएँ:

अजगर ingest.py


उत्तम! डेटा अंतर्ग्रहण प्रक्रिया पूरी हो गई है। अब, अगले कदम पर चलते हैं!


यदि आपके पास यह त्रुटि है: cannot import name 'DEFAULT_CIPHERS' from 'urllib3.util.ssl_' , तो इस आदेश का उपयोग करें: python -m pip install requests "urllib3<2"


उल्लेखनीय बात यह है कि यदि आप अपने SOURCE_DOCS में नए दस्तावेज़ जोड़ते हैं, तो आपको 'python ingest.py' को फिर से चलाना होगा

--------------------------------------------------- -------------

आपके दस्तावेज़ होस्ट से प्रश्न पूछना:

अब रोमांचक भाग आता है—PrivateGPT का उपयोग करके अपने दस्तावेज़ों से प्रश्न पूछना। मैं आपको दिखाता हूँ कि यह कैसे किया जाता है।


  1. अपना टर्मिनल या कमांड प्रॉम्प्ट खोलें।
  2. उस निर्देशिका पर नेविगेट करें जहां आपने PrivateGPT स्थापित किया था।

[परियोजना निर्देशिका 'निजीजीपीटी', यदि आप अपने सीएलआई में ls टाइप करते हैं तो आप कुछ फाइलों के बीच READ.ME फ़ाइल देखेंगे।]


  • निम्नलिखित आदेश चलाएँ:

अजगर PrivateGPT.py

  1. इनपुट के लिए आपको संकेत देने के लिए स्क्रिप्ट की प्रतीक्षा करें।
  2. संकेत दिए जाने पर, अपना प्रश्न दर्ज करें!

ट्रिक्स और टिप्स:

  • अपने आउटपुट से स्रोतों को निकालने के लिए python privategpt.py -s [ का प्रयोग करें। इसलिए उत्तर और स्रोत प्रदर्शित करने के बजाय यह केवल स्रोत प्रदर्शित करेगा]
  • लाइन 33 पर, कमांड के अंत में जहां आप देखते हैं' वर्बोज़ = झूठा, 'एन थ्रेड्स = 16' दर्ज करें जो तेज गति से पाठ उत्पन्न करने के लिए अधिक शक्ति का उपयोग करेगा!

PrivateGPT अंतिम विचार

  • यह किसी के लिए भी बहुत अच्छा है जो अपने स्थानीय कंप्यूटर पर जटिल दस्तावेज़ों को समझना चाहता है।
  • यह निजी डेटा के लिए बहुत अच्छा है जिसे आप बाहरी रूप से लीक नहीं करना चाहते हैं।
  • यह विशेष रूप से छात्रों, उद्योग में नए लोगों, करों के बारे में सीखने वाले लोगों, या किसी भी जटिल चीज़ को सीखने वाले व्यक्ति के लिए बहुत अच्छा है, जिसे समझने में उन्हें मदद की आवश्यकता है।
  • हालाँकि, प्रतीक्षा समय 30-50 सेकंड या इससे भी अधिक हो सकता है क्योंकि आप इसे अपने स्थानीय कंप्यूटर पर चला रहे हैं।