पोर्टेबल दस्तावेज़ प्रारूप (पीडीएफ) फ़ाइलें हमारी डिजिटल दुनिया में सर्वव्यापी हैं। हम दस्तावेज़ साझा करने से लेकर ऑनलाइन फॉर्म भरने तक हर चीज़ के लिए उनका उपयोग करते हैं। लेकिन पीडीएफ़ के साथ काम करना हमेशा आसान नहीं होता है। यहीं पर कृत्रिम बुद्धिमत्ता आती है।
हम देखेंगे कि एआई सहायक क्लाउड 2 पीडीएफ से संबंधित कार्यों को कितनी अच्छी तरह संभालता है। एंथ्रोपिक द्वारा निर्मित क्लॉड 2 को सहायक, हानिरहित और ईमानदार बनाने के लिए डिज़ाइन किया गया है। यह देखने के लिए कि क्या यह इस महत्वपूर्ण फ़ाइल प्रारूप के साथ काम करते समय इन आदर्शों पर खरा उतरता है, हम इसे कुछ सामान्य पीडीएफ क्रियाओं में डालेंगे।
वास्तविक दुनिया के परिदृश्यों में एआई सहायकों का परीक्षण करना आवश्यक है। एआई हमारे जीवन का इतना बड़ा हिस्सा बन गया है, यह जानना महत्वपूर्ण है कि वे किसमें उत्कृष्ट हैं और वे कहां कम रह सकते हैं। क्लाउड एक मजबूत दावेदार के रूप में उभरता दिख रहा है, संभवतः GPT-4 जैसे मॉडलों के बराबर। हमें विश्वास है कि जो उपयोगकर्ता इन तकनीकों को समझते हैं वे इन्हें सफलतापूर्वक अपनाने में महत्वपूर्ण भूमिका निभाएंगे।
तो हमारे साथ जुड़ें क्योंकि हम पता लगा रहे हैं कि क्या क्लॉड 2 पीडीएफ के साथ काम करना आसान बना सकता है या क्या इसके कौशल में अभी भी सुधार की आवश्यकता है। परिणाम आपको चौंका सकते हैं।
क्लॉड 2 पीडीएफ फाइलों के साथ विश्लेषण और काम करने की अपनी अंतर्निहित क्षमता के लिए अन्य एआई सहायकों से अलग है। एंथ्रोपिक के शोधकर्ताओं ने मशीन-लर्निंग तकनीकों का उपयोग करके पीडीएफ दस्तावेज़ों की संरचना को पार्स करने और समझने के लिए क्लाउड 2 को डिज़ाइन किया। यह क्लॉड 2 को अन्य चैटबॉट्स की तुलना में पीडीएफ को संसाधित करने में एक अंतर्निहित लाभ देता है जो उन्हें समझने में संघर्ष करेगा। एक समर्पित पीडीएफ विश्लेषक घटक के साथ पहले एआई मॉडल में से एक के रूप में, क्लाउड 2 पीडीएफ से संबंधित कार्यों में उत्कृष्टता प्राप्त करने के लिए विशिष्ट रूप से तैनात है। इस ब्लॉग पोस्ट में, हम जांच करेंगे कि इसकी विशिष्ट इंजीनियरिंग इस सर्वव्यापी दस्तावेज़ प्रारूप के साथ काम करने में वास्तविक दुनिया की दक्षता में कैसे तब्दील होती है। हमारे परीक्षणों से पता चलेगा कि क्लाउड 2 पीडीएफ में हेरफेर करने में सहायक, हानिरहित और ईमानदार सहायता प्रदान करने के अपने वादे को पूरा कर सकता है या नहीं। यह भी ध्यान दें कि अधिकतम फ़ाइल आकार 10MB है।
अपने ट्यूटोरियल के लिए, हम एक पायथन ट्यूटोरियल पीडीएफ का उपयोग करने जा रहे हैं और देखेंगे कि हम इससे क्या प्राप्त कर सकते हैं।
आइए उन प्रश्नों को पूछकर शुरुआत करें जिनके बारे में हम जानते हैं कि वे दस्तावेज़ में हैं। हम इसे संकेत देंगे "फ़ॉर्मेटेड स्ट्रिंग लिटरल्स क्या हैं?" उत्तर पीडीएफ में भी काफी गहरा है, इसलिए यह दिलचस्प होगा यदि यह दस्तावेजों की शुरुआत में पाठ का उत्तर दे सके, लेकिन अंत में नहीं।
यहाँ परिणाम है. पीडीएफ में उत्तर काफी संक्षिप्त हैं।
अब, आइए फ़ाइल से सीधे उद्धरण प्राप्त करने का प्रयास करें। अब हमारा संकेत होगा "फ़ंक्शन एनोटेशन क्या हैं?" मुझे दस्तावेज़ से एक उद्धरण दें”।
यहाँ परिणाम है.
जो प्रत्यक्ष उद्धरण होने की पुष्टि करता है! यह कोड स्निपेट प्रदर्शित करने में भी सक्षम था।
अब, हम वित्तीय दस्तावेज़ आज़माएँगे। हम माइक्रोसॉफ्ट की नवीनतम त्रैमासिक रिपोर्ट जोड़ेंगे। हम इसे "दस्तावेज़ के अनुसार" कहकर संकेत देंगे। तिमाही के लिए माइक्रोसॉफ्ट का कुल राजस्व क्या था?"यहां हमारे परिणामों का स्क्रीनशॉट है।
हम देख सकते हैं कि क्लाउड ने हमारे द्वारा अनुरोधित राजस्व जानकारी प्रदान की है, और तथ्य-जांच करने पर, हम आत्मविश्वास से इसकी सटीकता को मान्य कर सकते हैं। क्लाउड ने सटीक पृष्ठ भी बताया जहां यह जानकारी मिल सकती है, और यह सही भी है।
फिर हमने यह कहकर पूछा, "पिछले वर्ष की तुलना में राजस्व में कितने प्रतिशत परिवर्तन हुआ?" मैं देखना चाहता था कि क्या यह कुछ विश्लेषण कर सकता है।
मेरे आश्चर्य के लिए, यह इसका पता लगाने में सक्षम था। इसमें नतीजों का पेज नंबर भी दिया गया। मुझे यह भी नहीं पता था कि यह डेटा दस्तावेज़ों में था। मैंने सोचा कि इसमें पिछले साल का Q3 राजस्व और इस साल का राजस्व लगेगा, फिर प्रतिशत अंतर की गणना करने के लिए गणित करें।
क्लाउड वर्तमान में आपके द्वारा किए जाने वाले अनुरोधों की संख्या पर सीमाएं लगाता है और यहां तक कि पहुंच के लिए प्रतीक्षा सूची भी हो सकती है। इन बाधाओं को ध्यान में रखते हुए, कुछ वैकल्पिक विकल्प तलाशना सार्थक है।
डॉक्स के साथ एनएलपी के लिए पर्प्लेक्सिटी एआई एक बेहतरीन एआई टूल है। उपयोगकर्ता पीडीएफ फाइलों को सादे पाठ, कोड या पीडीएफ प्रारूप में अपलोड कर सकते हैं, और पर्प्लेक्सिटी उत्तर तैयार करने के लिए फ़ाइल सामग्री का उपयोग करेगा। छोटी फ़ाइलों के लिए, पूरे दस्तावेज़ का भाषा मॉडल द्वारा विश्लेषण किया जाएगा। पर्प्लेक्सिटी लंबी पीडीएफ को मैन्युअल रूप से विषय क्षेत्रों में विभाजित कर सकती है और रचनात्मक लेखन के लिए उन्हें जीपीटी-4 में फीड कर सकती है। पर्प्लेक्सिटी दस्तावेज़ों से सीधे प्रश्नों के उत्तर देने के लिए पीडीएफ का विश्लेषण कर सकती है, इसके द्वारा दिए गए उत्तरों के लिए स्रोत उद्धरण प्रदान कर सकती है, शोध पत्रों की तुलना और तुलना कर सकती है, किसी क्वेरी के आधार पर संबंधित दस्तावेज़ या पेपर ढूंढ सकती है, डेटा का विश्लेषण कर सकती है और विभिन्न स्रोतों से अंतर्दृष्टि उत्पन्न कर सकती है, डेटा की कल्पना कर सकती है और बना सकती है। विभिन्न स्रोतों से ग्राफ़िक्स, और पाठ का एक भाषा से दूसरी भाषा में अनुवाद करना। यदि आप मुफ़्त खाते पर हैं, तो आप केवल एक निश्चित संख्या में ही अनुरोध कर सकते हैं। यदि आप असीमित फ़ाइल अपलोड चाहते हैं, तो आपको $20/महीना की सदस्यता लेनी होगी।
चैटजीपीटी ने चैटजीपीटी प्लस ग्राहकों के लिए अपने नवीनतम अपडेट में एक नई सुविधा के रूप में पीडीएफ विश्लेषण की घोषणा की है। यह सुविधा उपयोगकर्ताओं को पीडीएफ फाइलें और अन्य दस्तावेज अपलोड करने की अनुमति देती है, जिसका चैटजीपीटी द्वारा विश्लेषण किया जा सकता है। चैटबॉट सारांश और विभिन्न डेटा बिंदु निकाल सकता है या उस डेटा के आधार पर ग्राफ़ और चार्ट भी लिख सकता है। कार्यक्षमता वर्तमान में बीटा में है और चैटजीपीटी प्लस सदस्यों के लिए उपलब्ध है। अपडेट में स्वचालित टूल स्विचिंग भी शामिल है, जो चैटजीपीटी को यह अनुमान लगाने की अनुमति देता है कि उपयोगकर्ता संदर्भ के आधार पर क्या चाहते हैं। नई सुविधाएँ चैटजीपीटी प्लस ग्राहकों के लिए अक्टूबर 2023 से उपलब्ध हैं
अंतिम लेकिन निश्चित रूप से महत्वपूर्ण, ओपन-सोर्स समाधान एक आकर्षक विकल्प प्रदान करते हैं। पीडीएफ विश्लेषण के लिए ढेर सारे ओपन-सोर्स टूल उपलब्ध हैं, जो लैंगचैन या पायथन डेटा साइंस जैसी विभिन्न तकनीकों का लाभ उठाते हैं, जो अक्सर वेक्टर डेटाबेस के साथ एकीकृत होते हैं। यह ध्यान देने योग्य है कि पीजीवेक्टर जैसे वेक्टर डेटाबेस समाधान पाइनकोन जैसी वाणिज्यिक सेवाओं की तुलना में काफी अधिक लागत प्रभावी विकल्प प्रदान कर सकते हैं। फिर भी, GitHub जैसे प्लेटफ़ॉर्म पर ओपन-सोर्स समुदाय आपकी पीडीएफ विश्लेषण आवश्यकताओं को पूरा करने के लिए सुलभ और अनुकूलन योग्य मॉडल का खजाना प्रदान करता है।
जब हमने पहली बार क्लाउड के पीडीएफ विश्लेषक का परीक्षण किया तो मैं वास्तव में उत्साहित था। शुरुआती नतीजे बहुत अच्छे दिखे. लेकिन आप जानते हैं कि एआई मॉडल के साथ यह कैसे होता है - वे परिपूर्ण नहीं हैं। यहां-वहां कुछ गलतियां जरूर हुईं। जब मैंने पहली बार क्लाउड के साथ पीडीएफ़ के बारे में बातचीत शुरू की, तो वह अक्सर भ्रमित हो जाती थी। लेकिन मैं लगातार इस बात से प्रभावित हुआ हूं कि यह कितना बेहतर हो गया है। पहले की तुलना में त्रुटियाँ, यदि कोई हों, बहुत कम हो गई हैं।
समय के साथ इस प्रकार का सुधार देखना वास्तव में आशाजनक है। मैं यह नहीं कह रहा हूं कि यह अभी तक मानव विशेषज्ञता को प्रतिस्थापित करने के लिए तैयार है; जाहिर है, आप चीजों की दोबारा जांच करना चाहेंगे। हमें अभी भी किसी भी संभावित समस्या पर नजर रखने की जरूरत है। लेकिन मैं इस बारे में आशावादी हूं कि क्लाउड की पीडीएफ क्षमताएं किस दिशा में जा रही हैं। यह अंततः एक अविश्वसनीय रूप से उपयोगी उपकरण साबित हो सकता है। बेशक, बहुत सारे विकल्प हैं, लेकिन यह उनमें से एक बढ़िया है।