পোর্টেবল ডকুমেন্ট ফরম্যাট (পিডিএফ) ফাইলগুলি আমাদের ডিজিটাল বিশ্বে সর্বব্যাপী। ডকুমেন্ট শেয়ার করা থেকে শুরু করে অনলাইনে ফর্ম পূরণ করা পর্যন্ত সবকিছুর জন্য আমরা এগুলি ব্যবহার করি। কিন্তু PDF এর সাথে কাজ করা সবসময় সহজ নয়। সেখানেই কৃত্রিম বুদ্ধিমত্তা আসে।
এআই সহকারী ক্লড 2 পিডিএফ-সম্পর্কিত কাজগুলি কতটা ভালভাবে পরিচালনা করে তা আমরা দেখব। Anthropic দ্বারা নির্মিত Claude 2, সহায়ক, নিরীহ এবং সৎ হতে ডিজাইন করা হয়েছে। এই গুরুত্বপূর্ণ ফাইল ফরম্যাটের সাথে কাজ করার সময় এটি এই আদর্শগুলি মেনে চলে কিনা তা দেখতে আমরা কিছু সাধারণ পিডিএফ অ্যাকশনে এর গতির মাধ্যমে এটি রাখব।
বাস্তব-বিশ্বের পরিস্থিতিতে এআই সহকারীদের পরীক্ষা করা অপরিহার্য। AI আমাদের জীবনের এত বড় অংশ হয়ে ওঠার সাথে সাথে, তারা কোন বিষয়ে উৎকর্ষ সাধন করে এবং কোথায় তারা কম পড়তে পারে তা জানা অত্যন্ত গুরুত্বপূর্ণ। Claude একটি শক্তিশালী প্রতিযোগী হিসাবে আবির্ভূত হচ্ছে বলে মনে হচ্ছে, সম্ভবত GPT-4 এর মত মডেলের সমতুল্য। আমরা আত্মবিশ্বাসী যে ব্যবহারকারীরা যারা এই প্রযুক্তিগুলি বোঝেন তারা তাদের সফল গ্রহণে একটি গুরুত্বপূর্ণ ভূমিকা পালন করবে৷
সুতরাং ক্লাউড 2 পিডিএফ-এর সাথে কাজ করা সহজ করতে পারে কিনা বা এর দক্ষতার এখনও উন্নতির প্রয়োজন আছে কিনা তা অন্বেষণ করার জন্য আমাদের সাথে যোগ দিন। ফলাফল গুলো আপনাকে বিস্মিত করবে।
ক্লড 2 পিডিএফ ফাইলগুলির সাথে বিশ্লেষণ এবং কাজ করার অন্তর্নির্মিত ক্ষমতার জন্য অন্যান্য AI সহকারী থেকে আলাদা। অ্যানথ্রপিকের গবেষকরা মেশিন-লার্নিং কৌশল ব্যবহার করে পিডিএফ নথির গঠন বিশ্লেষণ এবং বোঝার জন্য ক্লড 2 ডিজাইন করেছেন। এটি অন্যান্য চ্যাটবটগুলির তুলনায় পিডিএফ প্রক্রিয়াকরণের ক্ষেত্রে Claude 2-কে একটি অন্তর্নিহিত সুবিধা দেয় যা সেগুলি বোঝার জন্য সংগ্রাম করবে। একটি ডেডিকেটেড পিডিএফ বিশ্লেষক উপাদান সহ প্রথম এআই মডেলগুলির মধ্যে একটি হিসাবে, ক্লাউড 2 পিডিএফ-সম্পর্কিত কাজগুলিতে এক্সেল করার জন্য অনন্যভাবে অবস্থান করছে। এই ব্লগ পোস্টে, আমরা পরীক্ষা করব কিভাবে এর বিশেষায়িত প্রকৌশল এই সর্বব্যাপী নথি বিন্যাসের সাথে কাজ করার ক্ষেত্রে বাস্তব-বিশ্বের দক্ষতায় অনুবাদ করে। আমাদের পরীক্ষাগুলি প্রকাশ করবে যে ক্লাউড 2 পিডিএফ ম্যানিপুলেট করার জন্য সহায়ক, ক্ষতিকারক, এবং সৎ সহায়তা প্রদানের প্রতিশ্রুতি প্রদান করতে পারে কিনা। এছাড়াও, নোট করুন যে 10MB সর্বাধিক ফাইলের আকার।
আমাদের টিউটোরিয়ালের জন্য, আমরা একটি পাইথন টিউটোরিয়াল পিডিএফ ব্যবহার করতে যাচ্ছি এবং এটি থেকে আমরা কী পেতে পারি তা দেখতে যাচ্ছি।
আসুন এটিকে প্রশ্ন জিজ্ঞাসা করে শুরু করি যা আমরা জানি যে নথিতে রয়েছে। আমরা এটিকে প্রম্পট দেব "ফরম্যাট করা স্ট্রিং লিটারালগুলি কী?"। উত্তরটি পিডিএফ-এও বেশ গভীর, তাই এটি আকর্ষণীয় হবে যদি এটি নথির শুরুতে পাঠ্যের উত্তর দিতে পারে তবে শেষ নয়।
এখানে ফলাফল. উত্তরগুলি পিডিএফ-এ বেশ সংক্ষিপ্ত।
এখন, ফাইল থেকে সরাসরি উদ্ধৃতি পেতে চেষ্টা করা যাক. আমাদের প্রম্পট এখন হবে “ফাংশন টীকা কি? আমাকে নথি থেকে একটি উদ্ধৃতি দিন"।
এখানে ফলাফল.
যা সরাসরি উদ্ধৃতি নিশ্চিত করে! এমনকি এটি কোড স্নিপেট প্রদর্শন করতে সক্ষম ছিল।
এখন, আমরা আর্থিক নথি চেষ্টা করব। আমরা মাইক্রোসফ্টের সাম্প্রতিক ত্রৈমাসিক প্রতিবেদন যুক্ত করব। আমরা এটিকে "নথি অনুযায়ী প্রম্পট করব। এই প্রান্তিকে মাইক্রোসফটের মোট আয় কত ছিল?” আমাদের ফলাফলের স্ক্রিনশট এখানে।
আমরা দেখতে পাচ্ছি যে Claude আমাদের অনুরোধ করা রাজস্ব তথ্য প্রদান করেছে এবং সত্য-নিরীক্ষার পরে, আমরা আত্মবিশ্বাসের সাথে এর যথার্থতা যাচাই করতে পারি। ক্লড এমনকি সঠিক পৃষ্ঠাটি চিহ্নিত করেছেন যেখানে এই তথ্যটি পাওয়া যেতে পারে এবং এটিও সঠিক।
তারপরে আমরা এটির সাথে অনুরোধ করেছিলাম, "গত বছর থেকে রাজস্বের শতকরা পরিবর্তন কি ছিল?"। আমি দেখতে চেয়েছিলাম এটি কিছু বিশ্লেষণ করতে পারে কিনা।
আমার আশ্চর্যের জন্য, এটি এটি বের করতে সক্ষম হয়েছিল। এটি ফলাফলের পৃষ্ঠা নম্বরও দিয়েছে। আমি জানতাম না যে এই তথ্য নথিতে ছিল। আমি ভেবেছিলাম এটি গত বছরের Q3 রাজস্ব লাগবে এবং এই বছরের, তারপর শতাংশের পার্থক্য গণনা করতে গণিত করুন।
Claude বর্তমানে আপনি করতে পারেন এমন অনুরোধের সংখ্যার উপর সীমাবদ্ধতা আরোপ করে এবং এমনকি অ্যাক্সেসের জন্য একটি অপেক্ষা তালিকা থাকতে পারে। এই সীমাবদ্ধতাগুলি মাথায় রেখে, কিছু বিকল্প বিকল্পগুলি অন্বেষণ করা সার্থক।
Perplexity AI হল ডক্স সহ NLP-এর জন্য একটি দুর্দান্ত AI টুল। ব্যবহারকারীরা পিডিএফ ফাইলগুলি প্লেইন টেক্সট, কোড, বা পিডিএফ ফরম্যাটে আপলোড করতে পারেন এবং প্যারাপ্লেক্সিটি উত্তর তৈরি করতে ফাইলের বিষয়বস্তু ব্যবহার করবে। সংক্ষিপ্ত ফাইলগুলির জন্য, পুরো নথিটি ভাষা মডেল দ্বারা বিশ্লেষণ করা হবে। বিভ্রান্তি দীর্ঘ পিডিএফগুলিকে ম্যানুয়ালি বিষয়ের ক্ষেত্রগুলিতে ভাগ করতে পারে এবং সৃজনশীল লেখার জন্য তাদের GPT-4 এ খাওয়াতে পারে। Perplexity নথি থেকে সরাসরি প্রশ্নের উত্তর দিতে পিডিএফ বিশ্লেষণ করতে পারে, এটি যে উত্তর দেয় তার জন্য উৎস উদ্ধৃতি প্রদান করতে পারে, গবেষণা পত্রের তুলনা এবং বৈসাদৃশ্য করতে পারে, একটি প্রশ্নের উপর ভিত্তি করে সম্পর্কিত নথি বা কাগজপত্র খুঁজে পেতে, ডেটা বিশ্লেষণ করতে এবং বিভিন্ন উত্স থেকে অন্তর্দৃষ্টি তৈরি করতে, ডেটা কল্পনা করতে এবং তৈরি করতে পারে। বিভিন্ন উৎস থেকে গ্রাফিক্স, এবং এক ভাষা থেকে অন্য ভাষাতে পাঠ্য অনুবাদ। আপনি যদি একটি বিনামূল্যের অ্যাকাউন্টে থাকেন তবে আপনি শুধুমাত্র একটি নির্দিষ্ট সংখ্যক অনুরোধ করতে পারেন৷ আপনি যদি আনলিমিটেড ফাইল আপলোড চান, তাহলে আপনাকে $20/মাসে সদস্যতা নিতে হবে।
চ্যাটজিপিটি ChatGPT প্লাস গ্রাহকদের জন্য তার সর্বশেষ আপডেটে একটি নতুন বৈশিষ্ট্য হিসাবে পিডিএফ বিশ্লেষণ ঘোষণা করেছে। এই বৈশিষ্ট্যটি ব্যবহারকারীদের পিডিএফ ফাইল এবং অন্যান্য নথি আপলোড করতে দেয়, যা ChatGPT দ্বারা বিশ্লেষণ করা যেতে পারে। চ্যাটবট সারাংশ এবং বিভিন্ন ডেটা পয়েন্ট বের করতে পারে বা সেই ডেটার উপর ভিত্তি করে গ্রাফ এবং চার্টও লিখতে পারে। কার্যকারিতা বর্তমানে বিটাতে রয়েছে এবং ChatGPT Plus সদস্যদের জন্য উপলব্ধ। আপডেটে স্বয়ংক্রিয় টুল স্যুইচিংও রয়েছে, যা ChatGPT কে অনুমান করতে দেয় ব্যবহারকারীরা প্রসঙ্গের উপর ভিত্তি করে কী চান। নতুন বৈশিষ্ট্যগুলি ChatGPT Plus গ্রাহকদের জন্য অক্টোবর 2023 থেকে উপলব্ধ
শেষ কিন্তু অবশ্যই অন্তত নয়, ওপেন সোর্স সমাধানগুলি একটি বাধ্যতামূলক বিকল্প প্রদান করে। পিডিএফ বিশ্লেষণের জন্য ওপেন সোর্স টুলের আধিক্য পাওয়া যায়, ল্যাংচেইন বা পাইথন ডেটা সায়েন্সের মতো বিভিন্ন প্রযুক্তি ব্যবহার করে, প্রায়ই ভেক্টর ডাটাবেসের সাথে একত্রিত হয়। এটি লক্ষণীয় যে Pgvector-এর মতো ভেক্টর ডাটাবেস সমাধানগুলি পাইনেকোনের মতো বাণিজ্যিক পরিষেবাগুলির তুলনায় উল্লেখযোগ্যভাবে বেশি ব্যয়-কার্যকর বিকল্প অফার করতে পারে। তবুও, GitHub-এর মতো প্ল্যাটফর্মে ওপেন-সোর্স সম্প্রদায় আপনার PDF বিশ্লেষণের চাহিদা মেটাতে অ্যাক্সেসযোগ্য এবং কাস্টমাইজযোগ্য মডেলের সম্পদ সরবরাহ করে।
আমরা যখন প্রথম ক্লডের পিডিএফ বিশ্লেষক পরীক্ষা করেছিলাম তখন আমি সত্যিই উত্তেজিত ছিলাম। প্রাথমিক ফলাফলগুলি দুর্দান্ত লাগছিল। কিন্তু আপনি জানেন কিভাবে এটি AI মডেলের সাথে যায় - তারা নিখুঁত নয়। এখানে এবং সেখানে অবশ্যই কিছু ভুল ছিল। যখন আমি পিডিএফ সম্পর্কে ক্লডের সাথে প্রথম চ্যাট শুরু করি, তখন এটি প্রায়শই বিভ্রান্ত হয়ে যেত। কিন্তু আমি ক্রমাগত মুগ্ধ হয়েছি এটা কতটা ভালো হয়েছে। ভুলগুলো আগের তুলনায় অনেক কমে গেছে।
সময়ের সাথে এই ধরণের উন্নতি দেখতে সত্যিই আশাব্যঞ্জক। আমি বলছি না যে এটি এখনও মানুষের দক্ষতা প্রতিস্থাপন করতে প্রস্তুত; স্পষ্টতই, আপনি জিনিস দুবার চেক করতে চান. আমাদের এখনও যে কোনও সম্ভাব্য সমস্যার জন্য নজর রাখতে হবে। কিন্তু আমি আশাবাদী যে ক্লডের পিডিএফ ক্ষমতা কোথায় যাচ্ছে। এটি একটি অবিশ্বাস্যভাবে দরকারী টুল হতে পারে. অবশ্যই, অনেকগুলি বিকল্প রয়েছে তবে এটি তাদের মধ্যে একটি দুর্দান্ত।