আপনি যদি ChatGPT-এর ঘনঘন ব্যবহারকারী হন, তাহলে আপনি জানেন যে এটিকে হ্যালুসিনেশন বলে অভিহিত করার প্রবণতা রয়েছে। পরিসংখ্যানগতভাবে সঠিক শব্দের একটি দুর্দান্ত সংগ্রহ যার বাস্তবে কোন ভিত্তি নেই। কয়েক মাস আগে, বড় ভাষা মডেল (এলএলএম) এবং ল্যাংচেইনের জন্য অ্যাপাচি ক্যাসান্দ্রা ব্যবহার করার বিষয়ে একটি প্রম্পট একটি কৌতূহলী প্রতিক্রিয়ার ফলে। ChatGPT রিপোর্ট করেছে যে এলএলএম তৈরি করার সময় কেবল ক্যাসান্দ্রা একটি ভাল টুল পছন্দ ছিল না, ওপেনএআই একটি এমআইটি-লাইসেন্সপ্রাপ্ত পাইথন লাইব্রেরির সাথে ক্যাসান্দ্রাকে ব্যবহার করেছিল যাকে তারা CassIO বলে।
খরগোশের গর্তে আমরা গিয়েছিলাম, এবং আরও প্রম্পটিংয়ের মাধ্যমে, ChatGPT CassIO কীভাবে ব্যবহার করা হয়েছিল সে সম্পর্কে অনেক বিবরণ বর্ণনা করেছে। এটি এমনকি কিছু নমুনা কোড এবং একটি ওয়েবসাইট অন্তর্ভুক্ত করেছে। পরবর্তী গবেষণায় ChatGPT প্রতিক্রিয়ার বাইরে CassIO-এর কোনো প্রমাণ পাওয়া যায়নি, তবে বীজ বপন করা হয়েছিল। যদি এই লাইব্রেরিটি বিদ্যমান না থাকে, তবে এটির প্রয়োজন ছিল এবং আমরা কিছুক্ষণ পরেই এটিতে কাজ শুরু করেছি।
সর্বকালের সেরা হ্যালুসিনেশন।
এই দুর্দান্ত ধারণাটি কী ছিল যা ChatGPT (এবং, সমিতি দ্বারা, OpenAI) অনুপ্রাণিত করেছিল? একটি দুর্দান্ত পাইথন লাইব্রেরি ডেভেলপারদের কম দিয়ে আরও কিছু করতে সক্ষম করে। DataStax এবং Anant সম্মিলিত শক্তি উন্নয়নশীল
CassIO এর শক্তি নির্দিষ্ট AI কাঠামোর প্রতি তার অজ্ঞেয়বাদের মধ্যে নিহিত। এটি ইন্টারফেসের মতো নির্দিষ্ট বাস্তবায়নের বিবরণের সাথে নিজেকে উদ্বিগ্ন করে না
LLM-এর জন্য একটি মেমরি মডিউল যা স্টোরেজের জন্য ক্যাসান্দ্রা ব্যবহার করে, যা একটি চ্যাট ইন্টারঅ্যাকশনে সাম্প্রতিক এক্সচেঞ্জগুলি মনে রাখতে পারে, বা এমনকি পুরো অতীত কথোপকথনের সারাংশও রাখতে পারে।
ক্যাসান্ড্রাতে এলএলএম প্রতিক্রিয়াগুলি ক্যাশ করার একটি বৈশিষ্ট্য, যার ফলে যেখানে সম্ভব লেটেন্সি এবং টোকেনগুলি সংরক্ষণ করা হয়৷ ক্যাসান্দ্রা থেকে একটি প্রম্পটে বা একটি দীর্ঘ এলএলএম কথোপকথনের মধ্যে স্বয়ংক্রিয়ভাবে ডেটা ইনজেকশন৷
ভবিষ্যতে সরবরাহের জন্য কিছু ইনপুট অনির্দিষ্ট রেখে প্রম্পটগুলির "আংশিককরণ" এর জন্য সমর্থন।
একটি থেকে তথ্য স্বয়ংক্রিয় ইনজেকশন
এই উপাদানগুলি প্রম্পটে ডেটা অন্তর্ভুক্ত করার প্রক্রিয়াটিকে প্রবাহিত করতে এবং এলএলএম এবং ডাটাবেসের মধ্যে মসৃণ মিথস্ক্রিয়া নিশ্চিত করতে একসাথে কাজ করে।
এর অন্তর্ভুক্তি
CassIO এবং LangChain-এর সংমিশ্রণ LLM ব্যবস্থাপনার ক্রমবর্ধমান চাহিদা মেটাতে সময়ের সাথে সাথে এই ক্ষমতাগুলিকে প্রসারিত ও পরিমার্জিত করে চলেছে। LLMs থেকে আরও সঠিক প্রতিক্রিয়া পেতে বর্তমান অত্যাধুনিক প্রম্পটগুলি চেইন করা হচ্ছে৷ সাম্প্রতিক একটি গবেষণাপত্রে বলা হয় একটি কৌশল বর্ণনা
একটি বিকশিত সরঞ্জাম হিসাবে, CassIO দ্রুত বৃদ্ধি পাচ্ছে, নতুন উন্নয়ন এবং আপডেটগুলি ঘন ঘন যোগ করা হচ্ছে। লেখার সময়, CassIO ল্যাংচেইনকে সমর্থন করে, সাথে LlamaIndex শীঘ্রই আসছে। এই প্রকল্পের দীর্ঘমেয়াদী লক্ষ্য হল স্বায়ত্তশাসিত AI এজেন্টগুলির জন্য উচ্চ-স্কেল মেমরিকে সমর্থন করা যেমন
একটি আসন্ন বুট ক্যাম্প, "
কে জানে এই মুহূর্তে ইতিহাস কীভাবে বিচার করবে? এটা কি OpenAI থেকে অভ্যন্তরীণ তথ্য ফাঁস ছিল? অথবা, একটু বেশি অন্ধকারে চিন্তা করে, এটি কি এআই-এর প্রথম পদক্ষেপ যা মানুষকে তার বিডিং করতে দেয়? যেভাবেই হোক, জেনারেটিভ এআই-এর জগতে প্রবেশ করার সময় ডেভেলপারদের কাছে এখন ক্যাসান্দ্রার কাছাকাছি-অসীম স্কেলে ট্যাপ করার জন্য একটি সহজ-ব্যবহারযোগ্য লাইব্রেরি রয়েছে।
ChatGPT আমাদের একটি উপহার দিয়েছে, তাহলে আপনি এটি দিয়ে কী তৈরি করতে যাচ্ছেন? আমি একটি আসন্ন ওয়েবিনারে ভেক্টর অনুসন্ধানে ডুব দিতে যাচ্ছি (রেজিস্টার
প্যাট্রিক ম্যাকফ্যাডিন, ডেটাস্ট্যাক্স দ্বারা
প্যাট্রিক ম্যাকফ্যাডিন হলেন ও'রিলি বইয়ের সহ-লেখক 'ম্যানেজিং ক্লাউড নেটিভ ডেটা অন কুবারনেটস।' তিনি বর্তমানে DataStax-এ ডেভেলপার সম্পর্ক এবং Apache Cassandra প্রকল্পে অবদানকারী হিসেবে কাজ করেন। প্যাট্রিক Apache Cassandra-এর জন্য প্রধান প্রচারক হিসেবে কাজ করেছেন (তিনি একজন সদ্য মিন্টেড ক্যাসান্দ্রা কমিটরও!) এবং DataStax-এর পরামর্শদাতা হিসেবে কাজ করেছেন, যেখানে তিনি উৎপাদনে সবচেয়ে বড় কিছু স্থাপনা তৈরি করতে দারুণ সময় কাটিয়েছেন।