paint-brush
CassIO: জেনারেটিভ AI এর জন্য সেরা লাইব্রেরি, OpenAI দ্বারা অনুপ্রাণিতদ্বারা@datastax
4,452 পড়া
4,452 পড়া

CassIO: জেনারেটিভ AI এর জন্য সেরা লাইব্রেরি, OpenAI দ্বারা অনুপ্রাণিত

দ্বারা DataStax5m2023/06/07
Read on Terminal Reader
Read this story w/o Javascript

অতিদীর্ঘ; পড়তে

Apache Cassandra ব্যবহারকারীদের জন্য একটি আশ্চর্যজনক লাইব্রেরি CassIO-তে ChatGPT-এর সাথে আলোচনা কীভাবে পরিণত হয়েছে তা জানুন।
featured image - CassIO: জেনারেটিভ AI এর জন্য সেরা লাইব্রেরি, OpenAI দ্বারা অনুপ্রাণিত
DataStax HackerNoon profile picture
0-item
1-item
2-item
3-item

আপনি যদি ChatGPT-এর ঘনঘন ব্যবহারকারী হন, তাহলে আপনি জানেন যে এটিকে হ্যালুসিনেশন বলে অভিহিত করার প্রবণতা রয়েছে। পরিসংখ্যানগতভাবে সঠিক শব্দের একটি দুর্দান্ত সংগ্রহ যার বাস্তবে কোন ভিত্তি নেই। কয়েক মাস আগে, বড় ভাষা মডেল (এলএলএম) এবং ল্যাংচেইনের জন্য অ্যাপাচি ক্যাসান্দ্রা ব্যবহার করার বিষয়ে একটি প্রম্পট একটি কৌতূহলী প্রতিক্রিয়ার ফলে। ChatGPT রিপোর্ট করেছে যে এলএলএম তৈরি করার সময় কেবল ক্যাসান্দ্রা একটি ভাল টুল পছন্দ ছিল না, ওপেনএআই একটি এমআইটি-লাইসেন্সপ্রাপ্ত পাইথন লাইব্রেরির সাথে ক্যাসান্দ্রাকে ব্যবহার করেছিল যাকে তারা CassIO বলে।


খরগোশের গর্তে আমরা গিয়েছিলাম, এবং আরও প্রম্পটিংয়ের মাধ্যমে, ChatGPT CassIO কীভাবে ব্যবহার করা হয়েছিল সে সম্পর্কে অনেক বিবরণ বর্ণনা করেছে। এটি এমনকি কিছু নমুনা কোড এবং একটি ওয়েবসাইট অন্তর্ভুক্ত করেছে। পরবর্তী গবেষণায় ChatGPT প্রতিক্রিয়ার বাইরে CassIO-এর কোনো প্রমাণ পাওয়া যায়নি, তবে বীজ বপন করা হয়েছিল। যদি এই লাইব্রেরিটি বিদ্যমান না থাকে, তবে এটির প্রয়োজন ছিল এবং আমরা কিছুক্ষণ পরেই এটিতে কাজ শুরু করেছি।


সর্বকালের সেরা হ্যালুসিনেশন।

আসল ক্যাসিও কি দয়া করে দাঁড়াবে?

এই দুর্দান্ত ধারণাটি কী ছিল যা ChatGPT (এবং, সমিতি দ্বারা, OpenAI) অনুপ্রাণিত করেছিল? একটি দুর্দান্ত পাইথন লাইব্রেরি ডেভেলপারদের কম দিয়ে আরও কিছু করতে সক্ষম করে। DataStax এবং Anant সম্মিলিত শক্তি উন্নয়নশীল ক্যাসিও জেনারেটিভ আর্টিফিশিয়াল ইন্টেলিজেন্স এবং অন্যান্য মেশিন লার্নিং ওয়ার্কলোডের সাথে ক্যাসান্দ্রার একীকরণকে নির্বিঘ্ন করতে। এর প্রধান উদ্দেশ্য হল ক্যাসান্ড্রা ডাটাবেস অ্যাক্সেস করার প্রক্রিয়াকে বিমূর্ত করা, এর অন্তর্ভুক্ত ভেক্টর অনুসন্ধান ক্ষমতা, ব্যবহারের জন্য প্রস্তুত সরঞ্জামগুলির একটি সেট অফার করে যা অতিরিক্ত কোডের প্রয়োজন কমিয়ে দেয়। ফলস্বরূপ, বিকাশকারীরা তাদের AI সিস্টেমগুলি ডিজাইন এবং বাস্তবায়নের উপর ফোকাস করতে পারে, জেনে যে CassIO অন্তর্নিহিত ডাটাবেস জটিলতার যত্ন নিয়েছে। ফলাফল হল সাশ্রয়ী মূল্যের স্কেল এবং কম বিলম্বের জন্য একটি প্রমাণিত ডাটাবেসে অ্যাক্সেস। CassIO এর সারমর্ম হল বাস্তবায়ন প্রক্রিয়া সহজতর করা এবং সহজ করা।



CassIO এর শক্তি নির্দিষ্ট AI কাঠামোর প্রতি তার অজ্ঞেয়বাদের মধ্যে নিহিত। এটি ইন্টারফেসের মতো নির্দিষ্ট বাস্তবায়নের বিবরণের সাথে নিজেকে উদ্বিগ্ন করে না ল্যাংচেইন , লামা ইনডেক্স , মাইক্রোসফ্ট শব্দার্থিক কার্নেল , বা অন্যান্য বিভিন্ন জেনারেটিভ এআই টুলকিট। পরিবর্তে, এটি "পাতলা অ্যাডাপ্টার" এর একটি সেট সরবরাহ করে যা CassIO এর ক্ষমতাগুলি ব্যবহার করার সময় ফ্রেমওয়ার্কের ইন্টারফেসের সাথে সামঞ্জস্যপূর্ণ। এটি CassIO কে আপনার AI অ্যাপ্লিকেশন এবং ডাটাবেসের মধ্যে ব্যবধান পূরণ করতে সক্ষম করে, এইভাবে অ্যাপ্লিকেশনটিকে তার বিশদ বিবরণে না জড়িয়ে ক্যাসান্ড্রার শক্তির সুবিধা নিতে সক্ষম করে।

ল্যাংচেইনের সাথে একীকরণ

ল্যাংচেইন LLM-এর সাথে বেশিরভাগ ব্যবস্থাপনার কাজ এবং মিথস্ক্রিয়া স্বয়ংক্রিয় করে। এটি মেমরি, ভেক্টর-ভিত্তিক সাদৃশ্য অনুসন্ধান, উন্নত প্রম্পট টেমপ্লেটিং বিমূর্ততা এবং অন্যান্য বৈশিষ্ট্যের জন্য সমর্থন প্রদান করে। CassIO LangChain-এর সাথে নির্বিঘ্নে সংহত করে, ক্যাসান্ড্রা-নির্দিষ্ট সরঞ্জামগুলিকে প্রসারিত করে কাজগুলিকে স্ট্রীমলাইন করার জন্য যেমন:

  • LLM-এর জন্য একটি মেমরি মডিউল যা স্টোরেজের জন্য ক্যাসান্দ্রা ব্যবহার করে, যা একটি চ্যাট ইন্টারঅ্যাকশনে সাম্প্রতিক এক্সচেঞ্জগুলি মনে রাখতে পারে, বা এমনকি পুরো অতীত কথোপকথনের সারাংশও রাখতে পারে।

  • ক্যাসান্ড্রাতে এলএলএম প্রতিক্রিয়াগুলি ক্যাশ করার একটি বৈশিষ্ট্য, যার ফলে যেখানে সম্ভব লেটেন্সি এবং টোকেনগুলি সংরক্ষণ করা হয়৷ ক্যাসান্দ্রা থেকে একটি প্রম্পটে বা একটি দীর্ঘ এলএলএম কথোপকথনের মধ্যে স্বয়ংক্রিয়ভাবে ডেটা ইনজেকশন৷

  • ভবিষ্যতে সরবরাহের জন্য কিছু ইনপুট অনির্দিষ্ট রেখে প্রম্পটগুলির "আংশিককরণ" এর জন্য সমর্থন।

  • একটি থেকে তথ্য স্বয়ংক্রিয় ইনজেকশন পরব বৈশিষ্ট্য দোকান (সম্ভাব্যভাবে ক্যাসান্দ্রা দ্বারা সমর্থিত ) একটি প্রম্পটে।


এই উপাদানগুলি প্রম্পটে ডেটা অন্তর্ভুক্ত করার প্রক্রিয়াটিকে প্রবাহিত করতে এবং এলএলএম এবং ডাটাবেসের মধ্যে মসৃণ মিথস্ক্রিয়া নিশ্চিত করতে একসাথে কাজ করে।

ভেক্টর অনুসন্ধানের সাথে ইন্টিগ্রেশন

এর অন্তর্ভুক্তি ভেক্টর অনুসন্ধান Cassandra এবং DataStax Astra DB-এর ক্ষমতা সম্প্রতি ( এখানে খবর সম্পর্কে পড়ুন) লেনদেন সংক্রান্ত ডেটার জন্য ইতিমধ্যেই একটি জনপ্রিয় ডাটাবেসের মধ্যে একটি মূল বৈশিষ্ট্যকে একীভূত করেছে। উচ্চ স্কেলের জন্য ক্যাসান্দ্রার খ্যাতির অর্থ হল যে আপনার কাছে ব্যয়বহুল ক্রিয়াকলাপগুলিতে ডেটা না সরিয়ে ডেটা সঞ্চয় এবং প্রক্রিয়া করার জন্য একটি একক জায়গা রয়েছে৷ ভেক্টর অনুসন্ধানের সংযোজন CassIO-তে উপলব্ধ করা "শব্দগতভাবে সচেতন" টুলিংয়ের একটি স্যুটের দরজা খুলে দিয়েছে, যেমন:

  • LLM প্রতিক্রিয়াগুলির একটি ক্যাশে যা একটি প্রশ্নের সঠিক বাক্যাংশের উপর নির্ভরশীল নয়।
  • একটি "অর্থসূচক সূচক" যা একটি জ্ঞানের ভিত্তি সঞ্চয় করতে পারে এবং একটি প্রদত্ত প্রশ্নের সর্বোত্তম উত্তর তৈরি করতে প্রাসঙ্গিক অংশগুলি পুনরুদ্ধার করতে পারে। এই টুলটি অনেক নির্দিষ্ট প্রয়োজন অনুসারে মানিয়ে নেওয়া যেতে পারে এবং উত্তরে প্রবাহিত প্রকৃত তথ্যকে সর্বাধিক করার জন্য বিভিন্ন তথ্য পুনরুদ্ধার করার জন্য কনফিগার করা যেতে পারে।
  • LLM চ্যাট ইন্টারঅ্যাকশনের জন্য একটি "অর্থবোধক মেমরি" উপাদান, যা প্রাসঙ্গিক অতীত এক্সচেঞ্জ পুনরুদ্ধার করতে পারে এমনকি যদি তারা দূর অতীতে ঘটে থাকে।


CassIO এবং LangChain-এর সংমিশ্রণ LLM ব্যবস্থাপনার ক্রমবর্ধমান চাহিদা মেটাতে সময়ের সাথে সাথে এই ক্ষমতাগুলিকে প্রসারিত ও পরিমার্জিত করে চলেছে। LLMs থেকে আরও সঠিক প্রতিক্রিয়া পেতে বর্তমান অত্যাধুনিক প্রম্পটগুলি চেইন করা হচ্ছে৷ সাম্প্রতিক একটি গবেষণাপত্রে বলা হয় একটি কৌশল বর্ণনা গাছ-অফ-থট , ভেক্টর অনুসন্ধানের ভূমিকা এক প্রম্পট থেকে পরবর্তীতে অধ্যবসায়ের ক্ষেত্রে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। এই ধারনাগুলো একাডেমিয়া থেকে উৎপাদনে যাওয়ার কারণে, ক্যাসান্দ্রা বাস্তবায়নের একটি গুরুত্বপূর্ণ অংশ হিসেবে কাজ করবে।

পরবর্তী প্রম্পট: CassIO এর জন্য কি এগিয়ে আছে

একটি বিকশিত সরঞ্জাম হিসাবে, CassIO দ্রুত বৃদ্ধি পাচ্ছে, নতুন উন্নয়ন এবং আপডেটগুলি ঘন ঘন যোগ করা হচ্ছে। লেখার সময়, CassIO ল্যাংচেইনকে সমর্থন করে, সাথে LlamaIndex শীঘ্রই আসছে। এই প্রকল্পের দীর্ঘমেয়াদী লক্ষ্য হল স্বায়ত্তশাসিত AI এজেন্টগুলির জন্য উচ্চ-স্কেল মেমরিকে সমর্থন করা যেমন জার্ভিস প্রকল্প এলএলএম সহ এজেন্ট একটি উত্তেজনাপূর্ণ বিকাশ যা জটিল কার্য পরিচালনা সহ অনেক শিল্পের উপর অবিশ্বাস্য প্রভাব ফেলবে। এই এজেন্টদের ডেটা এবং মিথস্ক্রিয়াগুলির অনেক দিক ট্র্যাক রাখতে হবে এবং ক্যাসান্ড্রা হল কাজের জন্য সঠিক ডাটাবেস। নির্ভরযোগ্য এবং কর্মক্ষম।


একটি আসন্ন বুট ক্যাম্প, " নোকোড, ডেটা এবং এআই: ক্যাসান্দ্রার সাথে এলএলএম বুটক্যাম্প ,” ডেভেলপারদের একটি চ্যাট বট তৈরি করতে লাইব্রেরির সাথে হাত মিলিয়ে কাজ করার সুযোগ দেবে। আপনার কাছাকাছি একটি শহরে আসছে এই ধরনের আরও কার্যকলাপের জন্য দেখুন! আমরা ব্যবহারকারীদের অন্বেষণ করতে উত্সাহিত করি ক্যাসিও প্রতি ফাইল সমস্যা , অংশগ্রহণ করা ফোরাম এবং আমাদের এই দ্রুত বাস্তবায়িত হ্যালুসিনেশন উন্নত করতে সাহায্য করুন।


কে জানে এই মুহূর্তে ইতিহাস কীভাবে বিচার করবে? এটা কি OpenAI থেকে অভ্যন্তরীণ তথ্য ফাঁস ছিল? অথবা, একটু বেশি অন্ধকারে চিন্তা করে, এটি কি এআই-এর প্রথম পদক্ষেপ যা মানুষকে তার বিডিং করতে দেয়? যেভাবেই হোক, জেনারেটিভ এআই-এর জগতে প্রবেশ করার সময় ডেভেলপারদের কাছে এখন ক্যাসান্দ্রার কাছাকাছি-অসীম স্কেলে ট্যাপ করার জন্য একটি সহজ-ব্যবহারযোগ্য লাইব্রেরি রয়েছে।


ChatGPT আমাদের একটি উপহার দিয়েছে, তাহলে আপনি এটি দিয়ে কী তৈরি করতে যাচ্ছেন? আমি একটি আসন্ন ওয়েবিনারে ভেক্টর অনুসন্ধানে ডুব দিতে যাচ্ছি (রেজিস্টার এখানে !), এবং আপনি যদি আজই কাজ শুরু করতে চান, ডেটাস্ট্যাক্স অ্যাস্ট্রা কিছু দুর্দান্ত টিউটোরিয়াল আছে।



প্যাট্রিক ম্যাকফ্যাডিন, ডেটাস্ট্যাক্স দ্বারা

প্যাট্রিক ম্যাকফ্যাডিন হলেন ও'রিলি বইয়ের সহ-লেখক 'ম্যানেজিং ক্লাউড নেটিভ ডেটা অন কুবারনেটস।' তিনি বর্তমানে DataStax-এ ডেভেলপার সম্পর্ক এবং Apache Cassandra প্রকল্পে অবদানকারী হিসেবে কাজ করেন। প্যাট্রিক Apache Cassandra-এর জন্য প্রধান প্রচারক হিসেবে কাজ করেছেন (তিনি একজন সদ্য মিন্টেড ক্যাসান্দ্রা কমিটরও!) এবং DataStax-এর পরামর্শদাতা হিসেবে কাজ করেছেন, যেখানে তিনি উৎপাদনে সবচেয়ে বড় কিছু স্থাপনা তৈরি করতে দারুণ সময় কাটিয়েছেন।