বৃহৎ ভাষার মডেল আজ অত্যন্ত শক্তিশালী হয়ে উঠেছে; তারা আমাদের কিছু কঠিন প্রশ্নের উত্তর দিতে সাহায্য করতে পারে। কিন্তু তারা আমাদের বিপথে নিয়ে যেতে পারে: তারা হ্যালুসিনেট করার প্রবণতা রাখে, যার মানে তারা এমন উত্তর দেয় যা সঠিক বলে মনে হয়, কিন্তু নয়।
এখানে, আমরা LLM-গুলিকে হ্যালুসিনেটিং থেকে থামাতে তিনটি পদ্ধতি দেখব: পুনরুদ্ধার-অগমেন্টেড জেনারেশন (RAG), যুক্তি এবং পুনরাবৃত্তিমূলক প্রশ্ন।
সঙ্গে
প্রাসঙ্গিক নথিগুলি পুনরুদ্ধার করা হয়ে গেলে, এই নথিগুলির সাথে কোয়েরিটি এলএলএম ব্যবহারকারীর জন্য একটি প্রতিক্রিয়া সংক্ষিপ্ত করতে ব্যবহার করে। এইভাবে, মডেলটিকে শুধুমাত্র তার অভ্যন্তরীণ জ্ঞানের উপর নির্ভর করতে হবে না তবে আপনি সঠিক সময়ে যে ডেটা প্রদান করেন তা অ্যাক্সেস করতে পারে। এক অর্থে, এটি এলএলএমকে "দীর্ঘমেয়াদী মেমরি" প্রদান করে যা এটির নিজস্ব থাকে না। ভেক্টর ডাটাবেসে সঞ্চিত মালিকানা তথ্য অন্তর্ভুক্ত করে মডেলটি আরও সঠিক এবং প্রাসঙ্গিকভাবে উপযুক্ত প্রতিক্রিয়া প্রদান করতে পারে।
একটি বিকল্প RAG পদ্ধতিতে ফ্যাক্ট চেকিং অন্তর্ভুক্ত করা হয়। LLM-কে একটি উত্তরের জন্য অনুরোধ করা হয়, যা তারপর ভেক্টর ডাটাবেসের ডেটার বিরুদ্ধে সত্যতা যাচাই এবং পর্যালোচনা করা হয়। প্রশ্নের একটি উত্তর ভেক্টর ডাটাবেস থেকে উত্পাদিত হয়, এবং তারপরে এলএলএম সেই উত্তরটিকে একটি সত্যের সাথে সম্পর্কিত কিনা তা বোঝার জন্য একটি প্রম্পট হিসাবে ব্যবহার করে।
এলএলএম অনেক কিছুতে খুব ভালো। তারা একটি বাক্যে পরবর্তী শব্দের ভবিষ্যদ্বাণী করতে পারে, "ট্রান্সফরমারগুলির" অগ্রগতির জন্য ধন্যবাদ, যা ইনপুট ডেটার বিভিন্ন অংশে বিভিন্ন মাত্রায় মনোযোগ দিয়ে মেশিনগুলি কীভাবে মানুষের ভাষা বোঝে তা রূপান্তরিত করে। LLMগুলি একটি খুব সংক্ষিপ্ত উত্তরে প্রচুর তথ্য ফুটিয়ে তুলতে এবং প্রচুর পরিমাণে পাঠ্য থেকে আপনি যা খুঁজছেন তা খুঁজে বের করতে এবং বের করতেও ভাল। আশ্চর্যজনকভাবে, এলএলএমএসও পরিকল্পনা করতে পারে – তারা আক্ষরিক অর্থে ডেটা সংগ্রহ করতে পারে এবং আপনার জন্য একটি ভ্রমণের পরিকল্পনা করতে পারে।
এবং হয়ত আরও আশ্চর্যজনকভাবে, এলএলএমগুলি প্রায় মানুষের মতো ফ্যাশনে একটি উত্তর তৈরি করতে যুক্তি ব্যবহার করতে পারে। যেহেতু লোকেরা যুক্তি করতে পারে, তাদের একটি ভবিষ্যদ্বাণী বা সিদ্ধান্ত নেওয়ার জন্য প্রচুর ডেটার প্রয়োজন নেই। যুক্তিও এলএলএম-কে হ্যালুসিনেশন এড়াতে সাহায্য করে। এর একটি উদাহরণ হল "
এই পদ্ধতি মডেলগুলিকে বহু-পদক্ষেপের সমস্যাগুলিকে মধ্যবর্তী ধাপে ভাঙতে সাহায্য করে। চেইন-অফ-থট প্রম্পটিংয়ের মাধ্যমে, এলএলএম জটিল যুক্তির সমস্যাগুলি সমাধান করতে পারে যা স্ট্যান্ডার্ড প্রম্পট পদ্ধতিগুলি করতে পারে না (গভীরভাবে দেখার জন্য, ব্লগ পোস্টটি দেখুন
আপনি যদি একটি LLM একটি জটিল গণিত সমস্যা দেন, এটি ভুল হতে পারে। কিন্তু আপনি যদি LLM-কে সমস্যার পাশাপাশি সমাধানের পদ্ধতি প্রদান করেন, তাহলে এটি একটি সঠিক উত্তর তৈরি করতে পারে – এবং উত্তরের পিছনের কারণটি শেয়ার করতে পারে। একটি ভেক্টর ডাটাবেস এই পদ্ধতির একটি মূল অংশ, কারণ এটি এর অনুরূপ প্রশ্নের উদাহরণ প্রদান করে এবং উদাহরণের সাথে প্রম্পটটি পূরণ করে।
আরও ভাল, একবার আপনার কাছে প্রশ্ন এবং উত্তর হয়ে গেলে, আপনি আপনার জেনারেটিভ এআই অ্যাপ্লিকেশনগুলির নির্ভুলতা এবং উপযোগিতা আরও উন্নত করতে ভেক্টর ডাটাবেসে এটিকে আবার সংরক্ষণ করতে পারেন।
অন্যান্য যুক্তিযুক্ত অগ্রগতির একটি হোস্ট রয়েছে যা আপনি শিখতে পারেন, সহ
এলএলএম হ্যালুসিনেশন কমাতে সাহায্য করার তৃতীয় পদ্ধতি হল ইন্টারেক্টিভ কোয়েরি। এই ক্ষেত্রে, একজন এআই এজেন্ট কলগুলিকে মধ্যস্থতা করে যা একটি এলএলএম এবং একটি ভেক্টর ডাটাবেসের মধ্যে পিছনে চলে যায়। সর্বোত্তম উত্তরে পৌঁছানোর জন্য এটি পুনরাবৃত্তিমূলকভাবে একাধিকবার ঘটতে পারে। এই দূরদর্শী সক্রিয় পুনরুদ্ধার প্রজন্মের একটি উদাহরণ, যা FLARE নামেও পরিচিত।
আপনি একটি প্রশ্ন নিন, আরও অনুরূপ প্রশ্নের জন্য আপনার জ্ঞানের ভিত্তি অনুসন্ধান করুন। আপনি অনুরূপ প্রশ্নের একটি সিরিজ পেতে চাই. তারপর আপনি সমস্ত প্রশ্নের সাথে ভেক্টর ডাটাবেসটি জিজ্ঞাসা করুন, উত্তরটি সংক্ষিপ্ত করুন এবং উত্তরটি ভাল এবং যুক্তিসঙ্গত দেখাচ্ছে কিনা তা পরীক্ষা করুন। যদি এটি না হয়, এটি না হওয়া পর্যন্ত পদক্ষেপগুলি পুনরাবৃত্তি করুন।
অন্যান্য উন্নত ইন্টারেক্টিভ ক্যোয়ারী পদ্ধতি অন্তর্ভুক্ত
এজেন্ট অর্কেস্ট্রেশনে আপনাকে সাহায্য করতে পারে এমন অনেক টুল রয়েছে।
এরকম আরেকটি টুল হল
"কতজন বাসিন্দা বর্তমানে মেডিকেয়ারে আছেন?" এর মতো প্রম্পটের AI-উত্পাদিত উত্তর দেওয়ার জন্য সংস্থাটি বিভিন্ন ধরণের ডেটা থেকে টেনে নেয় যা কাঠামোগত এবং অসংগঠিত উভয়ই। স্কাইপয়েন্টের সিইও টিসন ম্যাথিউ সম্প্রতি আমাকে বলেছেন। এটি যত্ন প্রদানকারীদের সঠিক তথ্যের ভিত্তিতে দ্রুত জ্ঞাত সিদ্ধান্ত নিতে সাহায্য করে, তিনি বলেন।
সেই বিন্দুতে পৌঁছানো অবশ্য একটি প্রক্রিয়া ছিল, ম্যাথিউ বলেছিলেন। তার দল একটি স্ট্যান্ডার্ড এলএলএম নিয়ে শুরু করে এবং স্কাইপয়েন্ট ডেটা দিয়ে এটিকে সূক্ষ্ম-টিউন করে। "এটি বিপর্যয়কর ফলাফল নিয়ে এসেছে - এলোমেলো শব্দ, এমনকি," তিনি বলেছিলেন। প্রম্পটগুলি বোঝা এবং তৈরি করা স্কাইপয়েন্ট পরিচালনা করতে পারে এমন কিছু ছিল, তবে স্কেলে সঠিক উত্তর তৈরি করার জন্য এটির একটি AI প্রযুক্তি স্ট্যাকের প্রয়োজন।
SkyPoint একটি সিস্টেম তৈরি করেছে যা অপারেটর এবং প্রদানকারীদের থেকে স্ট্রাকচার্ড ডেটা গ্রহণ করে, যেমন ইলেকট্রনিক স্বাস্থ্যসেবা রেকর্ড এবং বেতনের ডেটা সহ। এটি একটি কলামার ডাটাবেসে সংরক্ষণ করা হয়; এটি অনুসন্ধান করতে RAG ব্যবহার করা হয়। অসংগঠিত তথ্য, যেমন নীতি এবং পদ্ধতি এবং রাষ্ট্রীয় প্রবিধান, একটি ভেক্টর ডাটাবেসে সংরক্ষণ করা হয়:
টিসন একটি উদাহরণ হিসাবে একটি প্রশ্ন উত্থাপন করেছেন: যদি একজন বাসিন্দা অপমানজনক হয়ে ওঠে? অ্যাস্ট্রা ডিবি একটি উত্তর প্রদান করে যা রাষ্ট্রীয় প্রবিধান এবং ব্যবহারকারীর প্রসঙ্গ এবং বিভিন্ন নথির উপর ভিত্তি করে একত্রিত হয় এবং
"এগুলি নির্দিষ্ট উত্তর যা সঠিক হতে হবে," টিসন বলেছিলেন। "এটি এমন তথ্য যা একটি সংস্থা তাদের সম্প্রদায় এবং তাদের ব্যবসার জন্য জ্ঞাত সিদ্ধান্ত নিতে নির্ভর করে।"
স্কাইপয়েন্ট এআই এআই হ্যালুসিনেশনের ঝুঁকি কমানোর গুরুত্ব তুলে ধরে; সঠিক উত্তর নিশ্চিত করার জন্য উপলব্ধ পদ্ধতি এবং সরঞ্জাম ছাড়া ফলাফল সম্ভাব্য ভয়ানক হতে পারে।
RAG, যুক্তি, এবং পুনরাবৃত্ত অনুসন্ধান পদ্ধতি যেমন FLARE, জেনারেটিভ এআই - বিশেষ করে যখন মালিকানা ডেটা দ্বারা ইন্ধন দেওয়া হয় - একটি ক্রমবর্ধমান শক্তিশালী হাতিয়ার হয়ে উঠছে যা এন্টারপ্রাইজগুলিকে তাদের গ্রাহকদের দক্ষতার সাথে এবং কার্যকরভাবে পরিবেশন করতে সহায়তা করে৷
অ্যালান হো, ডেটাস্ট্যাক্স দ্বারা
কিভাবে DataStax আপনাকে সাহায্য করে সে সম্পর্কে আরও জানুন
এছাড়াও এখানে প্রকাশিত.