paint-brush
এআই হ্যালুসিনেশন কি বন্ধ করা যায়? এটি করার 3 টি উপায়ের দিকে নজর দিনদ্বারা@datastax
3,083 পড়া
3,083 পড়া

এআই হ্যালুসিনেশন কি বন্ধ করা যায়? এটি করার 3 টি উপায়ের দিকে নজর দিন

দ্বারা DataStax6m2023/10/19
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

এলএলএমগুলিকে হ্যালুসিনেটিং থেকে থামাতে তিনটি পদ্ধতির একটি পরীক্ষা: পুনরুদ্ধার-বর্ধিত প্রজন্ম (আরএজি), যুক্তি এবং পুনরাবৃত্তিমূলক প্রশ্ন।
featured image - এআই হ্যালুসিনেশন কি বন্ধ করা যায়? এটি করার 3 টি উপায়ের দিকে নজর দিন
DataStax HackerNoon profile picture


বৃহৎ ভাষার মডেল আজ অত্যন্ত শক্তিশালী হয়ে উঠেছে; তারা আমাদের কিছু কঠিন প্রশ্নের উত্তর দিতে সাহায্য করতে পারে। কিন্তু তারা আমাদের বিপথে নিয়ে যেতে পারে: তারা হ্যালুসিনেট করার প্রবণতা রাখে, যার মানে তারা এমন উত্তর দেয় যা সঠিক বলে মনে হয়, কিন্তু নয়।


এলএলএম যখন তারা তাদের প্রশিক্ষণ ডেটা সেটের অংশ নয় এমন প্রশ্নের সম্মুখীন হয় - অথবা যখন তাদের প্রশিক্ষণ ডেটা সেটে ভুল তথ্য থাকে (এটি ঘটতে পারে যখন LLM দের ইন্টারনেট ডেটাতে প্রশিক্ষণ দেওয়া হয়, যা আমরা সবাই জানি, সবসময় বিশ্বাস করা যায় না ) এলএলএম-এরও মেমরি নেই। অবশেষে, "ফাইন-টিউনিং" কে প্রায়শই নতুন ডেটাতে একটি মডেলকে পুনরায় প্রশিক্ষণ দিয়ে হ্যালুসিনেশন কমানোর একটি উপায় হিসাবে বিবেচনা করা হয় — তবে এর ত্রুটি রয়েছে।


এখানে, আমরা LLM-গুলিকে হ্যালুসিনেটিং থেকে থামাতে তিনটি পদ্ধতি দেখব: পুনরুদ্ধার-অগমেন্টেড জেনারেশন (RAG), যুক্তি এবং পুনরাবৃত্তিমূলক প্রশ্ন।

পুনরুদ্ধার-বর্ধিত প্রজন্ম

সঙ্গে RAG , একটি প্রশ্ন জ্ঞানের ভিত্তির মধ্যে আসে (যা, এই ক্ষেত্রে, a ভেক্টর ডাটাবেস ) একটি শব্দার্থিক ভেক্টর হিসাবে – সংখ্যার একটি স্ট্রিং। মডেল তারপর ব্যবহার করে ডাটাবেস থেকে অনুরূপ নথি উদ্ধার করে ভেক্টর অনুসন্ধান , নথি খুঁজছেন যার ভেক্টর কোয়েরির ভেক্টরের কাছাকাছি।


প্রাসঙ্গিক নথিগুলি পুনরুদ্ধার করা হয়ে গেলে, এই নথিগুলির সাথে কোয়েরিটি এলএলএম ব্যবহারকারীর জন্য একটি প্রতিক্রিয়া সংক্ষিপ্ত করতে ব্যবহার করে। এইভাবে, মডেলটিকে শুধুমাত্র তার অভ্যন্তরীণ জ্ঞানের উপর নির্ভর করতে হবে না তবে আপনি সঠিক সময়ে যে ডেটা প্রদান করেন তা অ্যাক্সেস করতে পারে। এক অর্থে, এটি এলএলএমকে "দীর্ঘমেয়াদী মেমরি" প্রদান করে যা এটির নিজস্ব থাকে না। ভেক্টর ডাটাবেসে সঞ্চিত মালিকানা তথ্য অন্তর্ভুক্ত করে মডেলটি আরও সঠিক এবং প্রাসঙ্গিকভাবে উপযুক্ত প্রতিক্রিয়া প্রদান করতে পারে।


নলেজ কোয়েরি জেনারেশন


একটি বিকল্প RAG পদ্ধতিতে ফ্যাক্ট চেকিং অন্তর্ভুক্ত করা হয়। LLM-কে একটি উত্তরের জন্য অনুরোধ করা হয়, যা তারপর ভেক্টর ডাটাবেসের ডেটার বিরুদ্ধে সত্যতা যাচাই এবং পর্যালোচনা করা হয়। প্রশ্নের একটি উত্তর ভেক্টর ডাটাবেস থেকে উত্পাদিত হয়, এবং তারপরে এলএলএম সেই উত্তরটিকে একটি সত্যের সাথে সম্পর্কিত কিনা তা বোঝার জন্য একটি প্রম্পট হিসাবে ব্যবহার করে।


ফ্যাক্ট চেকিং অন্তর্ভুক্ত করা

যুক্তি

এলএলএম অনেক কিছুতে খুব ভালো। তারা একটি বাক্যে পরবর্তী শব্দের ভবিষ্যদ্বাণী করতে পারে, "ট্রান্সফরমারগুলির" অগ্রগতির জন্য ধন্যবাদ, যা ইনপুট ডেটার বিভিন্ন অংশে বিভিন্ন মাত্রায় মনোযোগ দিয়ে মেশিনগুলি কীভাবে মানুষের ভাষা বোঝে তা রূপান্তরিত করে। LLMগুলি একটি খুব সংক্ষিপ্ত উত্তরে প্রচুর তথ্য ফুটিয়ে তুলতে এবং প্রচুর পরিমাণে পাঠ্য থেকে আপনি যা খুঁজছেন তা খুঁজে বের করতে এবং বের করতেও ভাল। আশ্চর্যজনকভাবে, এলএলএমএসও পরিকল্পনা করতে পারে – তারা আক্ষরিক অর্থে ডেটা সংগ্রহ করতে পারে এবং আপনার জন্য একটি ভ্রমণের পরিকল্পনা করতে পারে।


এবং হয়ত আরও আশ্চর্যজনকভাবে, এলএলএমগুলি প্রায় মানুষের মতো ফ্যাশনে একটি উত্তর তৈরি করতে যুক্তি ব্যবহার করতে পারে। যেহেতু লোকেরা যুক্তি করতে পারে, তাদের একটি ভবিষ্যদ্বাণী বা সিদ্ধান্ত নেওয়ার জন্য প্রচুর ডেটার প্রয়োজন নেই। যুক্তিও এলএলএম-কে হ্যালুসিনেশন এড়াতে সাহায্য করে। এর একটি উদাহরণ হল " চেইন-অফ-থট প্রম্পটিং "


এই পদ্ধতি মডেলগুলিকে বহু-পদক্ষেপের সমস্যাগুলিকে মধ্যবর্তী ধাপে ভাঙতে সাহায্য করে। চেইন-অফ-থট প্রম্পটিংয়ের মাধ্যমে, এলএলএম জটিল যুক্তির সমস্যাগুলি সমাধান করতে পারে যা স্ট্যান্ডার্ড প্রম্পট পদ্ধতিগুলি করতে পারে না (গভীরভাবে দেখার জন্য, ব্লগ পোস্টটি দেখুন ভাষা মডেল চিন্তা চেইন মাধ্যমে যুক্তি সঞ্চালন গুগল থেকে)।


আপনি যদি একটি LLM একটি জটিল গণিত সমস্যা দেন, এটি ভুল হতে পারে। কিন্তু আপনি যদি LLM-কে সমস্যার পাশাপাশি সমাধানের পদ্ধতি প্রদান করেন, তাহলে এটি একটি সঠিক উত্তর তৈরি করতে পারে – এবং উত্তরের পিছনের কারণটি শেয়ার করতে পারে। একটি ভেক্টর ডাটাবেস এই পদ্ধতির একটি মূল অংশ, কারণ এটি এর অনুরূপ প্রশ্নের উদাহরণ প্রদান করে এবং উদাহরণের সাথে প্রম্পটটি পূরণ করে।


আরও ভাল, একবার আপনার কাছে প্রশ্ন এবং উত্তর হয়ে গেলে, আপনি আপনার জেনারেটিভ এআই অ্যাপ্লিকেশনগুলির নির্ভুলতা এবং উপযোগিতা আরও উন্নত করতে ভেক্টর ডাটাবেসে এটিকে আবার সংরক্ষণ করতে পারেন।


ভেক্টর ডাটাবেসে উত্তর সংরক্ষণ করা


অন্যান্য যুক্তিযুক্ত অগ্রগতির একটি হোস্ট রয়েছে যা আপনি শিখতে পারেন, সহ চিন্তার গাছ , অন্তত অধিকাংশের কাছে , স্ব সামঞ্জস্য , এবং নির্দেশ টিউনিং .

পুনরাবৃত্তিমূলক জিজ্ঞাসা

এলএলএম হ্যালুসিনেশন কমাতে সাহায্য করার তৃতীয় পদ্ধতি হল ইন্টারেক্টিভ কোয়েরি। এই ক্ষেত্রে, একজন এআই এজেন্ট কলগুলিকে মধ্যস্থতা করে যা একটি এলএলএম এবং একটি ভেক্টর ডাটাবেসের মধ্যে পিছনে চলে যায়। সর্বোত্তম উত্তরে পৌঁছানোর জন্য এটি পুনরাবৃত্তিমূলকভাবে একাধিকবার ঘটতে পারে। এই দূরদর্শী সক্রিয় পুনরুদ্ধার প্রজন্মের একটি উদাহরণ, যা FLARE নামেও পরিচিত।


আপনি একটি প্রশ্ন নিন, আরও অনুরূপ প্রশ্নের জন্য আপনার জ্ঞানের ভিত্তি অনুসন্ধান করুন। আপনি অনুরূপ প্রশ্নের একটি সিরিজ পেতে চাই. তারপর আপনি সমস্ত প্রশ্নের সাথে ভেক্টর ডাটাবেসটি জিজ্ঞাসা করুন, উত্তরটি সংক্ষিপ্ত করুন এবং উত্তরটি ভাল এবং যুক্তিসঙ্গত দেখাচ্ছে কিনা তা পরীক্ষা করুন। যদি এটি না হয়, এটি না হওয়া পর্যন্ত পদক্ষেপগুলি পুনরাবৃত্তি করুন।


এগিয়ে সক্রিয় পুনরুদ্ধার প্রজন্ম


অন্যান্য উন্নত ইন্টারেক্টিভ ক্যোয়ারী পদ্ধতি অন্তর্ভুক্ত অটোজিপিটি , মাইক্রোসফট জার্ভিস , এবং একক পারফরম্যান্স প্রম্পটিং .


এজেন্ট অর্কেস্ট্রেশনে আপনাকে সাহায্য করতে পারে এমন অনেক টুল রয়েছে। ল্যাংচেইন এটি একটি দুর্দান্ত উদাহরণ যা আপনাকে একটি LLM এবং একটি ভেক্টর ডাটাবেসের মধ্যে কল অর্কেস্ট্রেট করতে সহায়তা করে৷ এটি মূলত LLM-এর সাথে বেশিরভাগ পরিচালনার কাজ এবং মিথস্ক্রিয়াগুলিকে স্বয়ংক্রিয় করে, এবং মেমরি, ভেক্টর-ভিত্তিক সাদৃশ্য অনুসন্ধান, উন্নত প্রম্পট টেমপ্লেটিং বিমূর্ততা এবং অন্যান্য বৈশিষ্ট্যগুলির জন্য সমর্থন প্রদান করে। এটি চেইন-অফ-থট এবং ফ্লেয়ারের মতো উন্নত প্রম্পটিং কৌশলগুলিকে সহায়তা করে এবং সমর্থন করে।


এরকম আরেকটি টুল হল ক্যাসিও , যা DataStax দ্বারা আমাদের Astra DB ভেক্টর ডাটাবেসের উপরে একটি বিমূর্ততা হিসাবে তৈরি করা হয়েছিল, যেখানে ডেটা এবং মেমরিকে প্রথম শ্রেণীর-নাগরিক বানানোর ধারণা ছিল জেনারেটিভ এআই . CassIO হল একটি পাইথন লাইব্রেরি যা ক্যাসান্ড্রাকে জেনারেটিভ আর্টিফিশিয়াল ইন্টেলিজেন্স এবং অন্যান্য মেশিন লার্নিং ওয়ার্কলোড সহ ডেটাবেস অ্যাক্সেস করার প্রক্রিয়াকে বিমূর্ত করে বিরামহীন করে তোলে। ভেক্টর অনুসন্ধান ক্ষমতা, এবং ব্যবহার করার জন্য প্রস্তুত সরঞ্জামগুলির একটি সেট অফার করে যা অতিরিক্ত কোডের প্রয়োজন কমিয়ে দেয়।

এটি সব একসাথে রাখা: SkyPoint AI

স্কাইপয়েন্ট এআই সিনিয়র কেয়ার এবং লিভিং ইন্ডাস্ট্রির জন্য ডেটা, অ্যানালিটিক্স এবং এআই পরিষেবাগুলিতে বিশেষজ্ঞ একটি SaaS প্রদানকারী৷ সংস্থাটি প্রবীণ, যত্নশীল এবং সফ্টওয়্যার সিস্টেমগুলির মধ্যে প্রাকৃতিক এবং স্বজ্ঞাত মিথস্ক্রিয়া সক্ষম করতে জেনারেটিভ এআই ব্যবহার করে। জটিল অ্যাপ্লিকেশনগুলিকে সরল করে এবং ব্যবহারকারীর অভিজ্ঞতাকে স্ট্রিমলাইন করে, SkyPoint AI সিনিয়র এবং যত্নশীলদের ক্ষমতায়ন করে অনায়াসে তথ্য এবং অন্তর্দৃষ্টি অ্যাক্সেস করতে, যা যত্ন উন্নত করতে সাহায্য করে।


"কতজন বাসিন্দা বর্তমানে মেডিকেয়ারে আছেন?" এর মতো প্রম্পটের AI-উত্পাদিত উত্তর দেওয়ার জন্য সংস্থাটি বিভিন্ন ধরণের ডেটা থেকে টেনে নেয় যা কাঠামোগত এবং অসংগঠিত উভয়ই। স্কাইপয়েন্টের সিইও টিসন ম্যাথিউ সম্প্রতি আমাকে বলেছেন। এটি যত্ন প্রদানকারীদের সঠিক তথ্যের ভিত্তিতে দ্রুত জ্ঞাত সিদ্ধান্ত নিতে সাহায্য করে, তিনি বলেন।


সেই বিন্দুতে পৌঁছানো অবশ্য একটি প্রক্রিয়া ছিল, ম্যাথিউ বলেছিলেন। তার দল একটি স্ট্যান্ডার্ড এলএলএম নিয়ে শুরু করে এবং স্কাইপয়েন্ট ডেটা দিয়ে এটিকে সূক্ষ্ম-টিউন করে। "এটি বিপর্যয়কর ফলাফল নিয়ে এসেছে - এলোমেলো শব্দ, এমনকি," তিনি বলেছিলেন। প্রম্পটগুলি বোঝা এবং তৈরি করা স্কাইপয়েন্ট পরিচালনা করতে পারে এমন কিছু ছিল, তবে স্কেলে সঠিক উত্তর তৈরি করার জন্য এটির একটি AI প্রযুক্তি স্ট্যাকের প্রয়োজন।


SkyPoint একটি সিস্টেম তৈরি করেছে যা অপারেটর এবং প্রদানকারীদের থেকে স্ট্রাকচার্ড ডেটা গ্রহণ করে, যেমন ইলেকট্রনিক স্বাস্থ্যসেবা রেকর্ড এবং বেতনের ডেটা সহ। এটি একটি কলামার ডাটাবেসে সংরক্ষণ করা হয়; এটি অনুসন্ধান করতে RAG ব্যবহার করা হয়। অসংগঠিত তথ্য, যেমন নীতি এবং পদ্ধতি এবং রাষ্ট্রীয় প্রবিধান, একটি ভেক্টর ডাটাবেসে সংরক্ষণ করা হয়: ডেটাস্ট্যাক্স অ্যাস্ট্রা ডিবি .


টিসন একটি উদাহরণ হিসাবে একটি প্রশ্ন উত্থাপন করেছেন: যদি একজন বাসিন্দা অপমানজনক হয়ে ওঠে? অ্যাস্ট্রা ডিবি একটি উত্তর প্রদান করে যা রাষ্ট্রীয় প্রবিধান এবং ব্যবহারকারীর প্রসঙ্গ এবং বিভিন্ন নথির উপর ভিত্তি করে একত্রিত হয় এবং ভেক্টর এমবেডিং , স্বাভাবিক ভাষায় যা একজন সিনিয়র কেয়ার সুবিধা কর্মীর পক্ষে বোঝা সহজ,


"এগুলি নির্দিষ্ট উত্তর যা সঠিক হতে হবে," টিসন বলেছিলেন। "এটি এমন তথ্য যা একটি সংস্থা তাদের সম্প্রদায় এবং তাদের ব্যবসার জন্য জ্ঞাত সিদ্ধান্ত নিতে নির্ভর করে।"

উপসংহার

স্কাইপয়েন্ট এআই এআই হ্যালুসিনেশনের ঝুঁকি কমানোর গুরুত্ব তুলে ধরে; সঠিক উত্তর নিশ্চিত করার জন্য উপলব্ধ পদ্ধতি এবং সরঞ্জাম ছাড়া ফলাফল সম্ভাব্য ভয়ানক হতে পারে।


RAG, যুক্তি, এবং পুনরাবৃত্ত অনুসন্ধান পদ্ধতি যেমন FLARE, জেনারেটিভ এআই - বিশেষ করে যখন মালিকানা ডেটা দ্বারা ইন্ধন দেওয়া হয় - একটি ক্রমবর্ধমান শক্তিশালী হাতিয়ার হয়ে উঠছে যা এন্টারপ্রাইজগুলিকে তাদের গ্রাহকদের দক্ষতার সাথে এবং কার্যকরভাবে পরিবেশন করতে সহায়তা করে৷


অ্যালান হো, ডেটাস্ট্যাক্স দ্বারা

কিভাবে DataStax আপনাকে সাহায্য করে সে সম্পর্কে আরও জানুন রিয়েল-টাইম, জেনারেটিভ এআই অ্যাপ্লিকেশন তৈরি করুন .


এছাড়াও এখানে প্রকাশিত.