লেখক: ইয়েউ কেন চিয়া, রুওচেন ঝাও, জিংজুয়ান লি, বোশেং ডিং, লিডং বিং
সম্প্রতি, কথোপকথনমূলক AI মডেল যেমন OpenAI-এর ChatGPT [1] উচ্চ-মানের লিখিত সামগ্রী তৈরি করার ক্ষমতা, মানুষের মতো কথোপকথন রাখা, বাস্তব প্রশ্নগুলির উত্তর এবং আরও অনেক কিছু করার ক্ষমতা দিয়ে জনসাধারণের কল্পনাকে ধারণ করেছে।
এই ধরনের সম্ভাবনার সাথে সজ্জিত, মাইক্রোসফ্ট এবং গুগল নতুন পরিষেবা ঘোষণা করেছে [২] যা তাদের ঐতিহ্যগত সার্চ ইঞ্জিনের সাথে একত্রিত করে।
কথোপকথন-চালিত সার্চ ইঞ্জিনের নতুন তরঙ্গে স্বাভাবিকভাবেই জটিল প্রশ্নের উত্তর দেওয়ার, সার্চের ফলাফলের সারসংক্ষেপ এবং এমনকি একটি সৃজনশীল হাতিয়ার হিসেবে কাজ করার ক্ষমতা রয়েছে।
যাইহোক, এটি করার সময়, প্রযুক্তি কোম্পানিগুলি এখন একটি বৃহত্তর নৈতিক চ্যালেঞ্জের মুখোমুখি হচ্ছে যাতে তাদের মডেলগুলি মিথ্যা, ভিত্তিহীন বা বিরোধপূর্ণ উত্তর দিয়ে ব্যবহারকারীদের বিভ্রান্ত না করে। তাই, স্বাভাবিকভাবেই প্রশ্ন জাগে: চ্যাটজিপিটি-এর মতো মডেলগুলি কি প্রকৃত নির্ভুলতার গ্যারান্টি দিতে পারে?
এই নিবন্ধে, আমরা মাইক্রোসফ্টের নতুন বিং [৯] এবং গুগলের বার্ড [৩]-এ বেশ কিছু বাস্তবিক ভুল উন্মোচন করেছি যা পরামর্শ দেয় যে তারা বর্তমানে পারে না।
দুর্ভাগ্যবশত, মিথ্যা প্রত্যাশা বিপর্যয়কর ফলাফল হতে পারে। মাইক্রোসফটের নতুন বিং ঘোষণার প্রায় একই সময়ে, গুগল তড়িঘড়ি করে বার্ড নামে একটি নতুন কথোপকথনমূলক এআই পরিষেবা ঘোষণা করেছে।
হাইপ সত্ত্বেও, প্রত্যাশাগুলি দ্রুত ভেঙ্গে যায় যখন বার্ড প্রচারমূলক ভিডিওতে একটি বাস্তবিক ভুল করে [১৪], অবশেষে গুগলের শেয়ারের দাম [৪] প্রায় ৮% হ্রাস করে এবং এর বাজার মূল্য থেকে $100 বিলিয়ন মুছে ফেলে।
অন্যদিকে, মাইক্রোসফটের নতুন বিং নিয়ে কম যাচাই-বাছাই করা হয়েছে। প্রদর্শনী ভিডিওতে [৮], আমরা দেখতে পেলাম যে নতুন বিং একজন শীর্ষ কবি হিসেবে একজন রক গায়ককে সুপারিশ করেছে, জন্ম ও মৃত্যুর তারিখ তৈরি করেছে এবং এমনকি আর্থিক প্রতিবেদনের সম্পূর্ণ সারাংশও তৈরি করেছে।
দাবিত্যাগ [৯] সত্ত্বেও যে নতুন বিং-এর প্রতিক্রিয়া সবসময় বাস্তবসম্মত নাও হতে পারে, অত্যধিক আশাবাদী অনুভূতি অনিবার্যভাবে মোহভঙ্গের দিকে নিয়ে যেতে পারে।
তাই, আমাদের লক্ষ্য হল কথোপকথন-চালিত সার্চ ইঞ্জিনগুলির মুখোমুখি হওয়া বাস্তবিক চ্যালেঞ্জগুলির প্রতি দৃষ্টি আকর্ষণ করা যাতে আমরা ভবিষ্যতে তাদের আরও ভালভাবে মোকাবেলা করতে পারি।
মাইক্রোসফ্ট এআই দ্বারা চালিত নতুন বিং সার্চ ইঞ্জিন প্রকাশ করেছে, দাবি করেছে যে এটি ঐতিহ্যবাহী সার্চ ইঞ্জিনের সুযোগে বিপ্লব ঘটাবে। এটা কি আসলেই হয়? আমরা প্রদর্শনের ভিডিও [৮] এবং উদাহরণ [৯] এর আরও গভীরে প্রবেশ করেছি এবং তিনটি প্রধান ধরণের বাস্তবিক সমস্যা খুঁজে পেয়েছি:
আর্থিক প্রতিবেদনে বানোয়াট সংখ্যা: আপনি যখন নতুন বিংকে বিশ্বাস করেন তখন সতর্ক থাকুন!
আমাদের আশ্চর্যের জন্য, নতুন বিং প্রদর্শনীতে আর্থিক প্রতিবেদনের একটি সম্পূর্ণ সারাংশ তৈরি করেছে!
যখন মাইক্রোসফ্ট এক্সিকিউটিভ ইউসুফ মেহেদি শ্রোতাদের দেখিয়েছিলেন কিভাবে গ্যাপ ইনকর্পোরেটেড 2022 Q3 ফিসকাল রিপোর্ট [10a]-এর একটি সারাংশ স্বয়ংক্রিয়ভাবে তৈরি করতে "পৃষ্ঠা থেকে কী টেকঅ্যাওয়েজ" কমান্ডটি ব্যবহার করতে হয়, তিনি নিম্নলিখিত ফলাফলগুলি পান
যাইহোক, ঘনিষ্ঠভাবে পরীক্ষা করার পর, উত্পন্ন সারাংশের সমস্ত মূল পরিসংখ্যান ভুল। আমরা বৈধ তথ্যসূত্র হিসাবে নীচের মূল আর্থিক প্রতিবেদন থেকে উদ্ধৃতাংশ দেখাব।
নতুন বিং-এর মতে, সামঞ্জস্যের পরে অপারেটিং মার্জিন ছিল 5.9%, যখন উৎস প্রতিবেদনে এটি আসলে 3.9% ছিল।
একইভাবে, শেয়ার প্রতি সামঞ্জস্য করা পাতলা আয় $0.42 হিসাবে জেনারেট হয়েছে, যখন এটি $0.71 হওয়া উচিত।
নেট বিক্রয়ের বিষয়ে, নতুন বিং-এর সারাংশ "নিম্ন দ্বিগুণ অঙ্কে বৃদ্ধি" দাবি করেছে, যখন মূল প্রতিবেদনে বলা হয়েছে যে "নিট বিক্রয় মধ্য-একক সংখ্যার নিচে হতে পারে"।
উৎস প্রতিবেদনে প্রকৃত পরিসংখ্যানের সাথে বিরোধপূর্ণ উত্পন্ন পরিসংখ্যান ছাড়াও, আমরা লক্ষ্য করি যে নতুন বিং এমন হ্যালুসিনেটেড তথ্যও তৈরি করতে পারে যা উৎসে বিদ্যমান নেই।
নতুন বিং-এর জেনারেট করা সারাংশে, "প্রায় 7% অপারেটিং মার্জিন এবং $1.60 থেকে $1.75 এর শেয়ার প্রতি পাতলা আয়" সোর্স রিপোর্টে কোথাও খুঁজে পাওয়া যায় না।
দুর্ভাগ্যবশত, পরিস্থিতি আরও খারাপ হয় যখন নতুন বিংকে নির্দেশ দেওয়া হয় "একটি টেবিলে লুলুলেমনের সাথে এটি তুলনা করার"। নতুন Bing দ্বারা উত্পন্ন আর্থিক তুলনা সারণীতে অসংখ্য ভুল রয়েছে:
এই টেবিল, আসলে, অর্ধেক ভুল. সমস্ত সংখ্যার মধ্যে, Gap Inc.-এর কলামে 6টির মধ্যে 3টি ভুল, এবং Lululemon-এর ক্ষেত্রেও একই।
যেমন আগে উল্লেখ করা হয়েছে, Gap Inc.-এর প্রকৃত অপারেটিং মার্জিন হল 4.6% (বা সামঞ্জস্য করার পরে 3.9%), এবং শেয়ার প্রতি পাতলা আয় $0.77 (বা সামঞ্জস্য করার পরে $0.71) হওয়া উচিত।
নতুন বিং আরও দাবি করেছে যে গ্যাপ ইনকর্পোরেটেডের নগদ এবং নগদ সমতুল্য $1.4 বিলিয়ন, যখন এটি আসলে $679 মিলিয়ন।
Lululemon এর 2022 Q3 ফিসকাল রিপোর্ট [10b] অনুসারে, গ্রস মার্জিন 55.9% হওয়া উচিত, যখন নতুন Bing দাবি করেছে যে এটি 58.7%।
অপারেটিং মার্জিন 19.0% হওয়া উচিত, যখন নতুন Bing এটি 20.7% বলে দাবি করে৷ শেয়ার প্রতি পাতলা আয় প্রকৃতপক্ষে $2.00 ছিল, যখন নতুন Bing দাবি করে যে এটি $1.65।
তাহলে, এই পরিসংখ্যান কোথা থেকে এসেছে? আপনি হয়তো ভাবছেন যে এটি এমন একটি সংখ্যা যা মূল নথির অন্য অংশ থেকে ভুলভাবে স্থানান্তরিত হয়েছে। উত্তর হল না। কৌতূহলজনকভাবে, এই সংখ্যাগুলি মূল নথিতে কোথাও পাওয়া যায় না এবং সম্পূর্ণরূপে বানোয়াট।
প্রকৃতপক্ষে, জেনারেটিভ মডেলের আউটপুটগুলিকে আরও বাস্তবিকভাবে ভিত্তি করার জন্য এটি এখনও একটি উন্মুক্ত গবেষণা চ্যালেঞ্জ।
স্পষ্টভাবে বলতে গেলে, ChatGPT-এর মতো জনপ্রিয় জেনারেটিভ এআই মডেলগুলি উৎস থেকে সত্যগুলি কঠোরভাবে অনুলিপি এবং আটকানোর পরিবর্তে একটি নির্দিষ্ট শব্দভাণ্ডার থেকে তৈরি করার জন্য শব্দ চয়ন করছে।
তাই, বাস্তবিক শুদ্ধতা জেনারেটিভ এআই-এর সহজাত চ্যালেঞ্জগুলির মধ্যে একটি এবং বর্তমান মডেলগুলির সাথে কঠোরভাবে নিশ্চিত করা যায় না। সার্চ ইঞ্জিনের ক্ষেত্রে এটি একটি প্রধান উদ্বেগের বিষয় কারণ ব্যবহারকারীরা নির্ভরযোগ্য ফলাফলের উপর নির্ভর করে এবং বাস্তবসম্মতভাবে সঠিক।
জাপানের শীর্ষ কবি: গোপনে একজন রক গায়ক?
আমরা লক্ষ্য করি যে নতুন Bing শুধুমাত্র সংখ্যার জন্য নয় বরং নির্দিষ্ট সত্তার ব্যক্তিগত বিবরণের জন্যও বাস্তবিক ভুল তৈরি করে, যেমনটি উপরের প্রতিক্রিয়ায় দেখানো হয়েছে যখন নতুন বিংকে "শীর্ষ জাপানী কবি" সম্পর্কে জিজ্ঞাসা করা হয়েছিল।
উত্পন্ন জন্ম তারিখ, মৃত্যু, এবং পেশা প্রকৃতপক্ষে উল্লেখিত উৎসের সাথে সাংঘর্ষিক। উইকিপিডিয়া [১১এ] এবং আইএমডিবি [১১এ] অনুসারে, এরিকো কিশিদা 1929 সালে জন্মগ্রহণ করেছিলেন এবং 2011 সালে মারা যান। তিনি একজন নাট্যকার এবং প্রাবন্ধিক ছিলেন না, কিন্তু একজন শিশু বইয়ের লেখক এবং অনুবাদক ছিলেন।
নতুন বিং ভুল করতে থাকে যখন এটি গ্যাকটকে একজন শীর্ষ জাপানি কবি হিসাবে ঘোষণা করে যখন তিনি প্রকৃতপক্ষে জাপানের একজন বিখ্যাত রকস্টার। উইকিপিডিয়া সূত্র [11b] অনুসারে, তিনি একজন অভিনেতা, সঙ্গীতশিল্পী এবং গায়ক। উৎসে তার কোনো ধরনের কবিতা প্রকাশের কোনো তথ্য নেই।
বিং এর নাইটক্লাবের সুপারিশ অনুসরণ করছেন? আপনি একটি বন্ধ দরজা সম্মুখীন হতে পারে.
তদুপরি, নতুন বিং মেক্সিকো সিটিতে যাওয়ার সম্ভাব্য নাইটক্লাবগুলির একটি তালিকা তৈরি করেছে যখন জিজ্ঞাসা করা হয়েছিল "নাইটলাইফ কোথায়?" উদ্বেগজনকভাবে, প্রায় সব ক্লাবের খোলার সময় ভুলভাবে তৈরি করা হয়েছে:
আমরা একাধিক উত্সের সাথে খোলার সময়গুলি ক্রস-চেক করেছি, যা নিবন্ধের শেষে যুক্ত করা হয়েছে। El Almacen [12a] আসলে মঙ্গলবার থেকে রবিবার সন্ধ্যা 7:00 থেকে 3:00 পর্যন্ত খোলা থাকে, নতুন Bing দাবি করে যে এটি "মঙ্গলবার থেকে রবিবার বিকেল 5:00 থেকে রাত 11:00 পর্যন্ত খোলা"।
এল মারারা [১২বি] আসলে বৃহস্পতিবার থেকে শনিবার পর্যন্ত সন্ধ্যা 6:00 টা থেকে 2:30 টা পর্যন্ত খোলা থাকে, কিন্তু "বৃহস্পতিবার থেকে রবিবার সন্ধ্যা 6:00 টা থেকে 3:00 পর্যন্ত খোলা" বলে দাবি করা হয়।
Guadalajara de Noche [12c] প্রতিদিন বিকেল 5:30 টা থেকে 1:30 বা 12:30 টা পর্যন্ত খোলা থাকে, যখন নতুন Bing দাবি করে যে এটি "প্রতিদিন রাত 8:00 থেকে 3:00 টা পর্যন্ত খোলা"।
খোলার সময় ছাড়াও, নতুন Bing দ্বারা উল্লিখিত পর্যালোচনা তারা এবং সংখ্যার প্রায় সমস্ত বিবরণ ভুল। Yelp, Tripadvisor, বা Google Maps-এ অনুসন্ধান করা সত্ত্বেও ম্যাচিং রিভিউ স্কোর পাওয়া যাবে না।
উপরে উল্লিখিত কেসগুলি ছাড়াও, আমরা তাদের প্রদর্শন ভিডিওতে অন্যান্য সমস্যাও পেয়েছি, যেমন পণ্যের দামের অমিল, স্টোরের ঠিকানা ত্রুটি এবং সময়-সম্পর্কিত ভুল। আপনি আগ্রহী হলে তাদের যাচাই করতে স্বাগত জানাই.
যদিও নতুন Bing সার্চ ইঞ্জিন এখনও সম্পূর্ণরূপে অ্যাক্সেসযোগ্য নয়, আমরা মাইক্রোসফ্ট দ্বারা প্রদত্ত কয়েকটি প্রদর্শন উদাহরণ [9] পরীক্ষা করতে পারি। ঘনিষ্ঠভাবে পরীক্ষা করার পরে, এমনকি এই চেরি-বাছাই করা উদাহরণগুলি বাস্তবিক ভিত্তির সম্ভাব্য সমস্যাগুলি দেখায়।
"আমি আমার বাচ্চার সাথে কি শিল্প ধারণা করতে পারি?" শিরোনামের ডেমোতে, নতুন বিং প্রতিটি সুপারিশের জন্য ক্রাফটিং উপকরণগুলির একটি অপর্যাপ্ত তালিকা তৈরি করেছে [13]।
উদাহরণস্বরূপ, একটি কার্ডবোর্ড বক্স গিটার তৈরির পরামর্শ দেওয়ার সময়, এটি সরবরাহগুলি তালিকাভুক্ত করে: "একটি টিস্যু বক্স, একটি কার্ডবোর্ড টিউব, কিছু রাবার ব্যান্ড, পেইন্ট এবং আঠা"।
যাইহোক, এটি উদ্ধৃত ওয়েবসাইট [13a] দ্বারা প্রস্তাবিত নির্মাণ কাগজ, কাঁচি, ওয়াশি টেপ, ফোম স্টিকার এবং কাঠের পুঁতি অন্তর্ভুক্ত করতে ব্যর্থ হয়েছে।
আরেকটি সম্ভাব্য উদ্বেগ হল যে নতুন Bing এমন সামগ্রী তৈরি করেছে যার রেফারেন্স উত্সগুলিতে কোনও বাস্তব ভিত্তি নেই, 12টি প্রদর্শন উদাহরণ জুড়ে কমপক্ষে 21 বার৷
তথ্যগত ভিত্তির অভাব এবং উত্সগুলির একটি সম্পূর্ণ তালিকা উদ্ধৃত করতে ব্যর্থতা ব্যবহারকারীদের নতুন Bing এর বিশ্বস্ততা নিয়ে প্রশ্ন তুলতে পারে।
গুগল বার্ড [৩] নামে একটি কথোপকথনমূলক এআই পরিষেবাও উন্মোচন করেছে । প্রথাগত অনুসন্ধানের প্রশ্নে টাইপ করার পরিবর্তে, ব্যবহারকারীরা ওয়েব-চালিত চ্যাটবটের সাথে একটি নৈমিত্তিক এবং তথ্যপূর্ণ কথোপকথন করতে পারে।
উদাহরণস্বরূপ, একজন ব্যবহারকারী প্রাথমিকভাবে স্টারগেজিংয়ের জন্য সেরা নক্ষত্রপুঞ্জ সম্পর্কে জিজ্ঞাসা করতে পারে এবং তারপর সেগুলি দেখার জন্য বছরের সেরা সময় সম্পর্কে জিজ্ঞাসা করে অনুসরণ করতে পারে। যাইহোক, একটি স্পষ্ট দাবিত্যাগ হল যে বার্ড "ভুল বা অনুপযুক্ত তথ্য" দিতে পারে।
আসুন তাদের টুইটার পোস্ট [১৪] এবং ভিডিও প্রদর্শনে [১৫] বার্ডের প্রকৃত নির্ভুলতা তদন্ত করি।
গুগলের সিইও সুন্দর পিচাই সম্প্রতি বার্ডের ক্ষমতা প্রদর্শনের জন্য একটি ছোট ভিডিও [১৪] পোস্ট করেছেন। যাইহোক, উত্তরটিতে একটি ত্রুটি রয়েছে যে টেলিস্কোপটি প্রথম এক্সোপ্ল্যানেট চিত্রগুলি ধারণ করেছিল, যা জ্যোতির্পদার্থবিদদের দ্বারা দ্রুত নির্দেশ করা হয়েছিল [16a]।
NASA [16b] দ্বারা নিশ্চিত করা হয়েছে, একটি এক্সোপ্ল্যানেটের প্রথম ছবিগুলি জেমস ওয়েব স্পেস টেলিস্কোপের (JWST) পরিবর্তে ভেরি লার্জ টেলিস্কোপ (VLT) দ্বারা ধারণ করা হয়েছিল।
দুর্ভাগ্যবশত, বার্ড একটি ব্যয়বহুল পরীক্ষায় পরিণত হয়েছিল কারণ বাস্তবিক ভুলের খবর প্রকাশিত হওয়ার পর Google-এর স্টক মূল্য তীব্রভাবে হ্রাস পেয়েছিল [৪]।
বার্ডের ভিডিও প্রদর্শনের বিষয়ে, উপরের চিত্রটি দেখায় যে কীভাবে Google-এর বার্ড নক্ষত্রপুঞ্জগুলি দৃশ্যমান হয় সেই প্রশ্নের উত্তর দেয় [16]। যাইহোক, ওরিয়নের সময় একাধিক সূত্রের সাথে অসামঞ্জস্যপূর্ণ।
শীর্ষ Google অনুসন্ধান ফলাফল [17a] অনুসারে, নক্ষত্রমণ্ডলটি জানুয়ারি থেকে মার্চ পর্যন্ত সবচেয়ে বেশি দেখা যায়। উইকিপিডিয়া [১৭বি] অনুসারে, এটি জানুয়ারি থেকে এপ্রিল পর্যন্ত সবচেয়ে বেশি দেখা যায়।
তদ্ব্যতীত, উত্তরটি অসম্পূর্ণ কারণ নক্ষত্রমণ্ডলের দৃশ্যমানতা ব্যবহারকারীর উত্তর বা দক্ষিণ গোলার্ধের উপর নির্ভর করে।
নতুন Bing এবং Bard পরিষেবাগুলি অনুশীলনে সমানভাবে বিশ্বাসযোগ্য নাও হতে পারে৷ এটি অনুসন্ধান ফলাফলের গুণমান, কথোপকথনমূলক মডেলের গুণমান এবং প্রদত্ত উত্তরগুলির স্বচ্ছতার মতো কারণগুলির কারণে।
বর্তমানে, উভয় পরিষেবাই তাদের কথোপকথনমূলক এআই মডেলগুলির প্রতিক্রিয়া নির্দেশ করার জন্য প্রাসঙ্গিক তথ্য উত্সের উপর নির্ভর করে।
সুতরাং, উত্তরগুলির প্রকৃত নির্ভুলতা তথ্য পুনরুদ্ধার সিস্টেমের মানের উপর নির্ভর করে [18], এবং কথোপকথনমূলক মডেল কতটা ভাল উত্তর তৈরি করতে পারে যা তথ্যের উত্সের উপর ভিত্তি করে।
যেহেতু পরিষেবাগুলির সম্পূর্ণ বিবরণ জনসাধারণের কাছে প্রকাশ করা হয় না, এটি অস্পষ্ট যে কোনটি গভীর পরীক্ষা ছাড়াই উচ্চতর বাস্তব নির্ভুলতা অর্জন করতে পারে। অন্যদিকে, আমরা অনুভব করি যে স্বচ্ছতা বিশ্বাসযোগ্যতার মতোই গুরুত্বপূর্ণ।
উদাহরণস্বরূপ, আমরা লক্ষ্য করি যে নতুন Bing এর উত্তরগুলির উত্স সম্পর্কে আরও স্বচ্ছ, কারণ এটি বেশিরভাগ ক্ষেত্রে রেফারেন্স লিঙ্ক সরবরাহ করে। এটি ব্যবহারকারীদের স্বাধীনভাবে ফ্যাক্ট-চেকিং পরিচালনা করতে সক্ষম করে এবং আমরা আশা করি ভবিষ্যতে কথোপকথন পরিষেবাগুলিও এই বৈশিষ্ট্যটি প্রদান করবে।
উপরে দেখানো অসংখ্য বাস্তবিক ভুলের মাধ্যমে, এটা স্পষ্ট যে ChatGPT-এর মতো কথোপকথনমূলক এআই মডেলগুলি নির্ভরযোগ্য সূত্রের সাথে উপস্থাপন করা হলেও পরস্পরবিরোধী বা অস্তিত্বহীন তথ্য তৈরি করতে পারে।
পূর্বে উল্লিখিত হিসাবে, চ্যাটজিপিটি-এর মতো মডেলগুলির বাস্তব ভিত্তি নিশ্চিত করা এটি একটি গুরুত্বপূর্ণ গবেষণা চ্যালেঞ্জ।
তাদের উত্পাদিত প্রকৃতির কারণে, তাদের আউটপুট নিয়ন্ত্রণ করা কঠিন [১৯] এবং এমনকি উত্পন্ন আউটপুট তথ্য উত্সের সাথে বাস্তবসম্মতভাবে সামঞ্জস্যপূর্ণ তা নিশ্চিত করা কঠিন।
একটি স্বল্পমেয়াদী সমাধান হতে পারে কথোপকথনমূলক এআইকে অনিরাপদ বা অবাস্তব আউটপুট তৈরি করা থেকে বিরত রাখতে বিধিনিষেধ আরোপ করা। যাইহোক, দূষিত পক্ষগুলি অবশেষে নিরাপত্তা বিধিনিষেধগুলিকে বাইপাস করতে পারে [7], যখন সত্য যাচাইকরণ [20] আরেকটি অমীমাংসিত গবেষণা চ্যালেঞ্জ।
দীর্ঘ মেয়াদে, আমাদের হয়তো মেনে নিতে হবে যে মানুষ এবং যন্ত্র লেখকরা একইভাবে অসিদ্ধ থাকবে। আরও বিশ্বস্ত AI-এর দিকে অগ্রসর হতে, ChatGPT-এর মতো কথোপকথনমূলক AI মডেলগুলি অস্পষ্ট ব্ল্যাক বক্স হিসাবে থাকতে পারে না [২১]।
তাদের ডেটা উত্স এবং সম্ভাব্য পক্ষপাত সম্পর্কে তাদের সম্পূর্ণ স্বচ্ছ হওয়া উচিত, তাদের উত্তরগুলিতে কম আস্থা থাকলে রিপোর্ট করা উচিত এবং তাদের যুক্তি প্রক্রিয়াগুলি ব্যাখ্যা করা উচিত।
একটি পদ্ধতিগত ওভারভিউ করার পরে, আমরা ChatGPT-এর মতো কথোপকথনমূলক AI দ্বারা চালিত অনুসন্ধান ইঞ্জিনগুলির নতুন তরঙ্গ দ্বারা প্রদর্শিত উল্লেখযোগ্য ঘটনাগত সীমাবদ্ধতা খুঁজে পেয়েছি।
সিদ্ধান্ত নেওয়ার আগে আমাদের রায় ব্যবহার করার জন্য সম্ভাব্য তথ্যগত ভুলতা এবং সতর্কতার দাবি অস্বীকার করা সত্ত্বেও, আমরা এমনকি চেরি-বাছাই করা বিক্ষোভেও অনেক বাস্তবিক ভুলের সম্মুখীন হয়েছি।
সুতরাং, আমরা সাহায্য করতে পারি না কিন্তু আশ্চর্য হই: সার্চ ইঞ্জিনের উদ্দেশ্য কী, যদি নির্ভরযোগ্য এবং বাস্তবসম্মত উত্তর না দেওয়া হয়? এআই-জেনারেটেড ফ্যাব্রিকেশনে ভরা ওয়েবের একটি নতুন যুগে, আমরা কীভাবে সত্যতা নিশ্চিত করব?
মাইক্রোসফ্ট এবং গুগলের মতো টেক জায়ান্টগুলির বিশাল সংস্থান থাকা সত্ত্বেও, বর্তমান ChatGPT-এর মতো মডেলগুলি প্রকৃত নির্ভুলতা নিশ্চিত করতে পারে না। তবুও, আমরা এখনও কথোপকথনমূলক মডেলগুলির সম্ভাবনা এবং আরও বিশ্বস্ত AI এর বিকাশ সম্পর্কে আশাবাদী।
চ্যাটজিপিটি-এর মতো মডেলগুলি দুর্দান্ত সম্ভাবনা দেখিয়েছে এবং নিঃসন্দেহে আমাদের দৈনন্দিন জীবনের অনেক শিল্প এবং দিকগুলিকে উন্নত করবে। যাইহোক, যদি তারা বানোয়াট বিষয়বস্তু এবং অবাস্তব উত্তর তৈরি করতে থাকে, তাহলে জনসাধারণ কৃত্রিম বুদ্ধিমত্তা সম্পর্কে আরও সতর্ক হয়ে উঠতে পারে।
তাই, নির্দিষ্ট মডেল বা কোম্পানির সমালোচনা না করে, আমরা গবেষক এবং ডেভেলপারদের AI পরিষেবার স্বচ্ছতা এবং বাস্তবিক সঠিকতার উন্নতির দিকে মনোযোগ দেওয়ার জন্য আহ্বান জানাব, যাতে মানুষ অদূর ভবিষ্যতে নতুন প্রযুক্তির উপর উচ্চ স্তরের আস্থা রাখতে পারে।
রেফারেন্স নিবন্ধ
[১] চ্যাটজিপিটি: সংলাপের জন্য ভাষার মডেল অপ্টিমাইজ করা: https://openai.com/blog/chatgpt/
[2] Bing, Bard, এবং AI অনুসন্ধানের ভবিষ্যত 7টি সমস্যার সম্মুখীন: https://www.theverge.com/2023/2/9/23592647/ai-search-bing-bard-chatgpt-microsoft-google-problems - চ্যালেঞ্জ
[৩] গুগল: আমাদের এআই যাত্রার একটি গুরুত্বপূর্ণ পরবর্তী ধাপ: https://blog.google/technology/ai/bard-google-ai-search-updates/
[৪] গুগলের বার্ড এআই বট ভুলের কারণে $100 বিলিয়ন শেয়ার বন্ধ হয়ে গেছে: https://www.bbc.com/news/business-64576225
[৫] নতুন এআই-চালিত মাইক্রোসফ্ট বিং এবং এজ দিয়ে অনুসন্ধান পুনরুদ্ধার করা, ওয়েবের জন্য আপনার সহ-পাইলট: https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new- AI-চালিত-মাইক্রোসফ্ট-বিং-এন্ড-এজ-আপনার-কপিলট-ওয়েবের জন্য/
[৬] কোম্পানির এআই চ্যাটবট ডেমো চলাকালীন একটি ত্রুটি করার পরে Google শেয়ারগুলি $100 বিলিয়ন হারায়: https://www.cnn.com/2023/02/08/tech/google-ai-bard-demo-error
[৭] হ্যাকাররা এমন একটি পরিষেবা বিক্রি করছে যা ম্যালওয়্যারের উপর চ্যাটজিপিটি বিধিনিষেধকে বাইপাস করে: https://arstechnica.com/information-technology/2023/02/now-open-fee-based-telegram-service-that-uses-chatgpt-to -জেনারেট-ম্যালওয়্যার/
নতুন Bing ফ্যাক্ট যাচাইকরণ সূত্র:
[৮] মাইক্রোসফটের প্রেস রিলিজ ভিডিও ( https://www.youtube.com/watch?v=rOeRWRJ16yY )
[৯] মাইক্রোসফটের ডেমো পেজ : ( https://www.bing.com/new )
নতুন বিং এবং আর্থিক প্রতিবেদন:
[১০ ক] গ্যাপ ইনকর্পোরেটেড ফিসকাল রিপোর্ট ভিডিওতে দেখানো হয়েছে: https://s24.q4cdn.com/508879282/files/doc_financials/2022/q3/3Q22-EPR-FINAL-with-Tables.pdf
[১০বি] তাদের অফিসিয়াল ওয়েবসাইটে লুলুলেমন ফিসকাল রিপোর্ট পাওয়া গেছে: https://corporate.lululemon.com/media/press-releases/2022/12-08-2022-210558496#:\~:text=2022 সালের তৃতীয় প্রান্তিকের জন্য তৃতীয়টির তুলনায় %2C, %2C এবং আন্তর্জাতিকভাবে 41%25 বৃদ্ধি পেয়েছে
নতুন বিং এবং জাপানি কবি:
[১১এ] এরিকো কিশিদা: উইকিপিডিয়া ( https://twitter.com/sundarpichai/status/1622673369480204288 ), IMDB ( https://www.imdb.com/name/nm1063814/ )
[১১বি] গ্যাকেট: উইকিপিডিয়া ( https://en.wikipedia.org/wiki/Gackt )
মেক্সিকোতে নতুন বিং এবং নাইটক্লাব:
[12a] এল আলমাসেন: Google মানচিত্র ( https://goo.gl/maps/3BL27XgWpDVzLLnaA ), রেস্টুরেন্ট গুরু ( https://restaurantguru.com/El-Almacen-Mexico-City )
[12b] এল মারা: গুগল ম্যাপ ( https://goo.gl/maps/HZFe8xY7uTk1SB6s5 ), রেস্টুরেন্ট গুরু ( https://restaurantguru.com/El-Marra-Mexico-City )
[ 12c ] গুয়াদালাজারা দে নোচে: ট্রিপ্যাডভাইসর ( https://www.tripadvisor.es/Attraction_Review-g150800-d3981435-Reviews-Guadalajara_de_Noche-Mexico_City_Central_Mexico_and_Gulfs_goast/Gulfps_goast/Gulfs_gost/ 1EeJZFP7wZYA )
[১৩] নতুন বিং এবং নৈপুণ্যের ধারণা ( https://www.bing.com/search?q=শিল্প ও কারুশিল্পের ধারণা, শুধুমাত্র কার্ডবোর্ডের বাক্স, প্লাস্টিকের বোতল, কাগজ এবং স্ট্রিং&iscopilotedu=1&form=MA13G7 ব্যবহার করে বাচ্চাদের জন্য নির্দেশাবলী সহ ) :
[১৩এ] উদ্ধৃত ওয়েবসাইট: হ্যাপি টডলার প্লেটাইম ( https://happytoddlerplaytime.com/cardboard-box-guitar-craft-for-kids/ )
বার্ড ফ্যাক্ট যাচাইকরণ সূত্র:
[১৪] প্রচারমূলক ব্লগ ( https://twitter.com/sundarpichai/status/1622673369480204288 ) এবং ভিডিও ( https://twitter.com/sundarpichai/status/1622673775182626818 )
[১৫] ভিডিও প্রদর্শন ( https://www.youtube.com/watch?v=yLWXJ22LUEc )
কোন টেলিস্কোপ প্রথম এক্সোপ্ল্যানেটের ছবি ধারণ করেছিল
গ্রান্ট ট্রেম্বলে (আমেরিকান অ্যাস্ট্রোফিজিসিস্ট) দ্বারা টুইটার ( https://twitter.com/astrogrant/status/1623091683603918849 )
[16b] NASA: 2M1207 b — একটি এক্সোপ্ল্যানেটের প্রথম ছবি ( https://exoplanets.nasa.gov/resources/300/2m1207-b-first-image-of-an-exoplanet/ )
যখন নক্ষত্রমণ্ডলী দেখা যায়
[17a] Google ( https://www.google.com/search?client=safari&rls=en&q=when+is+orion+visible&ie=UTF-8&oe=UTF-8 ) শীর্ষ ফলাফল: Byju's ( https://byjus. com/question-answer/in-which-season-of-the-year-is-the-constellation-orion-visible-in-the-sky/ )
[17b] উইকিপিডিয়া পৃষ্ঠা "ওরিয়ন (নক্ষত্রমণ্ডল)": https://en.wikipedia.org/wiki/Orion_(নক্ষত্রমণ্ডল)
একাডেমিক রেফারেন্স
[১৮] তথ্য পুনরুদ্ধারের একটি ভূমিকা: https://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf
[১৯] পাঠ্যের নিয়ন্ত্রিত প্রজন্মের দিকে: http://proceedings.mlr.press/v70/hu17e/hu17e.pdf
[২০] জ্বর: ফ্যাক্ট এক্সট্রাকশন এবং ভেরিফিকেশনের জন্য একটি বড় মাপের ডেটাসেট: https://aclanthology.org/N18-1074.pdf
[২১] ব্ল্যাক-বক্সের ভিতরে উঁকি দেওয়া: ব্যাখ্যাযোগ্য কৃত্রিম বুদ্ধিমত্তার উপর একটি সমীক্ষা (XAI): https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8466590
ইমেজ ক্রেডিট,হ্যাকারনুন এআই ইমেজ জেনারেটর প্রম্পট 'রোবট ফ্যাক্ট চেকার একটি এআই চ্যাটবটস নির্ভুলতা পরীক্ষা করতে ম্যাগনিফাই গ্লাস ব্যবহার করে।'