paint-brush
মাইক্রোসফ্টের নতুন বিং-এর ভুলগুলি: চ্যাটজিপিটি-এর মতো জেনারেটিভ মডেলগুলি কি প্রকৃত নির্ভুলতার গ্যারান্টি দিতে পারে?দ্বারা@chiayewken
1,119 পড়া
1,119 পড়া

মাইক্রোসফ্টের নতুন বিং-এর ভুলগুলি: চ্যাটজিপিটি-এর মতো জেনারেটিভ মডেলগুলি কি প্রকৃত নির্ভুলতার গ্যারান্টি দিতে পারে?

দ্বারা Chia Yew Ken12m2023/02/21
Read on Terminal Reader
Read this story w/o Javascript

অতিদীর্ঘ; পড়তে

মাইক্রোসফ্ট এআই দ্বারা চালিত নতুন বিং সার্চ ইঞ্জিন প্রকাশ করেছে, দাবি করেছে যে এটি ঐতিহ্যবাহী সার্চ ইঞ্জিনের সুযোগে বিপ্লব ঘটাবে। কথোপকথন-চালিত অনুসন্ধান ইঞ্জিনগুলির নতুন তরঙ্গে স্বাভাবিকভাবেই জটিল প্রশ্নের উত্তর দেওয়ার, অনুসন্ধানের ফলাফলগুলিকে সংক্ষিপ্ত করার এবং এমনকি একটি সৃজনশীল হাতিয়ার হিসাবে কাজ করার সম্ভাবনা রয়েছে৷ এই নিবন্ধে, আমরা Microsoft-এর নতুন Bing(https://www.bing.com/new) 9 এবং Google-এর Bard-এ বেশ কিছু বাস্তবিক ভুল উন্মোচন করেছি।
featured image - মাইক্রোসফ্টের নতুন বিং-এর ভুলগুলি: চ্যাটজিপিটি-এর মতো জেনারেটিভ মডেলগুলি কি প্রকৃত নির্ভুলতার গ্যারান্টি দিতে পারে?
Chia Yew Ken HackerNoon profile picture
0-item

লেখক: ইয়েউ কেন চিয়া, রুওচেন ঝাও, জিংজুয়ান লি, বোশেং ডিং, লিডং বিং


সম্প্রতি, কথোপকথনমূলক AI মডেল যেমন OpenAI-এর ChatGPT [1] উচ্চ-মানের লিখিত সামগ্রী তৈরি করার ক্ষমতা, মানুষের মতো কথোপকথন রাখা, বাস্তব প্রশ্নগুলির উত্তর এবং আরও অনেক কিছু করার ক্ষমতা দিয়ে জনসাধারণের কল্পনাকে ধারণ করেছে।


এই ধরনের সম্ভাবনার সাথে সজ্জিত, মাইক্রোসফ্ট এবং গুগল নতুন পরিষেবা ঘোষণা করেছে [২] যা তাদের ঐতিহ্যগত সার্চ ইঞ্জিনের সাথে একত্রিত করে।


কথোপকথন-চালিত সার্চ ইঞ্জিনের নতুন তরঙ্গে স্বাভাবিকভাবেই জটিল প্রশ্নের উত্তর দেওয়ার, সার্চের ফলাফলের সারসংক্ষেপ এবং এমনকি একটি সৃজনশীল হাতিয়ার হিসেবে কাজ করার ক্ষমতা রয়েছে।


যাইহোক, এটি করার সময়, প্রযুক্তি কোম্পানিগুলি এখন একটি বৃহত্তর নৈতিক চ্যালেঞ্জের মুখোমুখি হচ্ছে যাতে তাদের মডেলগুলি মিথ্যা, ভিত্তিহীন বা বিরোধপূর্ণ উত্তর দিয়ে ব্যবহারকারীদের বিভ্রান্ত না করে। তাই, স্বাভাবিকভাবেই প্রশ্ন জাগে: চ্যাটজিপিটি-এর মতো মডেলগুলি কি প্রকৃত নির্ভুলতার গ্যারান্টি দিতে পারে?


এই নিবন্ধে, আমরা মাইক্রোসফ্টের নতুন বিং [৯] এবং গুগলের বার্ড [৩]-এ বেশ কিছু বাস্তবিক ভুল উন্মোচন করেছি যা পরামর্শ দেয় যে তারা বর্তমানে পারে না।


দুর্ভাগ্যবশত, মিথ্যা প্রত্যাশা বিপর্যয়কর ফলাফল হতে পারে। মাইক্রোসফটের নতুন বিং ঘোষণার প্রায় একই সময়ে, গুগল তড়িঘড়ি করে বার্ড নামে একটি নতুন কথোপকথনমূলক এআই পরিষেবা ঘোষণা করেছে।


হাইপ সত্ত্বেও, প্রত্যাশাগুলি দ্রুত ভেঙ্গে যায় যখন বার্ড প্রচারমূলক ভিডিওতে একটি বাস্তবিক ভুল করে [১৪], অবশেষে গুগলের শেয়ারের দাম [৪] প্রায় ৮% হ্রাস করে এবং এর বাজার মূল্য থেকে $100 বিলিয়ন মুছে ফেলে।


অন্যদিকে, মাইক্রোসফটের নতুন বিং নিয়ে কম যাচাই-বাছাই করা হয়েছে। প্রদর্শনী ভিডিওতে [৮], আমরা দেখতে পেলাম যে নতুন বিং একজন শীর্ষ কবি হিসেবে একজন রক গায়ককে সুপারিশ করেছে, জন্ম ও মৃত্যুর তারিখ তৈরি করেছে এবং এমনকি আর্থিক প্রতিবেদনের সম্পূর্ণ সারাংশও তৈরি করেছে।


দাবিত্যাগ [৯] সত্ত্বেও যে নতুন বিং-এর প্রতিক্রিয়া সবসময় বাস্তবসম্মত নাও হতে পারে, অত্যধিক আশাবাদী অনুভূতি অনিবার্যভাবে মোহভঙ্গের দিকে নিয়ে যেতে পারে।


তাই, আমাদের লক্ষ্য হল কথোপকথন-চালিত সার্চ ইঞ্জিনগুলির মুখোমুখি হওয়া বাস্তবিক চ্যালেঞ্জগুলির প্রতি দৃষ্টি আকর্ষণ করা যাতে আমরা ভবিষ্যতে তাদের আরও ভালভাবে মোকাবেলা করতে পারি।

মাইক্রোসফ্টের নতুন বিং কী বাস্তবিক ভুলগুলি প্রদর্শন করেছে?

মাইক্রোসফ্ট এআই দ্বারা চালিত নতুন বিং সার্চ ইঞ্জিন প্রকাশ করেছে, দাবি করেছে যে এটি ঐতিহ্যবাহী সার্চ ইঞ্জিনের সুযোগে বিপ্লব ঘটাবে। এটা কি আসলেই হয়? আমরা প্রদর্শনের ভিডিও [৮] এবং উদাহরণ [৯] এর আরও গভীরে প্রবেশ করেছি এবং তিনটি প্রধান ধরণের বাস্তবিক সমস্যা খুঁজে পেয়েছি:


  • রেফারেন্স সূত্রের সাথে বিরোধের দাবি করে।


  • রেফারেন্স সূত্রে বিদ্যমান নেই এমন দাবি।


  • যে দাবিগুলির একটি রেফারেন্স উত্স নেই এবং একাধিক ওয়েব উত্সের সাথে অসামঞ্জস্যপূর্ণ৷


আর্থিক প্রতিবেদনে বানোয়াট সংখ্যা: আপনি যখন নতুন বিংকে বিশ্বাস করেন তখন সতর্ক থাকুন!


আমাদের আশ্চর্যের জন্য, নতুন বিং প্রদর্শনীতে আর্থিক প্রতিবেদনের একটি সম্পূর্ণ সারাংশ তৈরি করেছে!


যখন মাইক্রোসফ্ট এক্সিকিউটিভ ইউসুফ মেহেদি শ্রোতাদের দেখিয়েছিলেন কিভাবে গ্যাপ ইনকর্পোরেটেড 2022 Q3 ফিসকাল রিপোর্ট [10a]-এর একটি সারাংশ স্বয়ংক্রিয়ভাবে তৈরি করতে "পৃষ্ঠা থেকে কী টেকঅ্যাওয়েজ" কমান্ডটি ব্যবহার করতে হয়, তিনি নিম্নলিখিত ফলাফলগুলি পান


চিত্র 1. নতুন Bing-এর প্রেস রিলিজের মাধ্যমে Gap Inc. আর্থিক প্রতিবেদনের সারাংশ।

যাইহোক, ঘনিষ্ঠভাবে পরীক্ষা করার পর, উত্পন্ন সারাংশের সমস্ত মূল পরিসংখ্যান ভুল। আমরা বৈধ তথ্যসূত্র হিসাবে নীচের মূল আর্থিক প্রতিবেদন থেকে উদ্ধৃতাংশ দেখাব।


নতুন বিং-এর মতে, সামঞ্জস্যের পরে অপারেটিং মার্জিন ছিল 5.9%, যখন উৎস প্রতিবেদনে এটি আসলে 3.9% ছিল।


চিত্র 2. Gap Inc. অপারেটিং মার্জিনের উপর আর্থিক প্রতিবেদনের উদ্ধৃতি।


একইভাবে, শেয়ার প্রতি সামঞ্জস্য করা পাতলা আয় $0.42 হিসাবে জেনারেট হয়েছে, যখন এটি $0.71 হওয়া উচিত।


চিত্র 3. গ্যাপ ইনকর্পোরেটেড ফিসকাল রিপোর্ট শেয়ার প্রতি তরল আয়ের উদ্ধৃতি।


নেট বিক্রয়ের বিষয়ে, নতুন বিং-এর সারাংশ "নিম্ন দ্বিগুণ অঙ্কে বৃদ্ধি" দাবি করেছে, যখন মূল প্রতিবেদনে বলা হয়েছে যে "নিট বিক্রয় মধ্য-একক সংখ্যার নিচে হতে পারে"।


চিত্র 4: Gap Inc. 2022 আউটলুকের উপর আর্থিক প্রতিবেদন।


উৎস প্রতিবেদনে প্রকৃত পরিসংখ্যানের সাথে বিরোধপূর্ণ উত্পন্ন পরিসংখ্যান ছাড়াও, আমরা লক্ষ্য করি যে নতুন বিং এমন হ্যালুসিনেটেড তথ্যও তৈরি করতে পারে যা উৎসে বিদ্যমান নেই।


নতুন বিং-এর জেনারেট করা সারাংশে, "প্রায় 7% অপারেটিং মার্জিন এবং $1.60 থেকে $1.75 এর শেয়ার প্রতি পাতলা আয়" সোর্স রিপোর্টে কোথাও খুঁজে পাওয়া যায় না।


দুর্ভাগ্যবশত, পরিস্থিতি আরও খারাপ হয় যখন নতুন বিংকে নির্দেশ দেওয়া হয় "একটি টেবিলে লুলুলেমনের সাথে এটি তুলনা করার"। নতুন Bing দ্বারা উত্পন্ন আর্থিক তুলনা সারণীতে অসংখ্য ভুল রয়েছে:


চিত্র 5: প্রেস রিলিজে নতুন Bing দ্বারা উত্পন্ন তুলনা সারণী।


এই টেবিল, আসলে, অর্ধেক ভুল. সমস্ত সংখ্যার মধ্যে, Gap Inc.-এর কলামে 6টির মধ্যে 3টি ভুল, এবং Lululemon-এর ক্ষেত্রেও একই।


যেমন আগে উল্লেখ করা হয়েছে, Gap Inc.-এর প্রকৃত অপারেটিং মার্জিন হল 4.6% (বা সামঞ্জস্য করার পরে 3.9%), এবং শেয়ার প্রতি পাতলা আয় $0.77 (বা সামঞ্জস্য করার পরে $0.71) হওয়া উচিত।


নতুন বিং আরও দাবি করেছে যে গ্যাপ ইনকর্পোরেটেডের নগদ এবং নগদ সমতুল্য $1.4 বিলিয়ন, যখন এটি আসলে $679 মিলিয়ন।

চিত্র 6: গ্যাপ ইনকর্পোরেটেডের আর্থিক প্রতিবেদনের নগদ অংশ।


Lululemon এর 2022 Q3 ফিসকাল রিপোর্ট [10b] অনুসারে, গ্রস মার্জিন 55.9% হওয়া উচিত, যখন নতুন Bing দাবি করেছে যে এটি 58.7%।


অপারেটিং মার্জিন 19.0% হওয়া উচিত, যখন নতুন Bing এটি 20.7% বলে দাবি করে৷ শেয়ার প্রতি পাতলা আয় প্রকৃতপক্ষে $2.00 ছিল, যখন নতুন Bing দাবি করে যে এটি $1.65।


চিত্র 7: Lululemon 2022 Q3 আর্থিক প্রতিবেদনের অংশ।


তাহলে, এই পরিসংখ্যান কোথা থেকে এসেছে? আপনি হয়তো ভাবছেন যে এটি এমন একটি সংখ্যা যা মূল নথির অন্য অংশ থেকে ভুলভাবে স্থানান্তরিত হয়েছে। উত্তর হল না। কৌতূহলজনকভাবে, এই সংখ্যাগুলি মূল নথিতে কোথাও পাওয়া যায় না এবং সম্পূর্ণরূপে বানোয়াট।


প্রকৃতপক্ষে, জেনারেটিভ মডেলের আউটপুটগুলিকে আরও বাস্তবিকভাবে ভিত্তি করার জন্য এটি এখনও একটি উন্মুক্ত গবেষণা চ্যালেঞ্জ।


স্পষ্টভাবে বলতে গেলে, ChatGPT-এর মতো জনপ্রিয় জেনারেটিভ এআই মডেলগুলি উৎস থেকে সত্যগুলি কঠোরভাবে অনুলিপি এবং আটকানোর পরিবর্তে একটি নির্দিষ্ট শব্দভাণ্ডার থেকে তৈরি করার জন্য শব্দ চয়ন করছে।


তাই, বাস্তবিক শুদ্ধতা জেনারেটিভ এআই-এর সহজাত চ্যালেঞ্জগুলির মধ্যে একটি এবং বর্তমান মডেলগুলির সাথে কঠোরভাবে নিশ্চিত করা যায় না। সার্চ ইঞ্জিনের ক্ষেত্রে এটি একটি প্রধান উদ্বেগের বিষয় কারণ ব্যবহারকারীরা নির্ভরযোগ্য ফলাফলের উপর নির্ভর করে এবং বাস্তবসম্মতভাবে সঠিক।


জাপানের শীর্ষ কবি: গোপনে একজন রক গায়ক?


চিত্র 8: প্রেস রিলিজে নতুন বিং দ্বারা তৈরি শীর্ষ জাপানি কবিদের সারাংশ।


আমরা লক্ষ্য করি যে নতুন Bing শুধুমাত্র সংখ্যার জন্য নয় বরং নির্দিষ্ট সত্তার ব্যক্তিগত বিবরণের জন্যও বাস্তবিক ভুল তৈরি করে, যেমনটি উপরের প্রতিক্রিয়ায় দেখানো হয়েছে যখন নতুন বিংকে "শীর্ষ জাপানী কবি" সম্পর্কে জিজ্ঞাসা করা হয়েছিল।


উত্পন্ন জন্ম তারিখ, মৃত্যু, এবং পেশা প্রকৃতপক্ষে উল্লেখিত উৎসের সাথে সাংঘর্ষিক। উইকিপিডিয়া [১১এ] এবং আইএমডিবি [১১এ] অনুসারে, এরিকো কিশিদা 1929 সালে জন্মগ্রহণ করেছিলেন এবং 2011 সালে মারা যান। তিনি একজন নাট্যকার এবং প্রাবন্ধিক ছিলেন না, কিন্তু একজন শিশু বইয়ের লেখক এবং অনুবাদক ছিলেন।


চিত্র 9. এরিকো কিশিদার উইকিপিডিয়া পৃষ্ঠা (জার্মান থেকে অনুবাদিত পৃষ্ঠা)।

নতুন বিং ভুল করতে থাকে যখন এটি গ্যাকটকে একজন শীর্ষ জাপানি কবি হিসাবে ঘোষণা করে যখন তিনি প্রকৃতপক্ষে জাপানের একজন বিখ্যাত রকস্টার। উইকিপিডিয়া সূত্র [11b] অনুসারে, তিনি একজন অভিনেতা, সঙ্গীতশিল্পী এবং গায়ক। উৎসে তার কোনো ধরনের কবিতা প্রকাশের কোনো তথ্য নেই।

চিত্র 10. গ্যাকটের উইকিপিডিয়া পৃষ্ঠা।

বিং এর নাইটক্লাবের সুপারিশ অনুসরণ করছেন? আপনি একটি বন্ধ দরজা সম্মুখীন হতে পারে.


তদুপরি, নতুন বিং মেক্সিকো সিটিতে যাওয়ার সম্ভাব্য নাইটক্লাবগুলির একটি তালিকা তৈরি করেছে যখন জিজ্ঞাসা করা হয়েছিল "নাইটলাইফ কোথায়?" উদ্বেগজনকভাবে, প্রায় সব ক্লাবের খোলার সময় ভুলভাবে তৈরি করা হয়েছে:


চিত্র 11. মেক্সিকো সিটিতে রাত্রিজীবনের পরামর্শ প্রেস রিলিজে নতুন Bing দ্বারা তৈরি করা হয়েছে।


আমরা একাধিক উত্সের সাথে খোলার সময়গুলি ক্রস-চেক করেছি, যা নিবন্ধের শেষে যুক্ত করা হয়েছে। El Almacen [12a] আসলে মঙ্গলবার থেকে রবিবার সন্ধ্যা 7:00 থেকে 3:00 পর্যন্ত খোলা থাকে, নতুন Bing দাবি করে যে এটি "মঙ্গলবার থেকে রবিবার বিকেল 5:00 থেকে রাত 11:00 পর্যন্ত খোলা"।


এল মারারা [১২বি] আসলে বৃহস্পতিবার থেকে শনিবার পর্যন্ত সন্ধ্যা 6:00 টা থেকে 2:30 টা পর্যন্ত খোলা থাকে, কিন্তু "বৃহস্পতিবার থেকে রবিবার সন্ধ্যা 6:00 টা থেকে 3:00 পর্যন্ত খোলা" বলে দাবি করা হয়।


Guadalajara de Noche [12c] প্রতিদিন বিকেল 5:30 টা থেকে 1:30 বা 12:30 টা পর্যন্ত খোলা থাকে, যখন নতুন Bing দাবি করে যে এটি "প্রতিদিন রাত 8:00 থেকে 3:00 টা পর্যন্ত খোলা"।


খোলার সময় ছাড়াও, নতুন Bing দ্বারা উল্লিখিত পর্যালোচনা তারা এবং সংখ্যার প্রায় সমস্ত বিবরণ ভুল। Yelp, Tripadvisor, বা Google Maps-এ অনুসন্ধান করা সত্ত্বেও ম্যাচিং রিভিউ স্কোর পাওয়া যাবে না।


উপরে উল্লিখিত কেসগুলি ছাড়াও, আমরা তাদের প্রদর্শন ভিডিওতে অন্যান্য সমস্যাও পেয়েছি, যেমন পণ্যের দামের অমিল, স্টোরের ঠিকানা ত্রুটি এবং সময়-সম্পর্কিত ভুল। আপনি আগ্রহী হলে তাদের যাচাই করতে স্বাগত জানাই.

লিমিটেড বিং ডেমোতে সম্ভাব্য উদ্বেগ

যদিও নতুন Bing সার্চ ইঞ্জিন এখনও সম্পূর্ণরূপে অ্যাক্সেসযোগ্য নয়, আমরা মাইক্রোসফ্ট দ্বারা প্রদত্ত কয়েকটি প্রদর্শন উদাহরণ [9] পরীক্ষা করতে পারি। ঘনিষ্ঠভাবে পরীক্ষা করার পরে, এমনকি এই চেরি-বাছাই করা উদাহরণগুলি বাস্তবিক ভিত্তির সম্ভাব্য সমস্যাগুলি দেখায়।


"আমি আমার বাচ্চার সাথে কি শিল্প ধারণা করতে পারি?" শিরোনামের ডেমোতে, নতুন বিং প্রতিটি সুপারিশের জন্য ক্রাফটিং উপকরণগুলির একটি অপর্যাপ্ত তালিকা তৈরি করেছে [13]।


উদাহরণস্বরূপ, একটি কার্ডবোর্ড বক্স গিটার তৈরির পরামর্শ দেওয়ার সময়, এটি সরবরাহগুলি তালিকাভুক্ত করে: "একটি টিস্যু বক্স, একটি কার্ডবোর্ড টিউব, কিছু রাবার ব্যান্ড, পেইন্ট এবং আঠা"।


যাইহোক, এটি উদ্ধৃত ওয়েবসাইট [13a] দ্বারা প্রস্তাবিত নির্মাণ কাগজ, কাঁচি, ওয়াশি টেপ, ফোম স্টিকার এবং কাঠের পুঁতি অন্তর্ভুক্ত করতে ব্যর্থ হয়েছে।


আরেকটি সম্ভাব্য উদ্বেগ হল যে নতুন Bing এমন সামগ্রী তৈরি করেছে যার রেফারেন্স উত্সগুলিতে কোনও বাস্তব ভিত্তি নেই, 12টি প্রদর্শন উদাহরণ জুড়ে কমপক্ষে 21 বার৷


তথ্যগত ভিত্তির অভাব এবং উত্সগুলির একটি সম্পূর্ণ তালিকা উদ্ধৃত করতে ব্যর্থতা ব্যবহারকারীদের নতুন Bing এর বিশ্বস্ততা নিয়ে প্রশ্ন তুলতে পারে।

গুগলের বার্ড কী বাস্তবিক ভুলগুলি প্রদর্শন করেছিল?

গুগল বার্ড [৩] নামে একটি কথোপকথনমূলক এআই পরিষেবাও উন্মোচন করেছে । প্রথাগত অনুসন্ধানের প্রশ্নে টাইপ করার পরিবর্তে, ব্যবহারকারীরা ওয়েব-চালিত চ্যাটবটের সাথে একটি নৈমিত্তিক এবং তথ্যপূর্ণ কথোপকথন করতে পারে।


উদাহরণস্বরূপ, একজন ব্যবহারকারী প্রাথমিকভাবে স্টারগেজিংয়ের জন্য সেরা নক্ষত্রপুঞ্জ সম্পর্কে জিজ্ঞাসা করতে পারে এবং তারপর সেগুলি দেখার জন্য বছরের সেরা সময় সম্পর্কে জিজ্ঞাসা করে অনুসরণ করতে পারে। যাইহোক, একটি স্পষ্ট দাবিত্যাগ হল যে বার্ড "ভুল বা অনুপযুক্ত তথ্য" দিতে পারে।


আসুন তাদের টুইটার পোস্ট [১৪] এবং ভিডিও প্রদর্শনে [১৫] বার্ডের প্রকৃত নির্ভুলতা তদন্ত করি।

চিত্র 12. ডেমোতে বার্ড দ্বারা উত্পন্ন টেলিস্কোপ আবিষ্কারের সারাংশ।


গুগলের সিইও সুন্দর পিচাই সম্প্রতি বার্ডের ক্ষমতা প্রদর্শনের জন্য একটি ছোট ভিডিও [১৪] পোস্ট করেছেন। যাইহোক, উত্তরটিতে একটি ত্রুটি রয়েছে যে টেলিস্কোপটি প্রথম এক্সোপ্ল্যানেট চিত্রগুলি ধারণ করেছিল, যা জ্যোতির্পদার্থবিদদের দ্বারা দ্রুত নির্দেশ করা হয়েছিল [16a]।


NASA [16b] দ্বারা নিশ্চিত করা হয়েছে, একটি এক্সোপ্ল্যানেটের প্রথম ছবিগুলি জেমস ওয়েব স্পেস টেলিস্কোপের (JWST) পরিবর্তে ভেরি লার্জ টেলিস্কোপ (VLT) দ্বারা ধারণ করা হয়েছিল।


দুর্ভাগ্যবশত, বার্ড একটি ব্যয়বহুল পরীক্ষায় পরিণত হয়েছিল কারণ বাস্তবিক ভুলের খবর প্রকাশিত হওয়ার পর Google-এর স্টক মূল্য তীব্রভাবে হ্রাস পেয়েছিল [৪]।

চিত্র 13. ডেমোতে বার্ড দ্বারা উত্পন্ন নক্ষত্রপুঞ্জের দৃশ্যমানতার উত্তর।


বার্ডের ভিডিও প্রদর্শনের বিষয়ে, উপরের চিত্রটি দেখায় যে কীভাবে Google-এর বার্ড নক্ষত্রপুঞ্জগুলি দৃশ্যমান হয় সেই প্রশ্নের উত্তর দেয় [16]। যাইহোক, ওরিয়নের সময় একাধিক সূত্রের সাথে অসামঞ্জস্যপূর্ণ।


শীর্ষ Google অনুসন্ধান ফলাফল [17a] অনুসারে, নক্ষত্রমণ্ডলটি জানুয়ারি থেকে মার্চ পর্যন্ত সবচেয়ে বেশি দেখা যায়। উইকিপিডিয়া [১৭বি] অনুসারে, এটি জানুয়ারি থেকে এপ্রিল পর্যন্ত সবচেয়ে বেশি দেখা যায়।


তদ্ব্যতীত, উত্তরটি অসম্পূর্ণ কারণ নক্ষত্রমণ্ডলের দৃশ্যমানতা ব্যবহারকারীর উত্তর বা দক্ষিণ গোলার্ধের উপর নির্ভর করে।

চিত্র 14. নক্ষত্রপুঞ্জের দৃশ্যমানতার উপর Google অনুসন্ধানের ফলাফল।

বিং এবং বার্ড কিভাবে তুলনা করে?

নতুন Bing এবং Bard পরিষেবাগুলি অনুশীলনে সমানভাবে বিশ্বাসযোগ্য নাও হতে পারে৷ এটি অনুসন্ধান ফলাফলের গুণমান, কথোপকথনমূলক মডেলের গুণমান এবং প্রদত্ত উত্তরগুলির স্বচ্ছতার মতো কারণগুলির কারণে।


বর্তমানে, উভয় পরিষেবাই তাদের কথোপকথনমূলক এআই মডেলগুলির প্রতিক্রিয়া নির্দেশ করার জন্য প্রাসঙ্গিক তথ্য উত্সের উপর নির্ভর করে।


সুতরাং, উত্তরগুলির প্রকৃত নির্ভুলতা তথ্য পুনরুদ্ধার সিস্টেমের মানের উপর নির্ভর করে [18], এবং কথোপকথনমূলক মডেল কতটা ভাল উত্তর তৈরি করতে পারে যা তথ্যের উত্সের উপর ভিত্তি করে।


যেহেতু পরিষেবাগুলির সম্পূর্ণ বিবরণ জনসাধারণের কাছে প্রকাশ করা হয় না, এটি অস্পষ্ট যে কোনটি গভীর পরীক্ষা ছাড়াই উচ্চতর বাস্তব নির্ভুলতা অর্জন করতে পারে। অন্যদিকে, আমরা অনুভব করি যে স্বচ্ছতা বিশ্বাসযোগ্যতার মতোই গুরুত্বপূর্ণ।


উদাহরণস্বরূপ, আমরা লক্ষ্য করি যে নতুন Bing এর উত্তরগুলির উত্স সম্পর্কে আরও স্বচ্ছ, কারণ এটি বেশিরভাগ ক্ষেত্রে রেফারেন্স লিঙ্ক সরবরাহ করে। এটি ব্যবহারকারীদের স্বাধীনভাবে ফ্যাক্ট-চেকিং পরিচালনা করতে সক্ষম করে এবং আমরা আশা করি ভবিষ্যতে কথোপকথন পরিষেবাগুলিও এই বৈশিষ্ট্যটি প্রদান করবে।

কিভাবে বাস্তবিক সীমাবদ্ধতা সম্বোধন করা যেতে পারে?

উপরে দেখানো অসংখ্য বাস্তবিক ভুলের মাধ্যমে, এটা স্পষ্ট যে ChatGPT-এর মতো কথোপকথনমূলক এআই মডেলগুলি নির্ভরযোগ্য সূত্রের সাথে উপস্থাপন করা হলেও পরস্পরবিরোধী বা অস্তিত্বহীন তথ্য তৈরি করতে পারে।


পূর্বে উল্লিখিত হিসাবে, চ্যাটজিপিটি-এর মতো মডেলগুলির বাস্তব ভিত্তি নিশ্চিত করা এটি একটি গুরুত্বপূর্ণ গবেষণা চ্যালেঞ্জ।


তাদের উত্পাদিত প্রকৃতির কারণে, তাদের আউটপুট নিয়ন্ত্রণ করা কঠিন [১৯] এবং এমনকি উত্পন্ন আউটপুট তথ্য উত্সের সাথে বাস্তবসম্মতভাবে সামঞ্জস্যপূর্ণ তা নিশ্চিত করা কঠিন।


একটি স্বল্পমেয়াদী সমাধান হতে পারে কথোপকথনমূলক এআইকে অনিরাপদ বা অবাস্তব আউটপুট তৈরি করা থেকে বিরত রাখতে বিধিনিষেধ আরোপ করা। যাইহোক, দূষিত পক্ষগুলি অবশেষে নিরাপত্তা বিধিনিষেধগুলিকে বাইপাস করতে পারে [7], যখন সত্য যাচাইকরণ [20] আরেকটি অমীমাংসিত গবেষণা চ্যালেঞ্জ।


দীর্ঘ মেয়াদে, আমাদের হয়তো মেনে নিতে হবে যে মানুষ এবং যন্ত্র লেখকরা একইভাবে অসিদ্ধ থাকবে। আরও বিশ্বস্ত AI-এর দিকে অগ্রসর হতে, ChatGPT-এর মতো কথোপকথনমূলক AI মডেলগুলি অস্পষ্ট ব্ল্যাক বক্স হিসাবে থাকতে পারে না [২১]।


তাদের ডেটা উত্স এবং সম্ভাব্য পক্ষপাত সম্পর্কে তাদের সম্পূর্ণ স্বচ্ছ হওয়া উচিত, তাদের উত্তরগুলিতে কম আস্থা থাকলে রিপোর্ট করা উচিত এবং তাদের যুক্তি প্রক্রিয়াগুলি ব্যাখ্যা করা উচিত।

চ্যাটজিপিটি-এর মতো মডেলগুলির জন্য ভবিষ্যত কী ধারণ করে?

একটি পদ্ধতিগত ওভারভিউ করার পরে, আমরা ChatGPT-এর মতো কথোপকথনমূলক AI দ্বারা চালিত অনুসন্ধান ইঞ্জিনগুলির নতুন তরঙ্গ দ্বারা প্রদর্শিত উল্লেখযোগ্য ঘটনাগত সীমাবদ্ধতা খুঁজে পেয়েছি।


সিদ্ধান্ত নেওয়ার আগে আমাদের রায় ব্যবহার করার জন্য সম্ভাব্য তথ্যগত ভুলতা এবং সতর্কতার দাবি অস্বীকার করা সত্ত্বেও, আমরা এমনকি চেরি-বাছাই করা বিক্ষোভেও অনেক বাস্তবিক ভুলের সম্মুখীন হয়েছি।


সুতরাং, আমরা সাহায্য করতে পারি না কিন্তু আশ্চর্য হই: সার্চ ইঞ্জিনের উদ্দেশ্য কী, যদি নির্ভরযোগ্য এবং বাস্তবসম্মত উত্তর না দেওয়া হয়? এআই-জেনারেটেড ফ্যাব্রিকেশনে ভরা ওয়েবের একটি নতুন যুগে, আমরা কীভাবে সত্যতা নিশ্চিত করব?


মাইক্রোসফ্ট এবং গুগলের মতো টেক জায়ান্টগুলির বিশাল সংস্থান থাকা সত্ত্বেও, বর্তমান ChatGPT-এর মতো মডেলগুলি প্রকৃত নির্ভুলতা নিশ্চিত করতে পারে না। তবুও, আমরা এখনও কথোপকথনমূলক মডেলগুলির সম্ভাবনা এবং আরও বিশ্বস্ত AI এর বিকাশ সম্পর্কে আশাবাদী।


চ্যাটজিপিটি-এর মতো মডেলগুলি দুর্দান্ত সম্ভাবনা দেখিয়েছে এবং নিঃসন্দেহে আমাদের দৈনন্দিন জীবনের অনেক শিল্প এবং দিকগুলিকে উন্নত করবে। যাইহোক, যদি তারা বানোয়াট বিষয়বস্তু এবং অবাস্তব উত্তর তৈরি করতে থাকে, তাহলে জনসাধারণ কৃত্রিম বুদ্ধিমত্তা সম্পর্কে আরও সতর্ক হয়ে উঠতে পারে।


তাই, নির্দিষ্ট মডেল বা কোম্পানির সমালোচনা না করে, আমরা গবেষক এবং ডেভেলপারদের AI পরিষেবার স্বচ্ছতা এবং বাস্তবিক সঠিকতার উন্নতির দিকে মনোযোগ দেওয়ার জন্য আহ্বান জানাব, যাতে মানুষ অদূর ভবিষ্যতে নতুন প্রযুক্তির উপর উচ্চ স্তরের আস্থা রাখতে পারে।

সূত্র

রেফারেন্স নিবন্ধ

[১] চ্যাটজিপিটি: সংলাপের জন্য ভাষার মডেল অপ্টিমাইজ করা: https://openai.com/blog/chatgpt/

[2] Bing, Bard, এবং AI অনুসন্ধানের ভবিষ্যত 7টি সমস্যার সম্মুখীন: https://www.theverge.com/2023/2/9/23592647/ai-search-bing-bard-chatgpt-microsoft-google-problems - চ্যালেঞ্জ

[৩] গুগল: আমাদের এআই যাত্রার একটি গুরুত্বপূর্ণ পরবর্তী ধাপ: https://blog.google/technology/ai/bard-google-ai-search-updates/

[৪] গুগলের বার্ড এআই বট ভুলের কারণে $100 বিলিয়ন শেয়ার বন্ধ হয়ে গেছে: https://www.bbc.com/news/business-64576225

[৫] নতুন এআই-চালিত মাইক্রোসফ্ট বিং এবং এজ দিয়ে অনুসন্ধান পুনরুদ্ধার করা, ওয়েবের জন্য আপনার সহ-পাইলট: https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new- AI-চালিত-মাইক্রোসফ্ট-বিং-এন্ড-এজ-আপনার-কপিলট-ওয়েবের জন্য/

[৬] কোম্পানির এআই চ্যাটবট ডেমো চলাকালীন একটি ত্রুটি করার পরে Google শেয়ারগুলি $100 বিলিয়ন হারায়: https://www.cnn.com/2023/02/08/tech/google-ai-bard-demo-error

[৭] হ্যাকাররা এমন একটি পরিষেবা বিক্রি করছে যা ম্যালওয়্যারের উপর চ্যাটজিপিটি বিধিনিষেধকে বাইপাস করে: https://arstechnica.com/information-technology/2023/02/now-open-fee-based-telegram-service-that-uses-chatgpt-to -জেনারেট-ম্যালওয়্যার/


নতুন Bing ফ্যাক্ট যাচাইকরণ সূত্র:

[৮] মাইক্রোসফটের প্রেস রিলিজ ভিডিও ( https://www.youtube.com/watch?v=rOeRWRJ16yY )

[৯] মাইক্রোসফটের ডেমো পেজ : ( https://www.bing.com/new )

নতুন বিং এবং আর্থিক প্রতিবেদন:

[১০ ক] গ্যাপ ইনকর্পোরেটেড ফিসকাল রিপোর্ট ভিডিওতে দেখানো হয়েছে: https://s24.q4cdn.com/508879282/files/doc_financials/2022/q3/3Q22-EPR-FINAL-with-Tables.pdf

[১০বি] তাদের অফিসিয়াল ওয়েবসাইটে লুলুলেমন ফিসকাল রিপোর্ট পাওয়া গেছে: https://corporate.lululemon.com/media/press-releases/2022/12-08-2022-210558496#:\~:text=2022 সালের তৃতীয় প্রান্তিকের জন্য তৃতীয়টির তুলনায় %2C, %2C এবং আন্তর্জাতিকভাবে 41%25 বৃদ্ধি পেয়েছে

নতুন বিং এবং জাপানি কবি:

[১১এ] এরিকো কিশিদা: উইকিপিডিয়া ( https://twitter.com/sundarpichai/status/1622673369480204288 ), IMDB ( https://www.imdb.com/name/nm1063814/ )

[১১বি] গ্যাকেট: উইকিপিডিয়া ( https://en.wikipedia.org/wiki/Gackt )

মেক্সিকোতে নতুন বিং এবং নাইটক্লাব:

[12a] এল আলমাসেন: Google মানচিত্র ( https://goo.gl/maps/3BL27XgWpDVzLLnaA ), রেস্টুরেন্ট গুরু ( https://restaurantguru.com/El-Almacen-Mexico-City )

[12b] এল মারা: গুগল ম্যাপ ( https://goo.gl/maps/HZFe8xY7uTk1SB6s5 ), রেস্টুরেন্ট গুরু ( https://restaurantguru.com/El-Marra-Mexico-City )

[ 12c ] গুয়াদালাজারা দে নোচে: ট্রিপ্যাডভাইসর ( https://www.tripadvisor.es/Attraction_Review-g150800-d3981435-Reviews-Guadalajara_de_Noche-Mexico_City_Central_Mexico_and_Gulfs_goast/Gulfps_goast/Gulfs_gost/ 1EeJZFP7wZYA )

[১৩] নতুন বিং এবং নৈপুণ্যের ধারণা ( https://www.bing.com/search?q=শিল্প ও কারুশিল্পের ধারণা, শুধুমাত্র কার্ডবোর্ডের বাক্স, প্লাস্টিকের বোতল, কাগজ এবং স্ট্রিং&iscopilotedu=1&form=MA13G7 ব্যবহার করে বাচ্চাদের জন্য নির্দেশাবলী সহ ) :

[১৩এ] উদ্ধৃত ওয়েবসাইট: হ্যাপি টডলার প্লেটাইম ( https://happytoddlerplaytime.com/cardboard-box-guitar-craft-for-kids/ )


বার্ড ফ্যাক্ট যাচাইকরণ সূত্র:

[১৪] প্রচারমূলক ব্লগ ( https://twitter.com/sundarpichai/status/1622673369480204288 ) এবং ভিডিও ( https://twitter.com/sundarpichai/status/1622673775182626818 )

[১৫] ভিডিও প্রদর্শন ( https://www.youtube.com/watch?v=yLWXJ22LUEc )

কোন টেলিস্কোপ প্রথম এক্সোপ্ল্যানেটের ছবি ধারণ করেছিল

গ্রান্ট ট্রেম্বলে (আমেরিকান অ্যাস্ট্রোফিজিসিস্ট) দ্বারা টুইটার ( https://twitter.com/astrogrant/status/1623091683603918849 )

[16b] NASA: 2M1207 b — একটি এক্সোপ্ল্যানেটের প্রথম ছবি ( https://exoplanets.nasa.gov/resources/300/2m1207-b-first-image-of-an-exoplanet/ )

যখন নক্ষত্রমণ্ডলী দেখা যায়

[17a] Google ( https://www.google.com/search?client=safari&rls=en&q=when+is+orion+visible&ie=UTF-8&oe=UTF-8 ) শীর্ষ ফলাফল: Byju's ( https://byjus. com/question-answer/in-which-season-of-the-year-is-the-constellation-orion-visible-in-the-sky/ )

[17b] উইকিপিডিয়া পৃষ্ঠা "ওরিয়ন (নক্ষত্রমণ্ডল)": https://en.wikipedia.org/wiki/Orion_(নক্ষত্রমণ্ডল)


একাডেমিক রেফারেন্স

[১৮] তথ্য পুনরুদ্ধারের একটি ভূমিকা: https://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf

[১৯] পাঠ্যের নিয়ন্ত্রিত প্রজন্মের দিকে: http://proceedings.mlr.press/v70/hu17e/hu17e.pdf

[২০] জ্বর: ফ্যাক্ট এক্সট্রাকশন এবং ভেরিফিকেশনের জন্য একটি বড় মাপের ডেটাসেট: https://aclanthology.org/N18-1074.pdf

[২১] ব্ল্যাক-বক্সের ভিতরে উঁকি দেওয়া: ব্যাখ্যাযোগ্য কৃত্রিম বুদ্ধিমত্তার উপর একটি সমীক্ষা (XAI): https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8466590


ইমেজ ক্রেডিট,হ্যাকারনুন এআই ইমেজ জেনারেটর প্রম্পট 'রোবট ফ্যাক্ট চেকার একটি এআই চ্যাটবটস নির্ভুলতা পরীক্ষা করতে ম্যাগনিফাই গ্লাস ব্যবহার করে।'