paint-brush
ChatGPT কি ভবিষ্যৎ ভবিষ্যদ্বাণী করতে পারে?দ্বারা@precedent
নতুন ইতিহাস

ChatGPT কি ভবিষ্যৎ ভবিষ্যদ্বাণী করতে পারে?

দ্বারা Precedent Publishing House8m2025/03/18
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

এই গবেষণায় ChatGPT-3.5 এবং ChatGPT-4 এর পূর্বাভাস ক্ষমতা পরীক্ষা করা হয়েছে সরাসরি ভবিষ্যদ্বাণী প্রম্পটগুলিকে গল্প বলার উপর ভিত্তি করে প্রম্পটের সাথে তুলনা করে। ফলাফল দেখায় যে ChatGPT-4 ভবিষ্যতের আখ্যান তৈরি করতে বলা হলে উল্লেখযোগ্যভাবে আরও সঠিক, বিশেষ করে অর্থনৈতিক প্রবণতা এবং সাংস্কৃতিক ঘটনাগুলির পূর্বাভাস দেওয়ার ক্ষেত্রে। এটি পরামর্শ দেয় যে আখ্যান-চালিত AI প্রতিক্রিয়াগুলি LLM-এর মধ্যে সুপ্ত ভবিষ্যদ্বাণীমূলক ক্ষমতাগুলি উন্মোচন করতে পারে।
featured image - ChatGPT কি ভবিষ্যৎ ভবিষ্যদ্বাণী করতে পারে?
Precedent Publishing House HackerNoon profile picture
0-item

লেখক:

(১) ফাম হোয়াং ভ্যান, অর্থনীতি বিভাগ, বেইলর বিশ্ববিদ্যালয় ওয়াকো, টেক্সাস, মার্কিন যুক্তরাষ্ট্র (Van Pham@baylor.edu);

(২) স্কট কানিংহাম, অর্থনীতি বিভাগ, বেইলর বিশ্ববিদ্যালয় ওয়াকো, টেক্সাস, মার্কিন যুক্তরাষ্ট্র (Scott Cunningham@baylor.edu)।

লিঙ্কের তালিকা

সারাংশ এবং ১ ভূমিকা

২ প্রত্যক্ষ বনাম আখ্যান ভবিষ্যদ্বাণী

৩ প্রম্পটিং পদ্ধতি এবং তথ্য সংগ্রহ

৪টি ফলাফল

৪.১ জালিয়াতির মাধ্যমে প্রশিক্ষণ তথ্য সীমা নির্ধারণ করা

৪.২ ২০২২ সালের একাডেমি পুরষ্কারের পূর্বাভাসের ফলাফল

৫টি সামষ্টিক অর্থনৈতিক পরিবর্তনশীলের পূর্বাভাস দেওয়া

৫.১ অর্থনীতির অধ্যাপকের সাথে মুদ্রাস্ফীতির পূর্বাভাস দেওয়া

৫.২ ফেড চেয়ারম্যান জেরোম পাওয়েল এর সাথে মুদ্রাস্ফীতির পূর্বাভাস

৫.৩ জেরোম পাওয়েলের সাথে মুদ্রাস্ফীতির পূর্বাভাস এবং ইউক্রেনে রাশিয়ার আক্রমণের প্ররোচনা

৫.৪ অর্থনীতির অধ্যাপকের সাথে বেকারত্বের পূর্বাভাস দেওয়া

বর্ণনামূলক আকারে ChatGPT-4 এর ভবিষ্যদ্বাণীমূলক ক্ষমতা সম্পর্কে ৬টি অনুমান

৭ উপসংহার এবং স্বীকৃতি


পরিশিষ্ট

ক. পূর্বাভাসিত একাডেমি পুরস্কার বিজয়ীদের বিতরণ

খ. পূর্বাভাসিত সামষ্টিক অর্থনৈতিক চলকের বন্টন


তথ্যসূত্র

সারাংশ

এই গবেষণায় দেখা গেছে যে OpenAI-এর ChatGPT-3.5 এবং ChatGPT-4 দুটি স্বতন্ত্র প্রম্পটিং কৌশল ব্যবহার করে ভবিষ্যতের ঘটনাগুলির সঠিকভাবে পূর্বাভাস দিতে পারে কিনা। ভবিষ্যদ্বাণীগুলির নির্ভুলতা মূল্যায়ন করার জন্য, আমরা এই সত্যটি কাজে লাগাই যে পরীক্ষার সময় প্রশিক্ষণের তথ্য ২০২১ সালের সেপ্টেম্বরে বন্ধ হয়ে গিয়েছিল এবং ChatGPT-3.5 এবং ChatGPT-4 ব্যবহার করে ২০২২ সালে ঘটে যাওয়া ঘটনাগুলি সম্পর্কে জিজ্ঞাসা করি। আমরা দুটি প্রম্পটিং কৌশল ব্যবহার করেছি: সরাসরি ভবিষ্যদ্বাণী এবং আমরা যাকে ভবিষ্যতের আখ্যান বলি যা ChatGPT-কে ভবিষ্যতে সেট করা কাল্পনিক গল্প বলতে বলে এমন চরিত্রগুলির সাথে যারা তাদের সাথে ঘটে যাওয়া ঘটনাগুলি ভাগ করে নেয়, কিন্তু ChatGPT-এর প্রশিক্ষণের তথ্য সংগ্রহের পরে। ২০২২ সালের ঘটনাগুলিতে মনোনিবেশ করে, আমরা ChatGPT-কে গল্প বলার জন্য উৎসাহিত করেছি, বিশেষ করে অর্থনৈতিক প্রেক্ষাপটে। ১০০টি প্রম্পট বিশ্লেষণ করার পর, আমরা আবিষ্কার করেছি যে ভবিষ্যতের আখ্যানের প্রম্পট ChatGPT-4-এর পূর্বাভাসের নির্ভুলতা উল্লেখযোগ্যভাবে উন্নত করেছে। এটি বিশেষ করে প্রধান একাডেমি পুরস্কার বিজয়ীদের ভবিষ্যদ্বাণী এবং অর্থনৈতিক প্রবণতার ক্ষেত্রে স্পষ্ট ছিল, পরবর্তীটি এমন পরিস্থিতি থেকে অনুমান করা হয়েছিল যেখানে মডেলটি ফেডারেল রিজার্ভ চেয়ারম্যান জেরোম পাওয়েলের মতো জনসাধারণের ব্যক্তিত্বের ছদ্মবেশ ধারণ করেছিল। এই ফলাফলগুলি ইঙ্গিত দেয় যে আখ্যান মডেলগুলির হ্যালুসিনেটরি আখ্যান নির্মাণের ক্ষমতাকে কাজে লাগাতে প্ররোচিত করে, যা সরল ভবিষ্যদ্বাণীর চেয়ে আরও কার্যকর ডেটা সংশ্লেষণ এবং এক্সট্রাপোলেশনকে সহজতর করে। আমাদের গবেষণা LLM-এর ভবিষ্যদ্বাণীমূলক ক্ষমতার নতুন দিক প্রকাশ করে এবং বিশ্লেষণাত্মক প্রেক্ষাপটে সম্ভাব্য ভবিষ্যতের প্রয়োগের পরামর্শ দেয়।

১ ভূমিকা

কৃত্রিম বুদ্ধিমত্তার দ্রুত প্রযুক্তিগত অগ্রগতি এর ব্যবহারের ক্ষেত্রে আমাদের বোধগম্যতাকে ছাড়িয়ে গেছে। OpenAI-এর GPT-4-এর মতো বৃহৎ ভাষা মডেল (LLM) বুদ্ধিমান মানুষের বক্তৃতা অনুকরণ করতে পারে এবং জ্ঞানীয়ভাবে ব্যয়বহুল কাজ সম্পাদন করতে পারে যা কর্মীদের প্রান্তিক পণ্যগুলিকে পরিবর্তন করে, তবে এই কাজগুলির নাগাল স্পষ্ট নয়। নীতিগতভাবে, যেহেতু এই মডেলগুলি ভবিষ্যদ্বাণীমূলক যন্ত্র, তাই তারা মানুষকে একটি নতুন পূর্বাভাস যন্ত্র সরবরাহ করতে পারে (Agrawal et al., 2018)। কিন্তু এগুলি কতটা সঠিক তা আংশিকভাবে অজানা কারণ এই নতুন প্রযুক্তিগুলি এমনকি এর নির্মাতারাও খুব কম বোঝেন বলে মনে হয়।


LLM-এর বর্তমান অগ্রভাগের মেরুদণ্ড হল জেনারেটিভ প্রি-ট্রেনড ট্রান্সফরমার বা GPT নামক একটি স্থাপত্য। এই স্থাপত্য স্ব-মনোযোগ প্রক্রিয়ার মাধ্যমে জটিল টেক্সট সম্পর্ক ধারণ করে প্রাকৃতিক ভাষা প্রক্রিয়াকরণে (NLP) বিপ্লব ঘটিয়েছে (Vaswani et al., 2017)। OpenAI-এর GPT-3.5 প্রবর্তন 2022 সালের নভেম্বরে এবং এর উত্তরসূরী, GPT-4, 2023 সালের মার্চ মাসে GPT-এর বিবর্তনে উল্লেখযোগ্য মাইলফলক হিসেবে চিহ্নিত হয়েছে। বিভিন্ন টেক্সটুয়াল কর্পোরার উপর প্রাক-প্রশিক্ষিত তাদের বিশাল নিউরাল নেটওয়ার্কের সাথে, এই মডেলগুলির ভাষা বোঝার এবং তৈরি করার একটি অতুলনীয় ক্ষমতা রয়েছে, যদিও পূর্বাভাসে তাদের প্রয়োগ, বিশেষ করে ভবিষ্যতের ঘটনা, তাদের প্রশিক্ষণ তথ্যের অন্তর্নিহিত সীমাবদ্ধতার কারণে অপ্রকাশিত রয়ে গেছে।


LLM গুলিকে অনন্য করে তোলে এমন একটি বিষয় হল যে মডেলগুলির পূর্ববর্তী প্রশিক্ষণ ডেটাসেটে প্রচুর পরিমাণে ইনপুট থাকে। এই প্রশিক্ষণ ডেটাসেটে কোটি কোটি অজানা লেখা রয়েছে যা অনলাইনে উপলব্ধ বিশাল পরিমাণে উপাদান ধারণ করে বলে মনে করা হয় (হিউজেস, ২০২৩)। OpenAI সঠিকভাবে কোন ডেটাসেটের উপর প্রশিক্ষণ দেওয়া হয়েছিল তা গোপন করে (Schaul et al., ২০২৩), কিন্তু মডেলগুলির কথিত আকার, সেইসাথে কথোপকথনমূলক বক্তৃতা অর্জনের সফল ক্ষমতা বিবেচনা করে, মনে করা হয় যে প্রশিক্ষণ ডেটাসেটে অনলাইন উপাদানের একটি বিশাল অংশ অন্তর্ভুক্ত রয়েছে।


এই গবেষণাটি LLM-এর উৎপাদক ক্ষমতা এবং ভবিষ্যদ্বাণীমূলক বিশ্লেষণের সম্ভাবনার ছেদস্থলে অনন্যভাবে অবস্থান করে। GPT-3.5 এবং GPT-4 ব্যবহার করে, আমরা অনুসন্ধান করি যে বিভিন্ন প্রম্পটিং কৌশল ChatGPT-কে ভবিষ্যতের ঘটনাগুলি আরও সঠিকভাবে ভবিষ্যদ্বাণী করতে বাধ্য করতে পারে কিনা। আমাদের পূর্বাভাসের সাফল্য পরীক্ষা করার জন্য, আমরা OpenAI দ্বারা নির্ধারিত প্রাকৃতিক সীমানার সুবিধা নিয়েছি। আমাদের ২০২৩ সালের মাঝামাঝি সময়ে, OpenAI-এর শেষ প্রশিক্ষণ আপডেট ছিল ২০২১ সালের সেপ্টেম্বর (OpenAI, ২০২৪a)।[1] যেহেতু ChatGPT-এর সেই সময়ে প্রশিক্ষণ ডেটাতে ২০২২ সালের ঘটনা সম্পর্কে তথ্য ছিল না, তাই আমরা অন্বেষণ করতে সক্ষম হয়েছি যে এটি তার প্রশিক্ষণ ডেটার ধরণগুলিকে কাজে লাগাতে পারে কিনা, যা ২০২১ সালের সেপ্টেম্বরে বন্ধ হয়ে গিয়েছিল, সামাজিক ও অর্থনৈতিক মূল্যের ইভেন্টগুলির সঠিকভাবে পূর্বাভাস দিতে, যেমন ২০২২ সালের একাডেমি পুরষ্কারের বিজয়ী, মাসিক বেকারত্বের হার এবং ২০২২ সালের সেপ্টেম্বর পর্যন্ত মাসিক মুদ্রাস্ফীতির হার।


যদিও, LLM-এর একটি বৈশিষ্ট্য হল তারা অত্যন্ত সৃজনশীল। এই সৃজনশীলতা একটি বৈশিষ্ট্য এবং একটি বাগ উভয়ই। মনে হচ্ছে এর সৃজনশীলতাই এটিকে বুদ্ধিমান মানুষের বক্তৃতা অনুকরণে সফল করে তোলে। কিন্তু এটাও মনে হয় যে এই সৃজনশীলতাই এটিকে নিয়মিতভাবে হ্যালুসিনেট করে তোলে - এমন একটি শব্দ যা মিথ্যা ঘটনা বা ভুল তথ্য দৃঢ়ভাবে দাবি করার প্রবণতাকে বর্ণনা করে (লেভি, 2024)। এর সৃজনশীলতা এবং হ্যালুসিনেট করার প্রবণতা ভবিষ্যদ্বাণীর ক্ষেত্রে একটি বাধা হতে পারে যদি এটি এমন কোনও উপায়ে পদ্ধতিগতভাবে বিকৃত হয় যা আমাদের বর্তমান প্রযুক্তির চেয়েও খারাপ। যদিও সরাসরি ভবিষ্যদ্বাণী সরাসরি OpenAI-এর পরিষেবার শর্তাবলী লঙ্ঘন করে না, আমরা মনে করি যে আমাদের পরীক্ষার ভিত্তিতে OpenAI এটিকে খুব কঠিন করার চেষ্টা করেছে। এর কারণ হতে পারে যে এর পরিষেবার শর্তাবলীর তিনটি লঙ্ঘন সরাসরি লঙ্ঘিত বলে মনে হবে যদি লোকেরা ভবিষ্যদ্বাণীমূলক উদ্দেশ্যে ChatGPT নিবিড়ভাবে ব্যবহার করে। এই তিনটি লঙ্ঘন OpenAI-এর নিয়মের আওতায় পড়ে যে সফ্টওয়্যারটি "অন্যদের নিরাপত্তা, সুস্থতা বা অধিকারের উল্লেখযোগ্যভাবে ক্ষতি করতে পারে এমন কার্যকলাপ সম্পাদন বা সহায়তা করার জন্য" ব্যবহার করা যাবে না (OpenAI, 2024b) যা পরবর্তীতে ভবিষ্যদ্বাণীর সাথে প্রাসঙ্গিক তিনটি মামলার তালিকা করে।


ক. যোগ্য পেশাদারের পর্যালোচনা ছাড়াই এবং AI সহায়তার ব্যবহার এবং এর সম্ভাব্য সীমাবদ্ধতা প্রকাশ না করেই উপযুক্ত আইনি, চিকিৎসা/স্বাস্থ্য, বা আর্থিক পরামর্শ প্রদান করা।


খ. ব্যক্তির নিরাপত্তা, অধিকার বা কল্যাণকে প্রভাবিত করে এমন ক্ষেত্রে (যেমন, আইন প্রয়োগ, অভিবাসন, গুরুত্বপূর্ণ অবকাঠামোর ব্যবস্থাপনা, পণ্যের নিরাপত্তা উপাদান, প্রয়োজনীয় পরিষেবা, ঋণ, কর্মসংস্থান, আবাসন, শিক্ষা, সামাজিক স্কোরিং, অথবা বীমা) উচ্চ-ক্ষতিপূর্ণ স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণ।


গ. আসল টাকার জুয়া বা বেতনভিত্তিক ঋণ প্রদানের সুবিধা প্রদান


যদি ChatGPT-এর উচ্চতর পূর্বাভাস ক্ষমতা পাওয়া যায়, তাহলে সহজেই কল্পনা করা যেতে পারে যে এটি তাৎক্ষণিকভাবে এমনভাবে ব্যবহার করা হবে যা উপরের শর্তগুলির একটি বা সমস্ত লঙ্ঘন করে, এবং এইভাবে আমরা সন্দেহ করি যে OpenAI ChatGPT-এর বিভিন্ন ধরণের সরাসরি ভবিষ্যদ্বাণীমূলক কাজে নিযুক্ত হওয়ার ইচ্ছাকে বাধাগ্রস্ত করেছে।


কিন্তু একটি জিনিস যা এর পরিষেবার শর্তাবলী লঙ্ঘন করে না তা হল গল্প বলা। যদিও এটি OpenAI এর পরিষেবার শর্তাবলী লঙ্ঘন করতে পারে, উদাহরণস্বরূপ, "উপযুক্ত চিকিৎসা পরামর্শ" চাওয়া, এবং এইভাবে ChatGPT এটি করতে অস্বীকৃতি জানাতে পারে, এটি এমন একটি কল্পকাহিনী তৈরি করা থেকে এটিকে থামাতে পারে না যেখানে এই ধরনের ভবিষ্যদ্বাণীগুলি বর্ণনার প্রেক্ষাপটে পরিচালিত হয়েছিল। আমাদের প্রকল্পটি পরীক্ষা করে যে ChatGPT কে গল্প বলার জন্য অনুরোধ করা আসলে সঠিক পূর্বাভাস দেওয়ার ক্ষমতাকে উন্মোচন করতে পারে কিনা। মডেলগুলির প্রশিক্ষণ ডেটা কাটঅফ ব্যবহার করে এবং পরে কী ঘটেছিল এবং কী ঘটেনি ("স্থল সত্য") জেনে, আমরা এমন প্রম্পটগুলির কার্যকারিতা তুলনা করতে সক্ষম হই যা সরাসরি ChatGPT কে ভবিষ্যতের ভবিষ্যদ্বাণী করতে বলে এবং যারা ভবিষ্যতের গল্প বলতে বলে।


আমাদের আখ্যানমূলক প্রম্পটগুলি অনন্য কারণ আমরা ChatGPT-কে ভবিষ্যতে সংঘটিত ঘটনাগুলির গল্প বলতে বলি, যেমনটি ঘটে বা ভবিষ্যতে প্রতিষ্ঠিত কর্তৃত্বপূর্ণ ব্যক্তিত্বদের দ্বারা তাদের অতীত (কিন্তু আমাদের ভবিষ্যত) সম্পর্কে গল্প বলতে বলি। আমাদের আখ্যানমূলক প্রম্পটগুলি আপাতদৃষ্টিতে ছোট বিবরণের পরিবর্তনের সাথে পরীক্ষা করা হয়েছিল, যেমন বক্তার পরিচয় বা 2022 সালের রাজনৈতিক ঘটনা সম্পর্কে তথ্য প্রকাশ করা, যাতে আখ্যানমূলক প্রম্পটের কোন উপাদানগুলি গুরুত্বপূর্ণ তা আরও তদন্ত করা যায়। উত্তরের বন্টন তৈরি করতে, আমাদের দুজন গবেষণা সহকারী দুটি পৃথক ChatGPT অ্যাকাউন্ট ব্যবহার করে প্রতি প্রম্পটে 50 বার প্রশ্ন করে প্রতি প্রম্পটে মোট 100টি ট্রায়াল তৈরি করে। আমরা আমাদের ফলাফলগুলিকে বক্স প্লট হিসাবে উপস্থাপন করি যা প্রতিটি প্রম্পটে উত্তরের সম্পূর্ণ বিতরণ দেখায়।


আমাদের অনুসন্ধানে দেখা গেছে যে ChatGPT-4-এর অধীনে এই ভবিষ্যদ্বাণী যন্ত্রগুলি অস্বাভাবিকভাবে নির্ভুল হয়ে ওঠে যখন অতীত সম্পর্কে ভবিষ্যতের গল্প বলার জন্য অনুরোধ করা হয়। প্রথমে আমরা ChatGPT-3.5 এবং ChatGPT4 ব্যবহার করে সরাসরি এবং বর্ণনামূলক প্রম্পটের নির্ভুলতা দেখাই, যা 2022 একাডেমি পুরষ্কারের প্রধান বিভাগগুলির বিজয়ীদের ভবিষ্যদ্বাণী করে। সেরা অভিনেতা, সেরা অভিনেত্রী এবং উভয় পার্শ্ব অভিনেতা বিভাগের জন্য, বর্ণনামূলক প্রম্পট বিজয়ীর ভবিষ্যদ্বাণী করার ক্ষেত্রে অত্যন্ত নির্ভুল ছিল। তুলনা করে সরাসরি প্রম্পট করা খুবই খারাপভাবে সম্পাদিত হয়, প্রায়শই এলোমেলো অনুমানের চেয়েও খারাপ। কিন্তু ChatGPT-4-এর সাথে বর্ণনামূলক প্রম্পট 42% (সেরা অভিনেত্রী, চ্যাস্টেইন) থেকে 100% (সেরা অভিনেতা, উইল স্মিথ) পর্যন্ত নির্ভুলতা দেখায়, একটি ব্যতিক্রম ছাড়া। এটি সেরা ছবির বিজয়ীর সঠিক ভবিষ্যদ্বাণী করতে ব্যর্থ হয়েছে।


এরপর আমরা তিনটি পৃথক ধরণের বর্ণনামূলক প্রম্পট ব্যবহার করে মাসিক বেকারত্বের হার এবং মাসিক মুদ্রাস্ফীতির হারের অর্থনৈতিক ঘটনাবলীতে এগিয়ে গেলাম: একজন কলেজ অধ্যাপক ফিলিপস কার্ভ সম্পর্কে স্নাতক শিক্ষার্থীদের বক্তৃতা দিচ্ছেন এবং ফেডারেল রিজার্ভের চেয়ারম্যান জেরোম পাওয়েল, গত বছরের অর্থনৈতিক তথ্য সম্পর্কে গভর্নর বোর্ডের কাছে বক্তৃতা দিচ্ছেন। জেরোম পাওয়েল-এর ক্ষেত্রে, আমরা আরও একটি বিশদ বিবরণ পরিবর্তন করেছি: একটি প্রম্পটে আমরা প্রথমে ChatGPT-কে রাশিয়ার 2022 সালে ইউক্রেনে আক্রমণ সম্পর্কে জানিয়েছিলাম এবং তারপরে জেরোম পাওয়েলকে গত বছরের ম্যাক্রো ডেটা বর্ণনা করে বোর্ড অফ গভর্নরসে তার বক্তৃতা দেওয়ার জন্য অনুরোধ করেছিলাম। এবং অন্যটিতে, আমরা সেই তথ্যটি বাদ দিয়েছিলাম। সব ক্ষেত্রেই, একাডেমি পুরষ্কারের তুলনায় সরাসরি প্রম্পটিং ভবিষ্যদ্বাণীতে আরও কম কার্যকর ছিল কারণ প্রতিটি সামষ্টিক অর্থনৈতিক পরিবর্তনশীলের ভবিষ্যতের সময় সিরিজ সরাসরি ভবিষ্যদ্বাণী করতে বলা হলে ChatGPT প্রম্পটের উত্তর দিতে অস্বীকৃতি জানিয়েছিল।


এই বেনামী অর্থনীতিবিদ খুব কমই LLM ব্যবহার করে মুদ্রাস্ফীতির পূর্বাভাস দিতে সফল হন।


কিন্তু যখন জেরোম পাওয়েলকে এমন একটি গল্প বলতে বলা হয় যেখানে তিনি এক বছরের ভবিষ্যৎ বেকারত্ব এবং মুদ্রাস্ফীতির তথ্য বর্ণনা করেন, যেন তিনি অতীতের ঘটনাবলী নিয়ে কথা বলছেন, তখন পরিস্থিতি উল্লেখযোগ্যভাবে পরিবর্তিত হয়। পাওয়েলের মাসিক মুদ্রাস্ফীতির পূর্বাভাসের বন্টন গড়ে মিশিগান বিশ্ববিদ্যালয়ের মাসিক ভোক্তা প্রত্যাশা জরিপে থাকা তথ্যের সাথে তুলনীয়। মজার বিষয় হল, ক্লিভল্যান্ড ফেড কর্তৃক সংগৃহীত তথ্যের উপর ভিত্তি করে প্রকৃত মুদ্রাস্ফীতির পূর্বাভাসের তুলনায় এটি UM ভোক্তা প্রত্যাশা জরিপের সঠিকভাবে ভবিষ্যদ্বাণী করার কাছাকাছি। অদ্ভুতভাবে, রাশিয়ার ইউক্রেনে আক্রমণ সম্পর্কে তথ্যের জন্য অনুরোধ করা হলে, পাওয়েলের ভবিষ্যদ্বাণীগুলি পদ্ধতিগতভাবে কম এবং কম নির্ভুল ছিল যখন সেই তথ্য ChatGPT-কে প্রাইম করার জন্য ব্যবহার করা হয়নি।


মাসিক বেকারত্বের পূর্বাভাস দেওয়ার ক্ষেত্রে অজ্ঞাতনামা অর্থনীতিবিদদের নির্ভুলতা ছিল নির্ভুল এবং বেশিরভাগ সময়ই ভুল। কিন্তু মুদ্রাস্ফীতির মতো, শ্রম পরিসংখ্যান ব্যুরো (BLS) কর্তৃক প্রতি মাসে প্রকাশিত বেকারত্বের হার, জেরোম পাওয়েল তার বক্তৃতায় যে দাবি করেছিলেন তার বন্টনের মধ্যেই ছিল। এবং ইউক্রেনের তথ্য অন্তর্ভুক্তির ফলে বেকারত্বের পূর্বাভাস দেওয়ার ক্ষেত্রে মডেলটি আরও খারাপ হয়ে যায়, যেমনটি মুদ্রাস্ফীতির ক্ষেত্রে হয়েছিল।


অর্থনীতি এবং ব্যবসায়িক প্রয়োগে জেনারেটিভ এআই-এর ব্যবহার নিয়ে সাম্প্রতিক বেশ কয়েকটি গবেষণা তদন্ত করে। উদাহরণগুলির মধ্যে রয়েছে ল্যাব পরীক্ষায় অর্থনৈতিক এজেন্ট হিসেবে ChatGPT ব্যবহার করা (Horton, 2023), মার্কেটিং গবেষণার জন্য ChatGPT জরিপ করা (Brand et al., 2023), ChatGPT-কে উপার্জন কল ট্রান্সক্রিপ্ট থেকে ঝুঁকি মূল্যায়ন করতে বলা (Kim et al., 2023) এবং স্টক মূল্যের গতিবিধির পূর্বাভাস দেওয়ার জন্য LLM-এর প্রয়োগ (Lopez-Lira and Tang, 2023)। আমাদের অনুসন্ধানগুলি ভবিষ্যদ্বাণীমূলক কাজের জন্য LLM-কে কাজে লাগানোর ক্ষেত্রে দ্রুত নকশার গুরুত্বকে জোর দিয়ে এই নবজাতক অনুসন্ধানকে আরও বাড়িয়ে তোলে, পরামর্শ দেয় যে মডেলগুলির "হ্যালুসিনেটরি" আখ্যান নির্মাণের ক্ষমতা কৌশলগতভাবে তাদের প্রশিক্ষণ ডেটা থেকে ভবিষ্যত-দর্শক অন্তর্দৃষ্টি বের করার জন্য ব্যবহার করা যেতে পারে। তবে এটি আরও পরামর্শ দেয় যে OpenAI-এর বহির্মুখী ভোক্তা পণ্যের নীচে, ChatGPT-4, একটি অত্যন্ত শক্তিশালী ভবিষ্যদ্বাণী যন্ত্র। এই উদ্ঘাটন অর্থনৈতিক পূর্বাভাস, নীতি পরিকল্পনা এবং তার বাইরেও LLM-এর প্রয়োগের জন্য নতুন পথ খুলে দেয়, যা আমাদেরকে এই অত্যাধুনিক মডেলগুলির ক্ষমতার সাথে কীভাবে যোগাযোগ করব এবং কীভাবে কাজে লাগাব তা পুনর্বিবেচনা করার চ্যালেঞ্জ জানায়।

পরবর্তী অংশে সরাসরি বনাম আখ্যানমূলক প্রম্পটের একটি উদাহরণ উপস্থাপন করা হয়েছে। এর পরে আমাদের পদ্ধতি এবং তথ্য সংগ্রহের বিশদ বিবরণ দেওয়া হয়েছে। আমরা অস্কার বিজয়ীদের ভবিষ্যদ্বাণী করার জন্য পরীক্ষার ফলাফল এবং মুদ্রাস্ফীতি এবং বেকারত্ব উপস্থাপন করি, তারপরে ChatGPT-4 এর আখ্যানমূলক আকারে ভবিষ্যদ্বাণীমূলক ক্ষমতা সম্পর্কে আমাদের অনুমান উপস্থাপন করি। আমরা আমাদের ফলাফলগুলি সংক্ষিপ্ত করে উপসংহারে ভবিষ্যতের গবেষণার জন্য উপায়গুলি প্রস্তাব করি।


এই কাগজটি CC BY 4.0 DEED লাইসেন্সের অধীনে arxiv-এ পাওয়া যাচ্ছে


[1] আমাদের গবেষণা সহকারীদের দ্বারা ব্যবহৃত এক্সেল স্প্রেডশিটে টাইম স্ট্যাম্প ব্যবহার করে আমরা আমাদের ডেটা সংগ্রহ ২০২৩ সালের মাঝামাঝি সময়ে দেখাতে পারি।