আমি একজন পেশাদার সাংবাদিক যে কয়েক দশক ধরে প্রযুক্তিতে কাজ করেছি। সোশ্যাল মিডিয়ার প্রস্ফুটিত হওয়ার পর থেকে, সাংবাদিকতার জন্য এটি কঠিন সময় ছিল কারণ অনেক কণ্ঠস্বর উপস্থিত হয়েছিল এবং কোলাহল বধির ছিল৷
এআই-জেনারেটেড কন্টেন্ট আরও বেশি ইনফোট্র্যাশ যোগ করে। কিন্তু আশ্চর্যজনকভাবে, আমি মনে করি যে AI এখানে আমাদের সাংবাদিকতার গুণমানে ফিরিয়ে আনতে , ঝুঁকির কারণ এবং একজন সক্ষমকারী হিসাবে উভয়ই। গত সপ্তাহের আরও দুটি নিবন্ধ আমাকে এই বিষয়ে ভাবতে বাধ্য করেছে। Semafor থেকে প্রথমটি তাদের নতুন অফার চালু করেছে: Semafor's Signals । মাইক্রোসফ্ট এবং ওপেনএআই সরঞ্জামগুলি ব্যবহার করে, সিগন্যালগুলি ডিজিটাল পরিবর্তন এবং এআই চ্যালেঞ্জগুলির সাথে খাপ খাইয়ে বিশ্বব্যাপী সংবাদের বিভিন্ন অন্তর্দৃষ্টি প্রদান করে। সেমাফোরের প্রযুক্তি সম্পাদক রিড আলবারগোটি লিখেছেন :
“এটি একটি পরিবর্তনের একটি দুর্দান্ত উদাহরণ যা ঘটছে। সোশ্যাল মিডিয়ার আবির্ভাব মিডিয়া সংস্থাগুলির জন্য একটি দুর্বল শক্তি ছিল। অন্যদিকে, এআই একটি শক্তিশালী প্রযুক্তি। সোশ্যাল মিডিয়া কিছু সাংবাদিককে তারকাতে পরিণত করেছে এবং প্রায় প্রতিটি বড় প্রকাশনার জন্য জুস ট্রাফিক নম্বরে সহায়তা করেছে। কিন্তু লক্ষ্যযুক্ত বিজ্ঞাপন ব্যবসা, সোশ্যাল মিডিয়া দ্বারা টার্বোচার্জ করা, উচ্চ মানের প্রকাশনা থেকে অর্থ ছিনিয়ে নেয় এবং ট্র্যাফিক ছিল একটি খালি প্রতিশ্রুতি। যখন লোকেরা এআই এবং সংবাদের কথা ভাবে, তখন প্রথম যে জিনিসটি মনে আসে তা হল সাংবাদিকদের বট দ্বারা প্রতিস্থাপিত করা হচ্ছে। যদিও সিএনইটি এবং স্পোর্টস ইলাস্ট্রেটেডের মতো মুষ্টিমেয় আউটলেটগুলি এটি চেষ্টা করার জন্য প্রলুব্ধ হয়েছে, সেই উদাহরণগুলি কেবল অসঙ্গতি। এআই-উত্পাদিত বিষয়বস্তু কমবেশি স্প্যাম, যা সাংবাদিকতাকে প্রতিস্থাপন করে না। এটি গ্রাহকদের বিশ্বস্ত প্রকাশকদের দিকে চালিত করে।"
আমি এই পয়েন্টের সাথে সম্পূর্ণ একমত; AI-এর যুগে, ভয়েস/মিডিয়া যাকে আপনি বিশ্বাস করেন তার চেয়ে গুরুত্বপূর্ণ আর কিছুই নেই। আর এখানে আসে পেশাদার সাংবাদিক। দায়িত্বশীল সাংবাদিক। এই ব্যক্তি কে? এটি একটি জটিল প্রশ্ন যেহেতু AI এর প্রসঙ্গে 'দায়িত্বশীল' একটি রসিকতা হয়ে ওঠে। AI এর যুগে, দায়িত্বশীল সাংবাদিকতা কী গঠন করে সেই প্রশ্নটি নতুন মাত্রা লাভ করে। গত সপ্তাহে, উদাহরণস্বরূপ, Goody-2 চালু করা হয়েছিল, একটি চ্যাটবট যা অস্পষ্ট প্রতিক্রিয়া প্রদান করে এবং "দায়িত্বশীল" হয়ে ভুল তথ্য এড়াতে ডিজাইন করা হয়েছে।
AI বিপজ্জনক হতে পারে এবং ব্যবহার করা যেতে পারে — যেমন — অডিও-জ্যাকিংয়ের জন্য, কিন্তু সাংবাদিকতার ক্ষেত্রে, এটি একগুচ্ছ আশ্চর্যজনক টুল অফার করে যা রিপোর্টিং, সম্পাদনা এবং বিষয়বস্তু বিতরণকে উল্লেখযোগ্যভাবে উন্নত করে। উদাহরণস্বরূপ, যুক্তরাজ্যে ফুল ফ্যাক্টের মতো স্বয়ংক্রিয় ফ্যাক্ট-চেকিং প্ল্যাটফর্মগুলি AI ব্যবহার করে পাবলিক ডিসকোর্সে করা দাবিগুলি দ্রুত যাচাই করতে, সংবাদ প্রতিবেদনের নির্ভুলতা এবং নির্ভরযোগ্যতা বাড়ায়। ডেটা সাংবাদিকতাও এআই দ্বারা বিপ্লবী হয়েছে, ডেটাওর্যাপারের মতো সরঞ্জামগুলি সাংবাদিকদের বিস্তৃত কোডিং জ্ঞান ছাড়াই ইন্টারেক্টিভ চার্ট এবং ভিজ্যুয়ালাইজেশন তৈরি করতে দেয়। অধিকন্তু, ব্যক্তিগতকৃত নিবন্ধের সুপারিশগুলির সাথে নিউ ইয়র্ক টাইমসের পরীক্ষাটি দেখায় যে কীভাবে এআই পৃথক পাঠকদের আগ্রহের জন্য তৈরি বিষয়বস্তু তৈরি করতে পারে, সম্ভাব্য ব্যস্ততা এবং সাবস্ক্রিপশনের হার বৃদ্ধি করে।
গত সপ্তাহে, দ্য প্ল্যাটফরমার ওয়েব এবং সাংবাদিকতার ভবিষ্যত নিয়েও চিন্তা করছিল।
" ভবিষ্যতের ওয়েবে সাংবাদিকদের যে পরিমাণ ভূমিকা পালন করতে হবে, এটি তাদের নিজেদের জন্য উদ্ভাবন করতে হবে। Arc Search, বা Perplexity, অথবা Poe ব্যবহার করুন এবং এটা স্পষ্ট যে সাংবাদিকতাকে বাঁচাতে কোন প্ল্যাটফর্ম আসছে না। এবং ক্রমবর্ধমান সংখ্যক প্ল্যাটফর্ম রয়েছে যা এটিকে হত্যা করার অভিপ্রায় বলে মনে হচ্ছে। "
এবং এখানে আমি আবারও একমত: সাংবাদিকতাকে বাঁচাতে কেউ আসছে না, কিন্তু এআই-এর সাহায্যে - ঝুঁকি এবং সক্ষমতা হিসাবে - সাংবাদিকতা অবশেষে তার মূলে ফিরে আসতে পারে। ডিজিটাল এবং এআই বিপ্লবের মাধ্যমে সাংবাদিকতার যাত্রা প্রতিফলিত করে, এটি স্পষ্ট হয়ে যায় যে চ্যালেঞ্জ প্রচুর থাকলেও গণতন্ত্রের স্তম্ভ হিসাবে সাংবাদিকতার সারাংশ অটুট রয়েছে। AI আলিঙ্গন চিন্তাভাবনা করে সাংবাদিকতাকে তার মূল লক্ষ্যে ফিরে যেতে দেয়: তথ্য জানানো, শিক্ষিত করা এবং অ্যাকাউন্টে ক্ষমতা রাখা — দায়িত্ব থাকা — যার ফলে এটি একটি ক্রমবর্ধমান জটিল বিশ্বে একটি বিশ্বস্ত নির্দেশিকা হিসাবে উন্নতি করতে চলেছে তা নিশ্চিত করে৷
The Usual Suspects © থেকে খবর
ভিসুভিয়াস এবং পম্পেই
রোবলক্স
- গেম কোম্পানি 16টি ভাষায় এআই-চালিত রিয়েল-টাইম চ্যাট অনুবাদ চালু করেছে ।
স্যাম অল্টম্যান
- স্যাম অল্টম্যান বিশ্বব্যাপী এআই চিপ উৎপাদন সম্প্রসারণের জন্য $5-7 ট্রিলিয়ন চাইছেন। (এটাই অনেক…). গ্যারি মার্কাস 7টি কারণ প্রস্তাব করেছেন কেন বিশ্বকে না বলা উচিত (এটি এত বেশি নয়...)
এদিকে OpenAI
- ওপেনএআই সবচেয়ে দ্রুত বর্ধনশীল প্রযুক্তি সংস্থাগুলির মধ্যে 2 বিলিয়ন ডলারের বার্ষিক আয়কে আঘাত করেছে৷
- ওপেনএআই বিভিন্ন কাজ স্বয়ংক্রিয় করতে দুটি এআই এজেন্টের উপর কাজ করছে।
মাইক্রোসফট
এনভিডিয়া
গুগল
কয়েক
- এনভিডিয়া, ওপেনএআই, মাইক্রোসফ্ট এবং অন্যান্য প্রায় 200টি কোম্পানি ইউএস এআই সেফটি ইনস্টিটিউট কনসোর্টিয়াম (এআইএসআইসি) এর সাথে জেনারেটিভ AI এর নিরাপদ বিকাশ এবং স্থাপনায় সহায়তা করার জন্য যোগদান করেছে ।
আপনার সুবিধার জন্য শ্রেণীবদ্ধ করা নতুন গবেষণাপত্র
বড় ভাষার মডেল এবং তাদের বর্ধন
- আরও এজেন্ট আপনার প্রয়োজন : LLM-এ এজেন্টের সংখ্যা বৃদ্ধি কীভাবে নমুনা-এবং-ভোটিং পদ্ধতির মাধ্যমে কর্মক্ষমতা বাড়ায় তা প্রদর্শন করে। কাগজ পড়ুন
- ট্যাগ-এলএলএম : ডোমেন- এবং টাস্ক-নির্দিষ্ট আচরণের জন্য কাস্টম ইনপুট ট্যাগ ব্যবহার করে বিশেষায়িত ডোমেনে সাধারণ-উদ্দেশ্য এলএলএমগুলিকে অভিযোজিত করে। কাগজ পড়ুন
- BiLLM : অতি-নিম্ন বিট-প্রস্থের অধীনে উচ্চ কার্যক্ষমতা বজায় রেখে LLM-এর জন্য একটি 1-বিট-পরবর্তী-প্রশিক্ষণের পরিমাপকরণ পদ্ধতির প্রবর্তন করে। কাগজ পড়ুন
- অনলাইন এআই ফিডব্যাক থেকে ডাইরেক্ট ল্যাঙ্গুয়েজ মডেল অ্যালাইনমেন্ট : অনলাইন ফিডব্যাকের মাধ্যমে মডেল অ্যালাইনমেন্ট উন্নত করে, এক্সপ্লোরেশন এবং পারফরম্যান্স উন্নত করে। কাগজ পড়ুন
- The Hedgehog & the Porcupine : Hedgehog উপস্থাপন করে, একটি শেখার যোগ্য রৈখিক মনোযোগের প্রক্রিয়া যা ট্রান্সফরমারগুলিতে সফটম্যাক্স মনোযোগের অনুকরণ করে। কাগজ পড়ুন
- একটি ইন্টারেক্টিভ এজেন্ট ফাউন্ডেশন মডেল : রোবোটিক্স এবং স্বাস্থ্যসেবা, ভিজ্যুয়াল অটোএনকোডার, ভাষা মডেলিং এবং অ্যাকশন ভবিষ্যদ্বাণীর মতো ডোমেনের জন্য একটি অভিনব এআই ফ্রেমওয়ার্ক প্রস্তাব করে। কাগজ পড়ুন
- DeepSeekMath : উন্মুক্ত ভাষার মডেলগুলিতে গাণিতিক যুক্তির সীমা ঠেলে দেয়। কাগজ পড়ুন
- স্ব-আবিষ্কার : জটিল সমস্যা সমাধানের জন্য LLM-কে স্ব-রচনা করার জন্য যুক্তি গঠন করতে সক্ষম করে। কাগজ পড়ুন
- মাম্বা শিখতে পারেন কিভাবে শিখতে হয়? : ট্রান্সফরমার মডেলের সাথে স্টেট-স্পেস মডেলের ইন-প্রেক্ষাপট শেখার ক্ষমতার তুলনা করে। কাগজ পড়ুন
- বৃহৎ ভাষার মডেলের ডাউনস্ট্রিম টাস্ক পারফরম্যান্সের জন্য স্কেলিং আইন : এলএলএম-এর ডাউনস্ট্রীম পারফরম্যান্সের উপর প্রাক-প্রশিক্ষণ ডেটা সাইজ এবং টাইপের প্রভাব তদন্ত করে। কাগজ পড়ুন
- ক্ষুদ্র ভাষা মডেলের জন্য অপ্টিমাইজেশান এবং আর্কিটেকচার পুনর্বিবেচনা : মোবাইল ডিভাইসের জন্য ক্ষুদ্র ভাষার মডেল অপ্টিমাইজ করা অধ্যয়ন। কাগজ পড়ুন
- সংক্ষিপ্ত LLaMA : LLM অনুমান দক্ষতা উন্নত করার জন্য একটি পদ্ধতি হিসাবে গভীরতা ছাঁটাই অন্বেষণ করে। কাগজ পড়ুন
মাল্টিমডাল এবং ভিশন-ভাষা মডেল
- λ-ECLIPSE : CLIP-এর সুপ্ত স্থানকে কাজে লাগিয়ে ব্যক্তিগতকৃত টেক্সট-টু-ইমেজ জেনারেশন অর্জন করে। কাগজ পড়ুন
- SPHINX-X : মডেল পারফরম্যান্স এবং প্রশিক্ষণের দক্ষতার উপর ফোকাস করে মাল্টি-মডালিটি বড় ভাষার মডেলগুলির একটি উন্নত সিরিজের প্রস্তাব করে৷ কাগজ পড়ুন
- SpiRit-LM : উন্নত শব্দার্থিক বোঝাপড়া এবং অভিব্যক্তির জন্য একটি মাল্টিমোডাল ফাউন্ডেশন ল্যাঙ্গুয়েজ মডেলে পাঠ্য এবং বক্তৃতাকে একীভূত করে। কাগজ পড়ুন
- মাল্টিমোডাল যুক্তির জন্য প্রশ্ন সচেতন দৃষ্টি ট্রান্সফরমার : উন্নত মাল্টিমডাল যুক্তির জন্য দৃষ্টি এনকোডারের মধ্যে প্রশ্ন সচেতনতা এম্বেড করে। কাগজ পড়ুন
- EVA-CLIP-18B : CLIP কে 18 বিলিয়ন প্যারামিটারে স্কেল করে, চিত্র শ্রেণীবিভাগে উল্লেখযোগ্য কর্মক্ষমতা উন্নতি অর্জন করে। কাগজ পড়ুন
রোবোটিক্স, স্বায়ত্তশাসিত সিস্টেম এবং ইন্টারেক্টিভ এজেন্ট
- লার্জ ল্যাঙ্গুয়েজ মডেল পলিসি অ্যাডাপ্টেশন সহ সর্বত্র ড্রাইভিং : এলএলএম ব্যবহার করে স্বায়ত্তশাসিত যানবাহনের জন্য স্থানীয় ট্রাফিক নিয়মগুলির সাথে অভিযোজন সক্ষম করে৷ কাগজ পড়ুন
- অফলাইন অভিনেতা-সমালোচক শক্তিবৃদ্ধি শেখার স্কেলগুলি বড় মডেলগুলিতে : প্রদর্শন করে যে অফলাইন অভিনেতা-সমালোচক শক্তিবৃদ্ধি শিক্ষা কার্যকরভাবে বড় মডেলগুলিতে স্কেল করতে পারে৷ কাগজ পড়ুন
ওয়েব নেভিগেশন, কথোপকথন সিস্টেম, এবং বাস্তব-বিশ্ব অ্যাপ্লিকেশন
- WebLINX : কথোপকথনমূলক ওয়েব নেভিগেশনের জন্য একটি বেঞ্চমার্ক প্রবর্তন করে, নতুন ওয়েব পরিবেশের সাথে খাপ খাইয়ে নেওয়া মডেলগুলির প্রয়োজনীয়তা তুলে ধরে৷ কাগজ পড়ুন
- ইন-কনটেক্সট প্রিন্সিপল মিস্টেকস থেকে লার্নিং : ভুলগুলিকে প্ররোচিত করে এবং টাস্ক-নির্দিষ্ট নীতিগুলি বের করতে তাদের প্রতিফলন করে এলএলএম শেখার উন্নতি করে। কাগজ পড়ুন
- মাল্টি-লাইন এআই-সহায়ক কোড অথরিং : কোড কম্পোজ উপস্থাপন করে, একটি এআই-সহায়ক কোড অথরিং টুল যা একক-লাইন এবং মাল্টি-লাইন ইনলাইন উভয় পরামর্শ প্রদান করে। কাগজ পড়ুন
সময় সিরিজের পূর্বাভাস, বস্তু সনাক্তকরণ, এবং অন্যান্য উদ্ভাবন
- ল্যাগ-লামা : অবিচ্ছিন্ন সম্ভাব্য সময় সিরিজের পূর্বাভাসের জন্য একটি ভিত্তি মডেল প্রবর্তন করে, শক্তিশালী শূন্য-শট সাধারণীকরণ প্রদর্শন করে। কাগজ পড়ুন
- ইন্সটাজেন : ডিফিউশন মডেল থেকে তৈরি সিন্থেটিক ডেটাসেটের প্রশিক্ষণের মাধ্যমে বস্তুর সনাক্তকরণ উন্নত করে। কাগজ পড়ুন
- অন্তর্নিহিত ডিফিউশন : দক্ষ নমুনা নেওয়ার জন্য স্টোকাস্টিক ডিফিউশন দ্বারা সংজ্ঞায়িত একটি অ্যালগরিদম অপ্টিমাইজিং ডিস্ট্রিবিউশন উপস্থাপন করে। কাগজ পড়ুন
- মেমরি একত্রীকরণ দীর্ঘ-প্রসঙ্গ ভিডিও বোঝার সক্ষম করে : অতীতের অ্যাক্টিভেশন একত্রিত করে ভিডিও বোঝার উন্নতি করার একটি পদ্ধতি প্রস্তাব করে। কাগজ পড়ুন
- অনুসন্ধান ছাড়া গ্র্যান্ডমাস্টার-লেভেল দাবা : স্পষ্ট অনুসন্ধান অ্যালগরিদম ছাড়াই গ্র্যান্ডমাস্টার-স্তরের দাবা কর্মক্ষমতা অর্জন করতে একটি ট্রান্সফরমার মডেলকে প্রশিক্ষণ দেয়। কাগজ পড়ুন
কোড রিপ্রেজেন্টেশন এবং কোয়ান্টাইজেশন টেকনিক
- কোড রিপ্রেজেন্টেশন লার্নিং এট স্কেলে : কোডেসেজ প্রবর্তন করে, একটি দুই-পর্যায়ের প্রাক-প্রশিক্ষণ স্কিম সহ কোড রিপ্রেজেন্টেশন শেখার একটি উন্নত মডেল। কাগজ পড়ুন
ব্যাখ্যাযোগ্যতা এবং ভিত্তি মডেল
- বৃহৎ ভাষার মডেলের যুগে ব্যাখ্যাযোগ্যতার পুনর্বিবেচনা : LLM-এর আবির্ভাবের সাথে ব্যাখ্যাযোগ্যতার ভূমিকা পরীক্ষা করে, ব্যাখ্যাযোগ্যতার একটি বিস্তৃত সুযোগের পক্ষে সমর্থন করে। কাগজ পড়ুন
অন্যান্য নিউজলেটারে
এছাড়াও এখানে উপস্থিত হয়.