ওপেনএআই সোরার সাথে জেনারেটিভ এআইকে নতুন উচ্চতায় নিয়ে গেছে, এর নতুন টেক্সট-টু-ভিডিও মডেল যা লিখিত নির্দেশ থেকে বাস্তবসম্মত দৃশ্য তৈরি করতে পারে। যদিও DALL-E এবং অন্যান্য টেক্সট-টু-ইমেজ মডেলগুলি আমাদের AI জেনারেশনের শক্তি দেখিয়েছে, সোরা দেখায় যে আমরা গতির উপাদান যোগ করে কতদূর এসেছি।
আমরা সোরা মডেলটি লাইভ হয়ে গেলে পরীক্ষা করব এবং এমনকি আমাদের সাপ্তাহিক নিউজলেটারে একটি বিনামূল্যের নির্দেশিকা প্রকাশ করব - 'AI Hunters' ! নতুন এআই গ্রাউন্ডব্রেকিং প্ল্যাটফর্ম এবং ইভেন্টগুলি মিস করবেন না!
স্থির চিত্রের বাইরে, সোরা এক মিনিট পর্যন্ত দীর্ঘ ভিডিও তৈরি করতে পারে। এটি বিদ্যমান ভিডিওগুলিও নিতে পারে এবং সামগ্রী উন্নত করতে অনুপস্থিত ফ্রেমগুলি পূরণ করতে পারে৷ সৃষ্টির সম্ভাবনা অন্তহীন - আমরা ভবিষ্যতে এআই-জেনারেটেড শর্ট ফিল্ম, অ্যানিমেশন বা এমনকি উন্নত স্পোর্টস রিপ্লে দেখতে পাব।
কিন্তু সোরা সম্পর্কে যা সত্যিই চিত্তাকর্ষক তা হল ভৌত জগতের বোঝা। এটি একাধিক অক্ষর এবং গতির সাথে জড়িত জটিল দৃশ্যগুলি অনুকরণ করতে পারে। বাস্তবসম্মত পাতা কুচকে যাওয়া এবং গাছের মধ্য দিয়ে সূর্যালোক ফিল্টারিং সহ কাউকে বনের মধ্য দিয়ে হাঁটতে দেখতে চান? সোরা তোমাকে কভার করেছে।
হুডের নীচে, সোরা ডিফিউশন মডেল এবং ট্রান্সফরমারগুলিতে অতীতের কাজগুলিকে কাজে লাগায়৷ একটি ডিফিউশন মডেলের এলোমেলো পদক্ষেপগুলি ভিডিওর মতো উচ্চ-মাত্রিক ডেটা তৈরি করতে পারদর্শী। এদিকে, ট্রান্সফরমারগুলি প্রাকৃতিক ভাষার মতো ক্রমিক ডেটা প্রক্রিয়াকরণের কাজগুলি পরিচালনা করে।
অবশ্যই, এখনও কিছু সীমাবদ্ধতা আছে। গাড়ি দুর্ঘটনা বা ক্লিফ ডাইভের মতো জটিল পদার্থবিদ্যার অনুকরণ করা কঠিন প্রমাণিত হয়। মডেলটি কারণ এবং প্রভাব নিয়েও লড়াই করে - কেউ কামড় দেওয়ার পরে কুকি কামড় জাদুকরীভাবে প্রদর্শিত হবে বলে আশা করবেন না!
স্বাভাবিকভাবেই, OpenAI নিরাপত্তার উপর দৃষ্টি নিবদ্ধ করে। সর্বজনীন প্রকাশের আগে, তারা ক্ষতিকারক বা বিভ্রান্তিকর বিষয়বস্তু ফিল্টার করার কৌশল উন্নত করছে। অগ্রগতির জন্য একটি সূক্ষ্ম ভারসাম্য প্রয়োজন - সোরাকে অবশ্যই অনুপযুক্ত কিছু এড়িয়ে বাস্তবসম্মতভাবে তৈরি করতে হবে।
আপাতত, সংস্থাটি নিম্নলিখিত সুরক্ষা ব্যবস্থাগুলি স্থাপন করেছে:
বিষয়বস্তু বিধিনিষেধ: ওপেনএআই সোরা-এর জন্য কঠোর বিষয়বস্তুর নির্দেশিকা প্রতিষ্ঠা করেছে, যা তার DALL-E 3 মডেলের মতোই। এই নির্দেশিকাগুলি হিংসাত্মক, যৌন বা ঘৃণ্য বিষয়বস্তু তৈরি করা নিষিদ্ধ করে, সেইসাথে প্রকৃত লোকেদের উপমা বা নামী শিল্পীদের শৈলীর প্রয়োগ নিষিদ্ধ করে৷
প্রোভেনেন্স মেটাডেটা এবং আইডেন্টিফিকেশন: স্বচ্ছতা এবং জবাবদিহিতাকে উন্নীত করার জন্য, ওপেনএআই সোরা দ্বারা তৈরি ভিডিওগুলির জন্য প্রোভেনেন্স মেটাডেটা প্রদান করার পরিকল্পনা করেছে। উপরন্তু, কোম্পানী দর্শকদের এআই মডেল দ্বারা তৈরি সামগ্রী সনাক্ত করতে সক্ষম করবে।
রেড টিমিং এবং সীমিত অ্যাক্সেস: ওপেনএআই গবেষক, ভিজ্যুয়াল শিল্পী এবং চলচ্চিত্র নির্মাতাদের একটি নির্বাচিত গোষ্ঠীকে সোরাতে অ্যাক্সেসের অনুমতি দিয়েছে যারা পণ্যটিকে "রেড টিম" করবে, কোম্পানির পরিষেবার শর্তাদি লঙ্ঘনের জন্য সংবেদনশীলতার জন্য এটি পরীক্ষা করবে। এই সীমিত অ্যাক্সেস ওপেনএআই-কে মডেলটিকে আরও ব্যাপকভাবে উপলব্ধ করার আগে প্রতিক্রিয়া সংগ্রহ করতে এবং সম্ভাব্য ঝুঁকিগুলি সনাক্ত করতে দেয়।
নীতিনির্ধারক এবং শিল্পীদের সাথে সম্পৃক্ততা: কোম্পানি উদ্বেগ বুঝতে এবং মডেলের ইতিবাচক ব্যবহারের ক্ষেত্রে চিহ্নিত করতে নীতিনির্ধারক, শিক্ষাবিদ এবং শিল্পীদের সাথে সক্রিয়ভাবে জড়িত। এই সক্রিয় পন্থা ওপেনএআই এর প্রযুক্তির বৃহত্তর সামাজিক প্রভাব মোকাবেলার প্রতিশ্রুতি প্রদর্শন করে।
জেনারেটিভ এআই অগ্রগতির সাথে সাথে, সোরার মতো মডেলগুলিতে বিষয়বস্তু তৈরি এবং ব্যবহারে বিপ্লব ঘটানোর সম্ভাবনা রয়েছে। তারা ব্যক্তিগতকৃত বিষয়বস্তু তৈরি করতে পারে, আমাদের বিশ্বকে বুঝতে সাহায্য করতে পারে এবং বাস্তবসম্মত ভার্চুয়াল বিশ্বকে শক্তিশালী করতে পারে।
যাইহোক, এটি অত্যন্ত গুরুত্বপূর্ণ যে এই মডেলগুলি AI-উত্পন্ন সামগ্রীর ঝুঁকি বিবেচনা করে দায়িত্বশীলভাবে তৈরি করা হয়। সম্ভাব্য সমস্যাগুলি প্রশমিত করার সময় ওপেনএআই এর সুবিধাগুলি সর্বাধিক করার জন্য সোরার সাথে গুরুত্বপূর্ণ পদক্ষেপ নিচ্ছে৷