paint-brush
এই হল AI ডাবিং যা বিশ্বজুড়ে অ্যালার্ম বাড়াচ্ছে৷দ্বারা@AmadeoGlobal
837 পড়া
837 পড়া

এই হল AI ডাবিং যা বিশ্বজুড়ে অ্যালার্ম বাড়াচ্ছে৷

দ্বারা TerryChoi2m2024/01/30
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

সম্প্রতি, ভিডিও স্টার্টআপ হেজেন দ্বারা 2024 ওয়ার্ল্ড ইকোনমিক ফোরামে আর্জেন্টিনার রাষ্ট্রপতি জাভিয়ের মিলির ভাষণের AI ডাবিং সোশ্যাল মিডিয়ায় ভাইরাল হয়েছিল।
featured image - এই হল AI ডাবিং যা বিশ্বজুড়ে অ্যালার্ম বাড়াচ্ছে৷
TerryChoi HackerNoon profile picture

সম্প্রতি এআই ডাবিং করেছেন আর্জেন্টিনার প্রেসিডেন্ট ড 2024 ওয়ার্ল্ড ইকোনমিক ফোরামে জাভিয়ের মিলির বক্তৃতা ভিডিও স্টার্টআপ হেজেন সোশ্যাল মিডিয়ায় ভাইরাল হয়েছিল।


সফ্টওয়্যারটি কেবল তার স্প্যানিশ শব্দগুলিকে ইংরেজিতে নির্ভুলভাবে অনুবাদ করেনি বরং ঠোঁট সিঙ্ককে নির্বিঘ্নে পরিচালনা করে, একটি কাজ যা ঐতিহ্যগতভাবে ভিডিও শিল্পে মানব পেশাদারদের জন্য একচেটিয়া।


যদিও কিছু পর্যবেক্ষক দাবি মাইলির হেজেনের সংস্করণটি অনেকটা 'সোয়ানসিতে এক দশক পর বাংলাদেশি লোকের মতো শোনাচ্ছে,' আমি এই গুজবগুলোকে উড়িয়ে দেব। যা উপেক্ষা করা কঠিন তা হল এআই-চালিত আর্জেন্টিনার রাষ্ট্রপতির যান্ত্রিক কণ্ঠস্বর এবং স্বর।


সত্যি কথা বলতে কি, আসল মাইলি তার চেয়ে ভালো এবং আরও বেশি আবেগপূর্ণ মনে হয়।

সম্প্রতি অবধি, মিডিয়া শিল্পকে ব্যাহত করার লক্ষ্যে এআই স্টার্টআপগুলির জন্য আবেগ এবং স্বরণ সবচেয়ে বড় চ্যালেঞ্জ। মানুষ তাদের কণ্ঠের মাধ্যমে আবেগ, দুঃখ বা রাগ প্রকাশ করতে এখনও ভাল। কিন্তু দেখে মনে হচ্ছে বিষয়গুলো পরিবর্তন হতে চলেছে।


আরেকটা সাম্প্রতিক শোকেস ডাবফর্মার নামক আমস্টারডাম-ভিত্তিক এআই ডাবিং স্টার্টআপ থেকে এসেছে যেটি মূলত অলক্ষিত। কোম্পানি দাবি করে যে এটি গানে আবেগ এবং স্বর অনুবাদ করার প্রযুক্তি তৈরি করেছে।


আপনি নিজের জন্য বিচার করতে পারেন:

স্টার্টআপটি 1964 সালে ব্রিটিশ রক ব্যান্ড দ্য অ্যানিম্যালস দ্বারা রেকর্ড করা "হাউস অফ দ্য রাইজিং সান" এর সবচেয়ে বিখ্যাত সংস্করণটিকে স্থানীয়করণ করে। দেখে মনে হচ্ছে এই শোকেসটিতে বাদ্যযন্ত্রের অভিব্যক্তির সারমর্ম এবং আবেগের গভীরতা ক্যাপচার করার জন্য একটি মানুষের মতো গুণ রয়েছে।


ডাবফর্মারের সিইও আন্তন ডভোরকোভিচের মতে, কোম্পানিটি স্বয়ংক্রিয় স্পিচ রিকগনিশন (এএসআর), টেক্সট-টু-স্পীচ (টিটিএস) এবং ভয়েস বায়োমেট্রিক্স সহ অভ্যন্তরীণ মালিকানাধীন প্রযুক্তির উপর নির্ভর করে।


Micah Berkley, একজন AI বাস্তবায়ন বিশেষজ্ঞ, সমাধান স্থপতি এবং শিক্ষাবিদ, বলেছেন Dubformer-এর প্রযুক্তি এমন একটি ভবিষ্যৎ গঠন করছে যেখানে AI শৈল্পিক অভিব্যক্তির বিশ্বব্যাপী নাগাল প্রসারিত করছে।


ব্যক্তিগতভাবে, আমি এই ধারণার চারপাশে আমার মাথা গুটিয়ে রাখতে পারি না যে AI ভয়েস বা অনুবাদগুলি মানুষের মানসিক অভিব্যক্তি এবং ব্যস্ততার সাথে মেলে। কিন্তু মনে হচ্ছে আমরা একটি বড় রূপান্তরের প্রথম সারিতে আছি।