paint-brush
এই হল AI ডাবিং যা বিশ্বজুড়ে অ্যালার্ম বাড়াচ্ছে৷ দ্বারা@terrychoi
858 পড়া
858 পড়া

এই হল AI ডাবিং যা বিশ্বজুড়ে অ্যালার্ম বাড়াচ্ছে৷

দ্বারা TerryChoi
TerryChoi HackerNoon profile picture

TerryChoi

@terrychoi

Investor | Entrepreneur | Philomath

2 মিনিট read2024/01/30
Read on Terminal Reader
Read this story in a terminal
Print this story

অতিদীর্ঘ; পড়তে

সম্প্রতি, ভিডিও স্টার্টআপ হেজেন দ্বারা 2024 ওয়ার্ল্ড ইকোনমিক ফোরামে আর্জেন্টিনার রাষ্ট্রপতি জাভিয়ের মিলির ভাষণের AI ডাবিং সোশ্যাল মিডিয়ায় ভাইরাল হয়েছিল।
featured image - এই হল AI ডাবিং যা বিশ্বজুড়ে অ্যালার্ম বাড়াচ্ছে৷
TerryChoi HackerNoon profile picture
TerryChoi

TerryChoi

@terrychoi

Investor | Entrepreneur | Philomath

সম্প্রতি এআই ডাবিং করেছেন আর্জেন্টিনার প্রেসিডেন্ট ড 2024 ওয়ার্ল্ড ইকোনমিক ফোরামে জাভিয়ের মিলির বক্তৃতা ভিডিও স্টার্টআপ হেজেন সোশ্যাল মিডিয়ায় ভাইরাল হয়েছিল।


সফ্টওয়্যারটি কেবল তার স্প্যানিশ শব্দগুলিকে ইংরেজিতে নির্ভুলভাবে অনুবাদ করেনি বরং ঠোঁট সিঙ্ককে নির্বিঘ্নে পরিচালনা করে, একটি কাজ যা ঐতিহ্যগতভাবে ভিডিও শিল্পে মানব পেশাদারদের জন্য একচেটিয়া।


যদিও কিছু পর্যবেক্ষক দাবি মাইলির হেজেনের সংস্করণটি অনেকটা 'সোয়ানসিতে এক দশক পর বাংলাদেশি লোকের মতো শোনাচ্ছে,' আমি এই গুজবগুলোকে উড়িয়ে দেব। যা উপেক্ষা করা কঠিন তা হল এআই-চালিত আর্জেন্টিনার রাষ্ট্রপতির যান্ত্রিক কণ্ঠস্বর এবং স্বর।


সত্যি কথা বলতে কি, আসল মাইলি তার চেয়ে ভালো এবং আরও বেশি আবেগপূর্ণ মনে হয়।


সম্প্রতি অবধি, মিডিয়া শিল্পকে ব্যাহত করার লক্ষ্যে এআই স্টার্টআপগুলির জন্য আবেগ এবং স্বরণ সবচেয়ে বড় চ্যালেঞ্জ। মানুষ তাদের কণ্ঠের মাধ্যমে আবেগ, দুঃখ বা রাগ প্রকাশ করতে এখনও ভাল। কিন্তু দেখে মনে হচ্ছে বিষয়গুলো পরিবর্তন হতে চলেছে।


আরেকটা সাম্প্রতিক শোকেস ডাবফর্মার নামক আমস্টারডাম-ভিত্তিক এআই ডাবিং স্টার্টআপ থেকে এসেছে যেটি মূলত অলক্ষিত। কোম্পানি দাবি করে যে এটি গানে আবেগ এবং স্বর অনুবাদ করার প্রযুক্তি তৈরি করেছে।


আপনি নিজের জন্য বিচার করতে পারেন:


স্টার্টআপটি 1964 সালে ব্রিটিশ রক ব্যান্ড দ্য অ্যানিম্যালস দ্বারা রেকর্ড করা "হাউস অফ দ্য রাইজিং সান" এর সবচেয়ে বিখ্যাত সংস্করণটিকে স্থানীয়করণ করে। দেখে মনে হচ্ছে এই শোকেসটিতে বাদ্যযন্ত্রের অভিব্যক্তির সারমর্ম এবং আবেগের গভীরতা ক্যাপচার করার জন্য একটি মানুষের মতো গুণ রয়েছে।


ডাবফর্মারের সিইও আন্তন ডভোরকোভিচের মতে, কোম্পানিটি স্বয়ংক্রিয় স্পিচ রিকগনিশন (এএসআর), টেক্সট-টু-স্পীচ (টিটিএস) এবং ভয়েস বায়োমেট্রিক্স সহ অভ্যন্তরীণ মালিকানাধীন প্রযুক্তির উপর নির্ভর করে।


Micah Berkley, একজন AI বাস্তবায়ন বিশেষজ্ঞ, সমাধান স্থপতি এবং শিক্ষাবিদ, বলেছেন Dubformer-এর প্রযুক্তি এমন একটি ভবিষ্যৎ গঠন করছে যেখানে AI শৈল্পিক অভিব্যক্তির বিশ্বব্যাপী নাগাল প্রসারিত করছে।


ব্যক্তিগতভাবে, আমি এই ধারণার চারপাশে আমার মাথা গুটিয়ে রাখতে পারি না যে AI ভয়েস বা অনুবাদগুলি মানুষের মানসিক অভিব্যক্তি এবং ব্যস্ততার সাথে মেলে। কিন্তু মনে হচ্ছে আমরা একটি বড় রূপান্তরের প্রথম সারিতে আছি।

L O A D I N G
. . . comments & more!

About Author

TerryChoi HackerNoon profile picture
TerryChoi@terrychoi
Investor | Entrepreneur | Philomath

আসে ট্যাগ

এই নিবন্ধটি উপস্থাপন করা হয়েছে...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite
X REMOVE AD