paint-brush
Вот дубляж с искусственным интеллектом, который вызывает тревогу во всем мирек@terrychoi
845 чтения
845 чтения

Вот дубляж с искусственным интеллектом, который вызывает тревогу во всем мире

к TerryChoi2m2024/01/30
Read on Terminal Reader

Слишком долго; Читать

Недавно видеостартап Heygen, дублирующий речь президента Аргентины Хавьера Милея на Всемирном экономическом форуме 2024 года, стал вирусным в социальных сетях.
featured image - Вот дубляж с искусственным интеллектом, который вызывает тревогу во всем мире
TerryChoi HackerNoon profile picture

Недавно AI-дублирование президента Аргентины Выступление Хавьера Милея на Всемирном экономическом форуме 2024 года Видео-стартап Heygen стал вирусным в социальных сетях.


Программное обеспечение не только точно перевело его испанские слова на английский, но и без проблем выполнило синхронизацию губ — задача, традиционно предназначенная только для профессионалов в видеоиндустрии.


Хотя некоторые наблюдатели требовать что версия Майли в исполнении Хейгена немного похожа на «бангладешского парня после десяти лет в Суонси», — я бы отверг эти слухи. Что трудно игнорировать, так это механический голос и интонацию президента Аргентины, управляемого искусственным интеллектом.


Честно говоря, настоящая Милей звучит лучше и эмоционально выразительнее.

До недавнего времени эмоции и интонация были самыми большими проблемами для стартапов в области искусственного интеллекта, стремящихся разрушить медиаиндустрию. Люди по-прежнему лучше выражают страсть, печаль или гнев голосом. Но похоже, что ситуация вот-вот изменится.


Другой недавняя витрина Эта идея осталась практически незамеченной благодаря амстердамскому стартапу дубляжа с использованием искусственного интеллекта под названием Dubformer. Компания утверждает, что разработала технологию перевода эмоций и интонаций в песнях.


Вы можете судить сами:

Стартап локализовал самую известную версию «Дома восходящего солнца», записанную в 1964 году британской рок-группой The Animals. Похоже, что эта демонстрация имеет человеческие качества, позволяющие передать суть и эмоциональную глубину музыкального выражения.


По словам генерального директора Dubformer Антона Дворковича, компания использует собственные запатентованные технологии, в том числе автоматическое распознавание речи (ASR), преобразование текста в речь (TTS) и голосовую биометрию.


Мика Беркли, специалист по внедрению искусственного интеллекта, архитектор решений и педагог, сказал, что технология Dubformer формирует будущее, в котором искусственный интеллект расширяет глобальный охват художественного выражения.


Лично я просто не могу поверить в то, что голоса или переводы ИИ когда-либо смогут соответствовать эмоциональной выразительности и вовлеченности людей. Но похоже, что мы находимся на переднем крае серьезных преобразований.