Недавно AI-дублирование президента Аргентины
Программное обеспечение не только точно перевело его испанские слова на английский, но и без проблем выполнило синхронизацию губ — задача, традиционно предназначенная только для профессионалов в видеоиндустрии.
Хотя некоторые наблюдатели
Честно говоря, настоящая Милей звучит лучше и эмоционально выразительнее.
До недавнего времени эмоции и интонация были самыми большими проблемами для стартапов в области искусственного интеллекта, стремящихся разрушить медиаиндустрию. Люди по-прежнему лучше выражают страсть, печаль или гнев голосом. Но похоже, что ситуация вот-вот изменится.
Другой
Вы можете судить сами:
Стартап локализовал самую известную версию «Дома восходящего солнца», записанную в 1964 году британской рок-группой The Animals. Похоже, что эта демонстрация имеет человеческие качества, позволяющие передать суть и эмоциональную глубину музыкального выражения.
По словам генерального директора Dubformer Антона Дворковича, компания использует собственные запатентованные технологии, в том числе автоматическое распознавание речи (ASR), преобразование текста в речь (TTS) и голосовую биометрию.
Мика Беркли, специалист по внедрению искусственного интеллекта, архитектор решений и педагог, сказал, что технология Dubformer формирует будущее, в котором искусственный интеллект расширяет глобальный охват художественного выражения.
Лично я просто не могу поверить в то, что голоса или переводы ИИ когда-либо смогут соответствовать эмоциональной выразительности и вовлеченности людей. Но похоже, что мы находимся на переднем крае серьезных преобразований.