Недавно AI-дублирование президента Аргентины Видео-стартап Heygen стал вирусным в социальных сетях. Выступление Хавьера Милея на Всемирном экономическом форуме 2024 года Программное обеспечение не только точно перевело его испанские слова на английский, но и без проблем выполнило синхронизацию губ — задача, традиционно предназначенная только для профессионалов в видеоиндустрии. Хотя некоторые наблюдатели что версия Майли в исполнении Хейгена немного похожа на «бангладешского парня после десяти лет в Суонси», — я бы отверг эти слухи. Что трудно игнорировать, так это механический голос и интонацию президента Аргентины, управляемого искусственным интеллектом. требовать Честно говоря, настоящая Милей звучит лучше и эмоционально выразительнее. https://www.youtube.com/watch?v=YtegqgKYR-U&embedable=true До недавнего времени эмоции и интонация были самыми большими проблемами для стартапов в области искусственного интеллекта, стремящихся разрушить медиаиндустрию. Люди по-прежнему лучше выражают страсть, печаль или гнев голосом. Но похоже, что ситуация вот-вот изменится. Другой Эта идея осталась практически незамеченной благодаря амстердамскому стартапу дубляжа с использованием искусственного интеллекта под названием Dubformer. Компания утверждает, что разработала технологию перевода эмоций и интонаций в песнях. недавняя витрина Вы можете судить сами: https://www.youtube.com/watch?v=VMBLs2Zr9NY&embedable=true Стартап локализовал самую известную версию «Дома восходящего солнца», записанную в 1964 году британской рок-группой The Animals. Похоже, что эта демонстрация имеет человеческие качества, позволяющие передать суть и эмоциональную глубину музыкального выражения. По словам генерального директора Dubformer Антона Дворковича, компания использует собственные запатентованные технологии, в том числе автоматическое распознавание речи (ASR), преобразование текста в речь (TTS) и голосовую биометрию. Мика Беркли, специалист по внедрению искусственного интеллекта, архитектор решений и педагог, сказал, что технология Dubformer формирует будущее, в котором искусственный интеллект расширяет глобальный охват художественного выражения. Лично я просто не могу поверить в то, что голоса или переводы ИИ когда-либо смогут соответствовать эмоциональной выразительности и вовлеченности людей. Но похоже, что мы находимся на переднем крае серьезных преобразований.