paint-brush
Aqui está a dublagem de IA que está levantando alarmes em todo o mundopor@terrychoi
849 leituras
849 leituras

Aqui está a dublagem de IA que está levantando alarmes em todo o mundo

por TerryChoi2m2024/01/30
Read on Terminal Reader

Muito longo; Para ler

Recentemente, a dublagem de IA do discurso do presidente argentino Javier Milei no Fórum Econômico Mundial de 2024 pela startup de vídeo Heygen se tornou viral nas redes sociais.
featured image - Aqui está a dublagem de IA que está levantando alarmes em todo o mundo
TerryChoi HackerNoon profile picture

Recentemente, a dublagem AI do presidente da Argentina Discurso de Javier Milei no Fórum Econômico Mundial de 2024 pela startup de vídeo Heygen se tornou viral nas redes sociais.


O software não apenas traduziu com precisão suas palavras em espanhol para o inglês, mas também administrou perfeitamente a sincronização labial, uma tarefa tradicionalmente exclusiva dos profissionais humanos da indústria de vídeo.


Embora alguns observadores alegar que a versão de Milei de Heygen soa um pouco como um 'cara de Bangladesh depois de uma década em Swansea', eu descartaria esses rumores. O que é difícil de ignorar é a voz mecânica e a entonação do presidente argentino movido pela IA.


Francamente, a verdadeira Milei soa melhor e mais expressiva emocionalmente do que isso.

Até recentemente, a emoção e a entonação têm sido os maiores desafios para as startups de IA que pretendem revolucionar a indústria dos meios de comunicação. Os humanos ainda são melhores em expressar paixão, tristeza ou raiva por meio da voz. Mas parece que as coisas estão prestes a mudar.


Outro vitrine recente que passou despercebido veio de uma startup de dublagem de IA com sede em Amsterdã chamada Dubformer. A empresa afirma ter desenvolvido tecnologia para traduzir emoções e entonações em músicas.


Você pode julgar por si mesmo:

A startup localizou a versão mais famosa de “House of the Rising Sun”, gravada em 1964 pela banda de rock britânica The Animals. Parece que esta vitrine tem uma qualidade humana ao capturar a essência e a profundidade emocional da expressão musical.


De acordo com o CEO da Dubformer, Anton Dvorkovich, a empresa conta com sua tecnologia proprietária interna, incluindo reconhecimento automático de fala (ASR), conversão de texto em fala (TTS) e biometria de voz.


Micah Berkley, especialista em implementação de IA, arquiteto de soluções e educador, disse que a tecnologia da Dubformer está moldando um futuro onde a IA expande o alcance global da expressão artística.


Pessoalmente, simplesmente não consigo entender a ideia de que vozes ou traduções de IA possam corresponder à expressividade emocional e ao envolvimento dos humanos. Mas parece que estamos na linha de frente de uma grande transformação.