Recentemente, a dublagem AI do presidente da Argentina pela startup de vídeo Heygen se tornou viral nas redes sociais. Discurso de Javier Milei no Fórum Econômico Mundial de 2024 O software não apenas traduziu com precisão suas palavras em espanhol para o inglês, mas também administrou perfeitamente a sincronização labial, uma tarefa tradicionalmente exclusiva dos profissionais humanos da indústria de vídeo. Embora alguns observadores que a versão de Milei de Heygen soa um pouco como um 'cara de Bangladesh depois de uma década em Swansea', eu descartaria esses rumores. O que é difícil de ignorar é a voz mecânica e a entonação do presidente argentino movido pela IA. alegar Francamente, a verdadeira Milei soa melhor e mais expressiva emocionalmente do que isso. https://www.youtube.com/watch?v=YtegqgKYR-U&embedable=true Até recentemente, a emoção e a entonação têm sido os maiores desafios para as startups de IA que pretendem revolucionar a indústria dos meios de comunicação. Os humanos ainda são melhores em expressar paixão, tristeza ou raiva por meio da voz. Mas parece que as coisas estão prestes a mudar. Outro que passou despercebido veio de uma startup de dublagem de IA com sede em Amsterdã chamada Dubformer. A empresa afirma ter desenvolvido tecnologia para traduzir emoções e entonações em músicas. vitrine recente Você pode julgar por si mesmo: https://www.youtube.com/watch?v=VMBLs2Zr9NY&embedable=true A startup localizou a versão mais famosa de “House of the Rising Sun”, gravada em 1964 pela banda de rock britânica The Animals. Parece que esta vitrine tem uma qualidade humana ao capturar a essência e a profundidade emocional da expressão musical. De acordo com o CEO da Dubformer, Anton Dvorkovich, a empresa conta com sua tecnologia proprietária interna, incluindo reconhecimento automático de fala (ASR), conversão de texto em fala (TTS) e biometria de voz. Micah Berkley, especialista em implementação de IA, arquiteto de soluções e educador, disse que a tecnologia da Dubformer está moldando um futuro onde a IA expande o alcance global da expressão artística. Pessoalmente, simplesmente não consigo entender a ideia de que vozes ou traduções de IA possam corresponder à expressividade emocional e ao envolvimento dos humanos. Mas parece que estamos na linha de frente de uma grande transformação.