paint-brush
Aquí está el doblaje de IA que está generando alarmas en todo el mundoby@AmadeoGlobal
826
826

Aquí está el doblaje de IA que está generando alarmas en todo el mundo

TerryChoi2m2024/01/30
Read on Terminal Reader

Recientemente, el doblaje mediante IA del discurso del presidente argentino Javier Milei en el Foro Económico Mundial 2024 realizado por la startup de videos Heygen se volvió viral en las redes sociales.
featured image - Aquí está el doblaje de IA que está generando alarmas en todo el mundo
TerryChoi HackerNoon profile picture

Recientemente, el doblaje AI del presidente argentino Discurso de Javier Milei en el Foro Económico Mundial 2024 de la startup de videos Heygen se volvió viral en las redes sociales.


El software no solo tradujo con precisión sus palabras en español al inglés, sino que también manejó sin problemas la sincronización de labios, una tarea tradicionalmente exclusiva de los profesionales humanos en la industria del video.


Aunque algunos observadores afirmar que la versión de Heygen de Milei suene un poco como un 'chico bangladesí después de una década en Swansea', descartaría estos rumores. Lo que es difícil de ignorar es la voz y la entonación mecánicas del presidente argentino impulsado por IA.


Francamente, la verdadera Milei suena mejor y más expresiva emocionalmente que eso.

Hasta hace poco, la emoción y la entonación han sido los mayores desafíos para las nuevas empresas de IA que buscan revolucionar la industria de los medios. Los humanos siguen siendo mejores para expresar pasión, tristeza o enojo a través de su voz. Pero parece que las cosas están a punto de cambiar.


Otro escaparate reciente que pasó desapercibido provino de una startup de doblaje de inteligencia artificial con sede en Ámsterdam llamada Dubformer. La compañía afirma haber desarrollado tecnología para traducir emociones y entonaciones en canciones.


Puedes juzgar por ti mismo:

La startup localizó la versión más famosa de "House of the Rising Sun", grabada en 1964 por la banda de rock británica The Animals. Parece que esta presentación tiene una cualidad humana al capturar la esencia y la profundidad emocional de la expresión musical.


Según el director general de Dubformer, Anton Dvorkovich, la empresa confía en su tecnología propia, que incluye el reconocimiento automático de voz (ASR), la conversión de texto a voz (TTS) y la biometría de voz.


Micah Berkley, especialista en implementación de IA, arquitecto de soluciones y educador, dijo que la tecnología de Dubformer está dando forma a un futuro en el que la IA amplía el alcance global de la expresión artística.


Personalmente, no puedo entender la idea de que las voces o traducciones de la IA puedan alguna vez igualar la expresividad emocional y el compromiso de los humanos. Pero parece que estamos justo en la primera línea de una transformación importante.