paint-brush
Voici le doublage IA qui sonne l'alarme dans le monde entierpar@terrychoi
845 lectures
845 lectures

Voici le doublage IA qui sonne l'alarme dans le monde entier

par TerryChoi2m2024/01/30
Read on Terminal Reader

Trop long; Pour lire

Récemment, le doublage IA du discours du président argentin Javier Milei au Forum économique mondial 2024 par la startup vidéo Heygen est devenu viral sur les réseaux sociaux.
featured image - Voici le doublage IA qui sonne l'alarme dans le monde entier
TerryChoi HackerNoon profile picture

Récemment, le doublage IA du président argentin Discours de Javier Milei au Forum économique mondial 2024 par vidéo, la startup Heygen est devenue virale sur les réseaux sociaux.


Le logiciel a non seulement traduit avec précision ses mots espagnols en anglais, mais a également géré de manière transparente la synchronisation labiale, une tâche traditionnellement réservée aux professionnels humains de l'industrie vidéo.


Même si certains observateurs réclamer que la version Heygen de Milei ressemble un peu à un « Bangladais après une décennie à Swansea », je rejetterais ces rumeurs. Ce qui est difficile à ignorer, ce sont la voix et l’intonation mécaniques du président argentin, doté de l’intelligence artificielle.


Franchement, le vrai Milei sonne mieux et plus expressif émotionnellement que cela.

Jusqu'à récemment, l'émotion et l'intonation constituaient les plus grands défis pour les startups d'IA visant à bouleverser l'industrie des médias. Les humains sont encore meilleurs pour exprimer leur passion, leur tristesse ou leur colère à travers leur voix. Mais il semble que les choses soient sur le point de changer.


Un autre vitrine récente qui est passé largement inaperçu est venu d'une startup de doublage d'IA basée à Amsterdam appelée Dubformer. La société affirme avoir développé une technologie permettant de traduire les émotions et les intonations des chansons.


Vous pouvez juger par vous-même :

La startup a localisé la version la plus célèbre de « House of the Rising Sun », enregistrée en 1964 par le groupe de rock britannique The Animals. Il semble que cette vitrine ait une qualité humaine en capturant l’essence et la profondeur émotionnelle de l’expression musicale.


Selon Anton Dvorkovich, PDG de Dubformer, la société s'appuie sur sa technologie propriétaire interne, notamment la reconnaissance automatique de la parole (ASR), la synthèse vocale (TTS) et la biométrie vocale.


Micah Berkley, spécialiste de la mise en œuvre de l'IA, architecte de solutions et éducateur, a déclaré que la technologie de Dubformer façonne un avenir dans lequel l'IA étend la portée mondiale de l'expression artistique.


Personnellement, je n’arrive tout simplement pas à comprendre l’idée que les voix ou les traductions de l’IA pourraient un jour correspondre à l’expressivité émotionnelle et à l’engagement des humains. Mais il semble que nous soyons aux premières lignes d’une transformation majeure.