paint-brush
İşte Dünya Çapında Alarm Veren Yapay Zeka Dublajıile@terrychoi
845 okumalar
845 okumalar

İşte Dünya Çapında Alarm Veren Yapay Zeka Dublajı

ile TerryChoi2m2024/01/30
Read on Terminal Reader

Çok uzun; Okumak

Son zamanlarda, Arjantin Devlet Başkanı Javier Milei'nin 2024 Dünya Ekonomik Forumu'ndaki konuşmasının video startup'ı Heygen tarafından yapay zeka tarafından seslendirilmesi sosyal medyada viral oldu.
featured image - İşte Dünya Çapında Alarm Veren Yapay Zeka Dublajı
TerryChoi HackerNoon profile picture

Son zamanlarda Arjantin Devlet Başkanı'nın yapay zeka dublajı Javier Milei'nin 2024 Dünya Ekonomik Forumu'ndaki konuşması Video girişimi Heygen tarafından sosyal medyada viral oldu.


Yazılım yalnızca İspanyolca sözcüklerini İngilizceye doğru bir şekilde çevirmekle kalmadı, aynı zamanda geleneksel olarak video endüstrisindeki profesyonellere özel bir görev olan dudak senkronizasyonunu da sorunsuz bir şekilde gerçekleştirdi.


Her ne kadar bazı gözlemciler iddia Heygen'in Milei versiyonunun kulağa 'Swansea'de on yıl geçirdikten sonra Bangladeşli bir adama' benzediğini" söylersem bu söylentileri reddederim. Göz ardı edilmesi zor olan, yapay zeka destekli Arjantin Başkanının mekanik sesi ve tonlamasıdır.


Açıkçası, gerçek Milei kulağa bundan daha iyi ve duygusal açıdan daha etkileyici geliyor.

Yakın zamana kadar medya endüstrisini altüst etmeyi amaçlayan yapay zeka girişimleri için duygu ve tonlama en büyük zorluklardı. İnsanlar tutkuyu, üzüntüyü veya öfkeyi sesleriyle ifade etme konusunda hala daha iyiler. Ancak işler değişmek üzere gibi görünüyor.


Bir diğer son vitrin Büyük ölçüde fark edilmeyen bu gelişme, Dubformer adlı Amsterdam merkezli bir yapay zeka seslendirme girişiminden geldi. Şirket, şarkılardaki duyguları ve tonlamaları tercüme etmek için teknoloji geliştirdiğini iddia ediyor.


Kendiniz yargılayabilirsiniz:

Girişim, 1964 yılında İngiliz rock grubu The Animals tarafından kaydedilen "House of the Rising Sun"ın en ünlü versiyonunu yerelleştirdi. Görünüşe göre bu sergi, müzikal ifadenin özünü ve duygusal derinliğini yakalama konusunda insana benzer bir kaliteye sahip.


Dubformer'ın CEO'su Anton Dvorkovich'e göre şirket, Otomatik Konuşma Tanıma (ASR), Metin-Konuşma (TTS) ve Ses Biyometrisi dahil olmak üzere şirket içi tescilli teknolojisine güveniyor.


Yapay zeka uygulama uzmanı, çözüm mimarı ve eğitimci Micah Berkley, Dubformer teknolojisinin yapay zekanın sanatsal ifadenin küresel erişimini genişlettiği bir geleceği şekillendirdiğini söyledi.


Kişisel olarak yapay zeka seslerinin veya çevirilerinin insanların duygusal ifade gücü ve katılımıyla eşleşebileceği fikrine kafa yoramıyorum. Ancak görünen o ki büyük bir dönüşümün ön saflarındayız.