paint-brush
Đây là cách lồng tiếng AI đang gióng lên hồi chuông cảnh báo trên toàn thế giớiby@AmadeoGlobal
826
826

Đây là cách lồng tiếng AI đang gióng lên hồi chuông cảnh báo trên toàn thế giới

TerryChoi2m2024/01/30
Read on Terminal Reader

Gần đây, bản lồng tiếng AI cho bài phát biểu của Tổng thống Argentina Javier Milei tại Diễn đàn Kinh tế Thế giới 2024 của công ty khởi nghiệp video Heygen đã lan truyền trên mạng xã hội.
featured image - Đây là cách lồng tiếng AI đang gióng lên hồi chuông cảnh báo trên toàn thế giới
TerryChoi HackerNoon profile picture

Mới đây, AI lồng tiếng cho Tổng thống Argentina Bài phát biểu của Javier Milei tại Diễn đàn Kinh tế Thế giới 2024 bởi công ty khởi nghiệp video Heygen đã lan truyền trên mạng xã hội.


Phần mềm này không chỉ dịch chính xác các từ tiếng Tây Ban Nha sang tiếng Anh mà còn xử lý hát nhép một cách liền mạch, một nhiệm vụ truyền thống chỉ dành riêng cho các chuyên gia trong ngành video.


Mặc dù một số nhà quan sát khẳng định rằng phiên bản Milei của Heygen nghe hơi giống 'anh chàng Bangladesh sau một thập kỷ ở Swansea', tôi sẽ bác bỏ những tin đồn này. Điều khó có thể bỏ qua là giọng nói và ngữ điệu máy móc của Tổng thống Argentina được hỗ trợ bởi AI.


Thành thật mà nói, Milei thật nghe hay hơn và biểu cảm hơn thế.

Cho đến gần đây, cảm xúc và ngữ điệu vẫn là thách thức lớn nhất đối với các công ty khởi nghiệp AI nhằm mục đích đột phá ngành truyền thông. Con người vẫn giỏi thể hiện niềm đam mê, nỗi buồn hay sự tức giận qua giọng nói của mình. Nhưng có vẻ như mọi thứ sắp thay đổi.


Khác giới thiệu gần đây điều đó hầu như không được chú ý đến từ một công ty khởi nghiệp lồng tiếng AI có trụ sở tại Amsterdam tên là Dubformer. Công ty tuyên bố họ đã phát triển công nghệ chuyển tải cảm xúc và ngữ điệu trong bài hát.


Bạn có thể đánh giá cho chính mình:

Công ty khởi nghiệp này đã bản địa hóa phiên bản nổi tiếng nhất của "House of the Rising Sun", được ban nhạc rock Anh The Animals thu âm vào năm 1964. Có vẻ như buổi giới thiệu này có phẩm chất giống con người trong việc nắm bắt được bản chất và chiều sâu cảm xúc của việc thể hiện âm nhạc.


Theo Giám đốc điều hành của Dubformer, Anton Dvorkovich, công ty dựa vào công nghệ độc quyền nội bộ của mình, bao gồm Nhận dạng giọng nói tự động (ASR), Chuyển văn bản thành giọng nói (TTS) và Sinh trắc học giọng nói.


Micah Berkley, chuyên gia triển khai AI, kiến trúc sư giải pháp và nhà giáo dục, cho biết công nghệ của Dubformer đang định hình một tương lai nơi AI mở rộng phạm vi biểu đạt nghệ thuật trên toàn cầu.


Cá nhân tôi không thể phủ nhận ý tưởng rằng giọng nói hoặc bản dịch của AI có thể phù hợp với khả năng biểu đạt cảm xúc và sự tương tác của con người. Nhưng có vẻ như chúng ta đang ở tuyến đầu của một sự chuyển đổi lớn.