paint-brush
HackerNoon là một nền tảng đa ngôn ngữ: Tất cả các câu chuyện hàng đầu hiện có sẵn bằng 13 ngôn ngữtừ tác giả@fabian337
1,503 lượt đọc
1,503 lượt đọc

HackerNoon là một nền tảng đa ngôn ngữ: Tất cả các câu chuyện hàng đầu hiện có sẵn bằng 13 ngôn ngữ

từ tác giả Marcos Fabian3m2022/11/21
Read on Terminal Reader
Read this story w/o Javascript

dài quá đọc không nổi

HackerNoon đã sử dụng công nghệ máy học để dịch tất cả các câu chuyện hàng đầu từ nền tảng của chúng tôi từ tiếng Anh sang tiếng Tây Ban Nha, tiếng Hindi, tiếng Quan Thoại, tiếng Việt, tiếng Pháp, tiếng Bồ Đào Nha và tiếng Nhật. Chúng tôi sẽ tiếp tục dịch những câu chuyện hàng đầu mới sắp tới. Những câu chuyện hàng đầu giờ đây sẽ nhìn thấy tất cả các ngôn ngữ này ở đầu hình ảnh nổi bật. Chúng tôi đang khám phá nhiều quy tắc và công cụ khác nhau để cải thiện bản dịch cơ bản, nhưng về lâu dài, chúng tôi sẽ đặt cược vào cộng đồng để cải thiện những bản dịch này (sẽ có thêm nhiều bản dịch khác sau này!).
featured image - HackerNoon là một nền tảng đa ngôn ngữ: Tất cả các câu chuyện hàng đầu hiện có sẵn bằng 13 ngôn ngữ
Marcos Fabian HackerNoon profile picture
0-item



CHỈ TRONG ĐIỀU NÀY: Chúng tôi đã thêm 5 ngôn ngữ mới vào tính năng này, nâng tổng số ngôn ngữ có sẵn trên HackerNoon lên 13! Các ngôn ngữ mới bao gồm tiếng Nga , Hàn Quốc , tiếng Thổ Nhĩ Kỳ , tiếng Đức tiếng Bengali .


Dân số thế giới hiện tại là khoảng 8 tỷ người, vậy tại sao chỉ nhắm tới con số 331,9 triệu người ở Mỹ? Chà, chúng tôi vừa làm được điều không thể, không thể tưởng tượng được và không thể đoán trước được. Tại HackerNoon , chúng tôi muốn (ít nhất là chúng tôi đang cố gắng) cung cấp cho mọi người trên EARTH khả năng truy cập Internet, một cơ hội công bằng để đọc nội dung có liên quan đang chuyển động trên Thế giới.

Chuyện gì vừa xảy ra vậy?

Chúng tôi đã sử dụng công nghệ máy học để dịch tất cả các tin bài hàng đầu trên nền tảng của mình từ tiếng Anh sang tiếng Tây Ban Nha , tiếng Hindi , tiếng Quan Thoại , tiếng Việt , tiếng Pháp , tiếng Bồ Đào Nhatiếng Nhật . Chúng tôi sẽ tiếp tục dịch những câu chuyện hàng đầu mới sắp tới. Những câu chuyện hàng đầu giờ đây sẽ nhìn thấy tất cả các ngôn ngữ này ở đầu hình ảnh nổi bật.


Ngoài ra, nếu bạn điều hướng đến trang thẻ của một ngôn ngữ cụ thể, bạn sẽ nhận thấy rằng toàn bộ trang sẽ bằng ngôn ngữ cụ thể đó. Ví dụ: https://hackernoon.com/tagged/hackernoon-hi sẽ chỉ hiển thị bằng ngôn ngữ cụ thể, trong trường hợp này là tiếng Hindi. Nhưng điều tương tự đối với các ngôn ngữ khác.

Tại sao lại có những ngôn ngữ này?

Vâng, nhờ hệ thống thăm dò ý kiến mới do Jeferson tạo ra, chúng tôi có thể hỏi người dùng xem họ muốn đọc truyện bằng ngôn ngữ nào. Chúng tôi cũng tham khảo chéo với độc giả hiện tại của chúng tôi. Kết quả của cuộc thăm dò khá rõ ràng nên chúng tôi quyết định tiếp tục. dự án. Kiểm tra kết quả ngay tại đây : Vì chúng tôi lắng nghe người dùng nên chúng tôi muốn đảm bảo rằng bất kỳ điều gì chúng tôi xây dựng đều sẽ mang lại lợi ích. Vì vậy , tiếng Tây Ban Nha là ngôn ngữ đầu tiên được dịch và sau đó chúng tôi chuyển sang các ngôn ngữ còn lại. Tác động của những bản dịch này thật đáng kinh ngạc do số lượng độc giả mới tìm đến các câu chuyện của HackerNoon .

Nó được xây dựng như thế nào?

Chúng tôi bắt đầu với API dịch của Google . Chúng tôi thực sự thích tính chính xác và với đội ngũ đa dạng , chúng tôi có thể kiểm tra nội dung của hầu hết các ngôn ngữ để đảm bảo bản dịch của bài viết là đáng tin cậy. Sau khi thấy tính đơn giản của API, tôi nghĩ đây là lựa chọn tốt nhất. Chúng tôi đang khám phá nhiều quy tắc và công cụ khác nhau để cải thiện bản dịch cơ bản, nhưng về lâu dài, chúng tôi sẽ đặt cược vào cộng đồng để cải thiện những bản dịch này (sẽ có thêm nhiều bản dịch khác sau này!). Chúng tôi cũng tạo một cơ sở dữ liệu mới để lưu trữ các bài viết đã dịch nhằm phân biệt với nội dung gốc, tất nhiên có một số mối tương quan giữa hai nội dung đó.

Cơ cấu

Phần khó nhất của dự án này là tạo một khung để bằng cách nào đó sẽ tải dữ liệu tĩnh của một trang cụ thể bằng ngôn ngữ của trang cụ thể đó. Ý tưởng ở đây là nếu ai đó đang đọc một câu chuyện bằng tiếng Pháp , dữ liệu tĩnh (văn bản không thay đổi) chẳng hạn như “câu chuyện mới” sẽ hiển thị phiên bản dịch như “Nouvelle histoire”, điều tương tự đối với các ngôn ngữ khác.


Có nhiều cách để thực hiện điều này, tôi quyết định chỉ cần tạo một đối tượng để lưu trữ văn bản của từng ngôn ngữ, lưu trữ đối tượng trên cơ sở dữ liệu của chúng tôi, sau đó tải nó qua API tùy thuộc vào ngôn ngữ của trang. Sau khi dịch tĩnh xong, tất cả những gì còn lại là dịch những câu chuyện hàng đầu thông qua kịch bản. Đó là một quá trình lâu dài, mất khoảng hai tuần để dịch tất cả các câu chuyện sang tất cả các ngôn ngữ này. Điều tuyệt vời hơn là tất cả các câu chuyện đã dịch cũng được thêm vào sơ đồ trang web HackerNoon với siêu dữ liệu bằng ngôn ngữ của trang, điều này chắc chắn sẽ tạo điều kiện thuận lợi cho trải nghiệm chia sẻ. Like tìm kiếm bằng tiếng Việt trên google này:

Tôi hy vọng tất cả các bạn thích đọc bằng ngôn ngữ mẹ đẻ của mình, bình luận và chia sẻ!