paint-brush
HackerNoon — многоязычная платформа: все главные новости теперь доступны на 13 языкахк@fabian337
1,503 чтения
1,503 чтения

HackerNoon — многоязычная платформа: все главные новости теперь доступны на 13 языках

к Marcos Fabian3m2022/11/21
Read on Terminal Reader
Read this story w/o Javascript

Слишком долго; Читать

HackerNoon использовал машинное обучение для перевода всех главных новостей с нашей платформы с английского на испанский, хинди, мандаринский, вьетнамский, французский, португальский и японский языки. Мы продолжим переводить новые предстоящие главные новости. В главных новостях теперь все эти языки будут отображаться поверх основного изображения. Мы изучаем различные правила и инструменты для улучшения базового перевода, но в долгосрочной перспективе мы будем делать ставку на то, что сообщество улучшит эти переводы (больше будет позже!).
featured image - HackerNoon — многоязычная платформа: все главные новости теперь доступны на 13 языках
Marcos Fabian HackerNoon profile picture
0-item



САМОЕ ТОЛЬКО: Мы добавили в эту функцию 5 новых языков, в результате чего общее количество языков, доступных на HackerNoon, достигло 13! Новые языки включают в себя Русский , Корейский , турецкий , Немецкий и Бенгальский .


Нынешнее население мира составляет около 8 миллиардов человек, так зачем же стремиться к 331,9 миллионам населения Америки? Что ж, мы только что сделали невозможное, немыслимое и непредсказуемое. В HackerNoon мы хотим (по крайней мере, мы пытаемся) предоставить каждому жителю ЗЕМЛИ доступ в Интернет, шанс прочитать соответствующий контент, который движет миром.

Что сейчас произошло?

Мы использовали машинное обучение для перевода всех главных новостей на нашей платформе с английского на испанский , хинди , китайский , вьетнамский , французский , португальский и японский языки . Мы продолжим переводить новые предстоящие главные новости. В главных новостях теперь все эти языки будут отображаться поверх основного изображения.


Кроме того, если вы перейдете на страницу тегов определенного языка, вы заметите, что вся страница будет на этом конкретном языке. Например, https://hackernoon.com/tagged/hackernoon-hi будет отображаться только на определенном языке, в данном случае на хинди. Но то же самое и для других языков.

Почему именно эти языки?

Что ж, благодаря новой системе опросов , созданной Джеферсоном , мы смогли спросить пользователей, на каких языках они хотели бы читать истории. Мы также ссылаемся на нашу существующую читательскую аудиторию. Результаты опроса были довольно ясными, поэтому мы решили продолжить. проект. Проверьте результаты прямо здесь : Поскольку мы прислушиваемся к нашим пользователям, мы хотим быть уверены, что все, что мы создаем, будет полезным. Итак, первым языком, который был переведен, был испанский , а затем мы перешли к остальным. Влияние этих переводов было потрясающим благодаря большому количеству новых читателей, которые находят истории HackerNoon .

Как он был построен?

Мы начали с Google Translation API . Нам очень нравится точность, и благодаря разнообразной команде мы можем проверять контент на большинстве языков, чтобы убедиться в надежности перевода статей. Увидев простоту API, я думаю, что это лучший выбор. Мы изучаем различные правила и инструменты для улучшения базового перевода, но в долгосрочной перспективе мы будем делать ставку на то, что сообщество улучшит эти переводы (больше будет позже!). Мы также создали новую базу данных для хранения переведенных статей, чтобы отличать их от оригинального контента, конечно, с некоторой корреляцией между ними.

Рамочная основа

Самой сложной частью этого проекта было создание структуры, которая каким-то образом загружала статические данные конкретной страницы на языке этой конкретной страницы. Идея здесь заключается в том, что если кто-то читает рассказ на французском языке , статические данные (текст, который не меняется), такие как «новая история», будут показывать переведенную версию, например «Новая история», то же самое и для других языков.


Есть несколько способов сделать это: я решил просто создать объект для хранения текста на каждом языке, сохранить объект в нашей базе данных, а затем загрузить его через API в зависимости от языка страницы. После того, как статический перевод был завершен, осталось только перевести главные новости с помощью скрипта. Это был долгий процесс: перевод всех рассказов на все эти языки занял около двух недель. Самое приятное то, что все переведенные истории также добавляются в карту сайта HackerNoon с метаданными на языке страницы, что определенно облегчит обмен информацией. Поставьте лайк этому запросу на вьетнамском языке в Google:

Надеюсь, вам всем понравится читать на родном языке, комментируйте и делитесь!