paint-brush
HackerNoon es una plataforma multilingüe: todas las noticias destacadas ahora disponibles en 13 idiomasby@fabian337
1,454
1,454

HackerNoon es una plataforma multilingüe: todas las noticias destacadas ahora disponibles en 13 idiomas

Marcos Fabian3m2022/11/21
Read on Terminal Reader
Read this story w/o Javascript

HackerNoon utilizó el aprendizaje automático para traducir todas las noticias destacadas de nuestra plataforma del inglés al español, hindi, mandarín, vietnamita, francés, portugués y japonés. Seguiremos traduciendo las nuevas noticias destacadas que se publicarán próximamente. Las noticias destacadas ahora verán todos estos idiomas encima de la imagen principal. Estamos explorando varias reglas y herramientas para mejorar la traducción base, pero a largo plazo, apostaremos a que la comunidad mejore estas traducciones (¡habrá más en el futuro!).
featured image - HackerNoon es una plataforma multilingüe: todas las noticias destacadas ahora disponibles en 13 idiomas
Marcos Fabian HackerNoon profile picture
0-item



ESTO RECIÉN: Agregamos 5 nuevos idiomas a esta función, ¡lo que eleva el número total de idiomas disponibles en HackerNoon a 13! Los nuevos idiomas incluyen ruso , coreano , turco , Alemán y bengalí .


La población mundial actual es de unos 8.000 millones, entonces, ¿por qué aspirar sólo a los 331,9 millones de la población estadounidense? Bueno, simplemente hicimos lo imposible, impensable e impredecible. En HackerNoon , queremos (al menos lo intentamos) brindarles a todos en la TIERRA con acceso a Internet una oportunidad justa de leer el contenido relevante que está moviendo al mundo.

¿Lo que acaba de suceder?

Hemos utilizado el aprendizaje automático para traducir todas las noticias destacadas de nuestra plataforma del inglés al español , hindi , mandarín , vietnamita , francés , portugués y japonés . Seguiremos traduciendo las próximas noticias destacadas. Las noticias destacadas ahora verán todos estos idiomas encima de la imagen destacada.


Además, si navega a la página de etiquetas de un idioma específico, notará que toda la página estará en ese idioma específico. https://hackernoon.com/tagged/hackernoon-hi , por ejemplo, solo se mostrará en el idioma específico, en este caso hindi. Pero ocurre lo mismo con otros idiomas.

¿Por qué estos idiomas?

Bueno, gracias al nuevo sistema de encuestas creado por Jeferson , pudimos preguntar a los usuarios en qué idiomas les gustaría leer historias. También hacemos referencias cruzadas con nuestros lectores existentes. Los resultados de la encuesta fueron bastante claros, así que decidimos seguir adelante con la encuesta. proyecto. Consulta los resultados aquí mismo: Dado que escuchamos a nuestros usuarios, queremos asegurarnos de que todo lo que construyamos sea beneficioso. Entonces el español fue el primer idioma que se tradujo y luego pasamos al resto. El impacto de estas traducciones ha sido sorprendente debido a la cantidad de nuevos lectores que encuentran historias de HackerNoon .

¿Cómo se construyó?

Comenzamos con la API de traducción de Google . Nos gusta mucho la precisión y, con un equipo diverso , podemos verificar el contenido de la mayoría de los idiomas para asegurarnos de que la traducción de los artículos sea confiable. Después de ver la simplicidad de la API, creo que esta fue la mejor opción. Estamos explorando varias reglas y herramientas para mejorar la traducción base, pero a largo plazo, apostaremos a que la comunidad mejore estas traducciones (¡habrá más en el futuro!). También creamos una nueva base de datos para almacenar artículos traducidos con el fin de diferenciarlos del contenido original, con, por supuesto, cierta correlación entre los dos.

El marco

La parte más difícil de este proyecto fue crear un marco que de alguna manera cargara los datos estáticos de una página específica en el idioma de esa página específica. La idea aquí es que si alguien está leyendo una historia en francés , los datos estáticos (texto que no cambia) como "nueva historia" mostrarán la versión traducida como "Nouvelle histoire", lo mismo para otros idiomas.


Hay varias formas de lograr esto, decidí simplemente crear un objeto para almacenar el texto de cada idioma, almacenar el objeto en nuestra base de datos y luego cargarlo a través de API según el idioma de la página. Una vez realizada la traducción estática, todo lo que quedaba era traducir las historias principales mediante un guión. Fue un proceso largo, tomó alrededor de dos semanas traducir todas las historias a todos estos idiomas. La mejor parte es que todas las historias traducidas también se agregan al mapa del sitio de HackerNoon con metadatos en el idioma de la página, lo que definitivamente facilitará la experiencia de compartir. Me gusta esta búsqueda en vietnamita en Google:

Espero que todos disfruten leyendo en su idioma nativo, comenten y compartan.