paint-brush
HackerNoon est une plateforme multilingue : tous les articles à la une sont désormais disponibles en 13 languesby@fabian337
1,454
1,454

HackerNoon est une plateforme multilingue : tous les articles à la une sont désormais disponibles en 13 langues

Marcos Fabian3m2022/11/21
Read on Terminal Reader
Read this story w/o Javascript

HackerNoon a utilisé l'apprentissage automatique pour traduire toutes les principales actualités de notre plateforme de l'anglais vers l'espagnol, l'hindi, le mandarin, le vietnamien, le français, le portugais et le japonais. Nous continuerons à traduire les nouvelles actualités à venir. Les articles à la une verront désormais toutes ces langues en haut de l'image de présentation. Nous explorons diverses règles et outils pour améliorer la traduction de base, mais à long terme, nous parierons sur la communauté pour améliorer ces traductions (plus d'informations à venir ultérieurement !).
featured image - HackerNoon est une plateforme multilingue : tous les articles à la une sont désormais disponibles en 13 langues
Marcos Fabian HackerNoon profile picture
0-item



CECI JUSTE DANS : Nous avons ajouté 5 nouvelles langues à cette fonctionnalité, portant le nombre total de langues disponibles sur HackerNoon à 13 ! Les nouvelles langues incluent russe , coréen , turc , Allemand et bengali .


La population mondiale actuelle est d’environ 8 milliards, alors pourquoi viser seulement les 331,9 millions de la population américaine ? Eh bien, nous avons simplement fait l'impossible, l'impensable et l'imprévisible. Chez HackerNoon , nous voulons (du moins nous essayons) donner à tous les habitants de la TERRE ayant accès à Internet une chance équitable de lire le contenu pertinent qui fait bouger le monde.

Qu'est-ce qui vient de se passer?

Nous avons utilisé l'apprentissage automatique pour traduire toutes les actualités de notre plateforme de l'anglais vers l'espagnol , l'hindi , le mandarin , le vietnamien , le français , le portugais et le japonais . Nous continuerons à traduire les nouvelles actualités à venir. Les articles à la une verront désormais toutes ces langues en haut de l'image de présentation.


De plus, si vous accédez à la page de balises d'une langue spécifique, vous remarquerez que la page entière sera dans cette langue spécifique. https://hackernoon.com/tagged/hackernoon-hi par exemple, ne s'affichera que dans la langue spécifique, en l'occurrence l'hindi. Mais c'est la même chose pour les autres langues.

Pourquoi ces langues ?

Eh bien, grâce au nouveau système de sondage créé par Jefferson , nous avons pu demander aux utilisateurs dans quelles langues ils aimeraient lire des histoires. Nous avons également croisé nos lecteurs existants. Les résultats du sondage étaient assez clairs, nous avons donc décidé d'aller de l'avant. projet. Vérifiez les résultats ici : Puisque nous écoutons nos utilisateurs, nous voulons nous assurer que tout ce que nous construisons sera bénéfique. L’espagnol a donc été la première langue traduite, puis nous sommes passés aux autres langues. L'impact de ces traductions a été étonnant en raison du nombre de nouveaux lecteurs qui découvrent les histoires de HackerNoon .

Comment a-t-il été construit ?

Nous avons commencé avec l' API Google Traduction . Nous apprécions vraiment l'exactitude et, avec une équipe diversifiée , nous sommes en mesure de vérifier le contenu de la plupart des langues pour nous assurer que la traduction des articles est fiable. Après avoir constaté la simplicité de l’API, je pense que c’était le meilleur choix. Nous explorons diverses règles et outils pour améliorer la traduction de base, mais à long terme, nous parierons sur la communauté pour améliorer ces traductions (plus d'informations à venir ultérieurement !). Nous avons également créé une nouvelle base de données pour stocker les articles traduits afin de les différencier du contenu original, avec bien sûr une certaine corrélation entre les deux.

Le cadre

La partie la plus difficile de ce projet a été de créer un cadre permettant de charger d'une manière ou d'une autre les données statiques d'une page spécifique dans la langue de cette page spécifique. L'idée ici est que si quelqu'un lit une histoire en français , des données statiques (texte qui ne change pas) telles que « nouvelle histoire » afficheront la version traduite comme « Nouvelle histoire », même chose pour les autres langues.


Il existe plusieurs façons d'y parvenir, j'ai décidé de simplement créer un objet pour stocker le texte de chaque langue, de stocker l'objet sur notre base de données, puis de le charger via API en fonction de la langue de la page. Une fois la traduction statique terminée, il ne restait plus qu'à traduire les principales histoires via un script. Ce fut un long processus, il a fallu environ deux semaines pour traduire toutes les histoires dans toutes ces langues. Le meilleur, c'est que toutes les histoires traduites sont également ajoutées au plan du site HackerNoon avec des métadonnées dans la langue de la page, ce qui facilitera certainement l'expérience de partage. Aimez cette recherche en vietnamien sur google :

J'espère que vous apprécierez tous lire dans votre langue maternelle, commenter et partager !