paint-brush
HackerNoon ist eine mehrsprachige Plattform: Alle Top-Storys jetzt in 13 Sprachen verfügbarvon@fabian337
1,510 Lesungen
1,510 Lesungen

HackerNoon ist eine mehrsprachige Plattform: Alle Top-Storys jetzt in 13 Sprachen verfügbar

von Marcos Fabian3m2022/11/21
Read on Terminal Reader
Read this story w/o Javascript

Zu lang; Lesen

HackerNoon nutzte maschinelles Lernen, um alle Top-Storys unserer Plattform vom Englischen ins Spanische, Hindi, Mandarin, Vietnamesisch, Französisch, Portugiesisch und Japanisch zu übersetzen. Wir werden weiterhin neue Top-Storys übersetzen. In Top-Storys werden jetzt alle diese Sprachen über dem Feature-Bild angezeigt. Wir erforschen verschiedene Regeln und Tools, um die Basisübersetzung zu verbessern, aber auf lange Sicht werden wir darauf wetten, dass die Community diese Übersetzungen verbessert (weitere folgen zu einem späteren Zeitpunkt!).
featured image - HackerNoon ist eine mehrsprachige Plattform: Alle Top-Storys jetzt in 13 Sprachen verfügbar
Marcos Fabian HackerNoon profile picture
0-item



DAS GERADE IN: Wir haben dieser Funktion 5 neue Sprachen hinzugefügt, wodurch sich die Gesamtzahl der auf HackerNoon verfügbaren Sprachen auf 13 erhöht! Zu den neuen Sprachen gehören Russisch , Koreanisch , Türkisch , Deutsch Und Bengali .


Die derzeitige Weltbevölkerung beträgt etwa 8 Milliarden. Warum also nur die 331,9 Millionen amerikanische Bevölkerung anstreben? Nun, wir haben einfach das Unmögliche, Undenkbare und Unvorhersehbare getan. Bei HackerNoon möchten wir (zumindest versuchen wir es), jedem auf der ERDE mit Internetzugang eine faire Chance zu geben, die relevanten Inhalte zu lesen, die die Welt bewegen.

Was ist gerade passiert?

Wir haben maschinelles Lernen genutzt, um alle Top-Storys auf unserer Plattform vom Englischen ins Spanische , Hindi , Mandarin , Vietnamesische , Französische , Portugiesische und Japanische zu übersetzen. Wir werden weiterhin neue Top-Storys übersetzen. In Top-Storys werden jetzt alle diese Sprachen über dem Feature-Bild angezeigt.


Auch wenn Sie zur Tag-Seite einer bestimmten Sprache navigieren, werden Sie feststellen, dass die gesamte Seite in dieser bestimmten Sprache vorliegt. https://hackernoon.com/tagged/hackernoon-hi wird beispielsweise nur in der jeweiligen Sprache angezeigt, in diesem Fall Hindi. Aber das Gleiche gilt auch für andere Sprachen.

Warum diese Sprachen?

Dank des neuen Umfragesystems von Jeferson konnten wir Benutzer fragen, in welchen Sprachen sie Geschichten lesen möchten. Wir haben auch Querverweise zu unserer bestehenden Leserschaft erstellt. Die Ergebnisse der Umfrage waren ziemlich eindeutig, also haben wir beschlossen, mit der Umfrage fortzufahren. Projekt. Schauen Sie sich hier die Ergebnisse an: Da wir unseren Benutzern zuhören, möchten wir sicherstellen, dass alles, was wir erstellen, von Nutzen ist. Also war Spanisch die erste Sprache, die übersetzt wurde, und dann gingen wir in den Rest über. Die Wirkung dieser Übersetzungen war erstaunlich, da viele neue Leser HackerNoon-Geschichten finden.

Wie wurde es gebaut?

Wir haben mit der Google Translation API begonnen. Uns gefällt die Genauigkeit sehr und mit einem vielfältigen Team sind wir in der Lage, den Inhalt der meisten Sprachen zu überprüfen, um sicherzustellen, dass die Übersetzungen der Artikel zuverlässig sind. Nachdem ich die Einfachheit der API gesehen habe, denke ich, dass dies die beste Wahl war. Wir erforschen verschiedene Regeln und Tools, um die Basisübersetzung zu verbessern, aber auf lange Sicht werden wir darauf wetten, dass die Community diese Übersetzungen verbessert (weitere folgen zu einem späteren Zeitpunkt!). Wir haben außerdem eine neue Datenbank zum Speichern übersetzter Artikel erstellt, um sie vom Originalinhalt zu unterscheiden, wobei natürlich eine gewisse Korrelation zwischen beiden besteht.

Der Rahmen

Der schwierigste Teil dieses Projekts bestand darin, ein Framework zu erstellen, das die statischen Daten einer bestimmten Seite irgendwie in der Sprache dieser bestimmten Seite lädt. Die Idee dabei ist, dass, wenn jemand eine Geschichte auf Französisch liest, statische Daten (Text, der sich nicht ändert) wie „neue Geschichte“ die übersetzte Version wie „Nouvelle histoire“ anzeigen, dasselbe gilt für andere Sprachen.


Es gibt mehrere Möglichkeiten, dies zu erreichen. Ich habe mich entschieden, einfach ein Objekt zu erstellen, um den Text jeder Sprache zu speichern, das Objekt in unserer Datenbank zu speichern und es dann je nach Sprache der Seite über die API zu laden. Nachdem die statische Übersetzung fertig war, mussten wir nur noch die Top-Storys per Skript übersetzen. Es war ein langer Prozess, es dauerte etwa zwei Wochen, alle Geschichten in alle diese Sprachen zu übersetzen. Das Beste daran ist, dass alle übersetzten Geschichten auch zur HackerNoon-Sitemap mit Metadaten in der Sprache der Seite hinzugefügt werden, was das Teilen-Erlebnis definitiv erleichtert. Gefällt mir diese Suche auf Vietnamesisch bei Google:

Ich wünsche Ihnen allen viel Spaß beim Lesen in Ihrer Muttersprache, beim Kommentieren und Teilen!