paint-brush
HackerNoon é uma plataforma multilíngue: todas as notícias principais agora disponíveis em 13 idiomaspor@fabian337
1,510 leituras
1,510 leituras

HackerNoon é uma plataforma multilíngue: todas as notícias principais agora disponíveis em 13 idiomas

por Marcos Fabian3m2022/11/21
Read on Terminal Reader
Read this story w/o Javascript

Muito longo; Para ler

HackerNoon usou aprendizado de máquina para traduzir todas as principais notícias de nossa plataforma de inglês para espanhol, hindi, mandarim, vietnamita, francês, português e japonês. Continuaremos traduzindo as novas notícias principais que estão por vir. As notícias principais agora verão todos esses idiomas no topo da imagem principal. Estamos explorando diversas regras e ferramentas para melhorar a tradução base, mas no longo prazo apostaremos na comunidade para melhorar essas traduções (mais em breve!).
featured image - HackerNoon é uma plataforma multilíngue: todas as notícias principais agora disponíveis em 13 idiomas
Marcos Fabian HackerNoon profile picture
0-item



APENAS ISSO: Adicionamos 5 novos idiomas a esse recurso, elevando o número total de idiomas disponíveis no HackerNoon para 13! Os novos idiomas incluem russo , coreano , turco , Alemão e bengali .


A população mundial actual é de cerca de 8 mil milhões, então porquê apontar apenas para os 331,9 milhões da população americana? Bem, acabamos de fazer o impossível, impensável e imprevisível. No HackerNoon , queremos (pelo menos estamos tentando) dar a todos na TERRA com acesso à Internet uma chance justa de ler o conteúdo relevante que está movendo o mundo.

O que acabou de acontecer?

Usamos o aprendizado de máquina para traduzir todas as principais notícias da nossa plataforma, do inglês para o espanhol , hindi , mandarim , vietnamita , francês , português e japonês . Continuaremos traduzindo as novas notícias principais que estão por vir. As notícias principais agora verão todos esses idiomas no topo da imagem principal.


Além disso, se você navegar até a página de tags de um idioma específico, notará que a página inteira estará nesse idioma específico. https://hackernoon.com/tagged/hackernoon-hi , por exemplo, será exibido apenas no idioma específico, neste caso, hindi. Mas é o mesmo para outras línguas.

Por que essas línguas?

Pois bem, graças ao novo sistema de enquetes criado por Jeferson , pudemos perguntar aos usuários em quais idiomas eles gostariam de ler histórias. Também cruzamos referências com nossos leitores existentes. Os resultados da enquete foram bastante claros, então decidimos seguir em frente. projeto. Confira os resultados aqui mesmo: Como ouvimos nossos usuários, queremos ter certeza de que tudo o que construímos será benéfico. Então o espanhol foi o primeiro idioma traduzido e depois passamos para o resto. O impacto dessas traduções tem sido incrível devido à quantidade de novos leitores que encontram as histórias do HackerNoon .

Como foi construído?

Começamos com a API de tradução do Google . Gostamos muito da precisão e, com uma equipe diversificada , podemos verificar o conteúdo da maioria dos idiomas para garantir que a tradução dos artigos seja confiável. Depois de ver a simplicidade da API, acho que essa foi a melhor escolha. Estamos explorando diversas regras e ferramentas para melhorar a tradução base, mas no longo prazo apostaremos na comunidade para melhorar essas traduções (mais em breve!). Também criamos uma nova base de dados para armazenar artigos traduzidos, a fim de diferenciá-los do conteúdo original, com, claro, alguma correlação entre os dois.

O quadro

A parte mais difícil deste projeto foi criar um framework que de alguma forma carregasse os dados estáticos de uma página específica no idioma dessa página específica. A ideia aqui é que se alguém estiver lendo uma história em francês , dados estáticos (texto que não muda) como “nova história” mostrarão a versão traduzida como “Nouvelle histoire”, o mesmo para outros idiomas.


Existem várias maneiras de fazer isso, decidi simplesmente criar um objeto para armazenar o texto de cada idioma, armazenar o objeto em nosso banco de dados e depois carregá-lo via API dependendo do idioma da página. Depois que a tradução estática foi concluída, tudo o que restou foi traduzir as principais notícias por meio do script. Foi um processo longo, demorou cerca de duas semanas para traduzir todas as histórias para todos esses idiomas. O melhor é que todas as histórias traduzidas também são adicionadas ao mapa do site HackerNoon com metadados no idioma da página, o que com certeza facilitará a experiência de compartilhamento. Curta esta pesquisa em vietnamita no Google:

Espero que todos gostem de ler em seu idioma nativo, comentem e compartilhem!