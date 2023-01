Muito longo; Para ler O HackerNoon usou o aprendizado de máquina para traduzir todas as principais notícias de nossa plataforma de inglês para espanhol, hindi, mandarim, vietnamita, francês, português e japonês. Continuaremos traduzindo as novas notícias principais que estão por vir. As principais matérias agora verão todos esses idiomas na parte superior da imagem principal. Estamos explorando várias regras e ferramentas para melhorar a tradução base, mas, a longo prazo, estaremos apostando na comunidade para melhorar essas traduções (mais para vir em uma data posterior!).

A população mundial atual é de cerca de 8 bilhões, então por que almejar apenas os 331,9 milhões da população americana? Bem, acabamos de fazer o impossível, impensável e imprevisível. No HackerNoon , queremos (pelo menos estamos tentando) dar a todos na TERRA com acesso à internet, uma chance justa de ler o conteúdo relevante que está movendo o mundo.

O que acabou de acontecer?

Usamos aprendizado de máquina para traduzir todas as notícias principais de nossa plataforma de inglês para espanhol , hindi , mandarim , vietnamita , francês , português e japonês . Continuaremos traduzindo as novas notícias principais que estão por vir. As principais notícias agora verão todos esses idiomas na parte superior da imagem principal.

Além disso, se você navegar para a página de tags de um idioma específico, notará que a página inteira estará nesse idioma específico. https://hackernoon.com/tagged/hackernoon-hi , por exemplo, será exibido apenas no idioma específico, neste caso, hindi. Mas é o mesmo para outras línguas.

Por que essas línguas?

Bem, graças ao novo sistema de votação criado por Jeferson , pudemos perguntar aos usuários em quais idiomas eles gostariam de ler histórias. Também cruzamos referências com nossos leitores existentes. Os resultados da enquete foram bastante claros, então decidimos seguir em frente com o. projeto. Confira os resultados aqui : espanhol foi o primeiro idioma traduzido e depois passamos para o restante. O impacto dessas traduções tem sido incrível devido à quantidade de novos leitores que encontram as histórias do HackerNoon .

Como foi construído?

Começamos com a API de tradução do Google . Gostamos muito da precisão e, com uma equipe diversificada , podemos verificar o conteúdo da maioria dos idiomas para garantir que a tradução dos artigos seja confiável. Depois de ver a simplicidade da API, acho que essa foi a melhor escolha. Estamos explorando várias regras e ferramentas para melhorar a tradução base, mas, a longo prazo, estaremos apostando na comunidade para melhorar essas traduções (mais para vir em uma data posterior!). Também criamos um novo banco de dados para armazenar artigos traduzidos para diferenciá-los do conteúdo original, com alguma correlação entre os dois.

O quadro

A parte mais difícil deste projeto foi criar um framework que de alguma forma carregasse os dados estáticos de uma página específica no idioma daquela página específica. A ideia aqui é que se alguém estiver lendo uma história em francês , dados estáticos (texto que não muda) como “nova história” mostrarão a versão traduzida como “Nouvelle histoire”, a mesma coisa para outros idiomas.





Existem várias maneiras de fazer isso, decidi simplesmente criar um objeto para armazenar o texto de cada idioma, armazenar o objeto em nosso banco de dados e carregá-lo via API dependendo do idioma da página. Depois que a tradução estática foi concluída, tudo o que restou foi traduzir as principais notícias por meio do script. Foi um longo processo, demorou cerca de duas semanas para traduzir todas as histórias para todos esses idiomas. A melhor parte é que todas as histórias traduzidas também são adicionadas ao mapa do site HackerNoon com metadados no idioma da página, o que definitivamente facilitará a experiência de compartilhamento. Como esta pesquisa em vietnamita no google:

Espero que todos gostem de ler em sua língua nativa, comentem e compartilhem!