APENAS ISSO: Adicionamos 5 novos idiomas a esse recurso, elevando o número total de idiomas disponíveis no HackerNoon para 13! Os novos idiomas incluem
A população mundial actual é de cerca de 8 mil milhões, então porquê apontar apenas para os 331,9 milhões da população americana? Bem, acabamos de fazer o impossível, impensável e imprevisível. No HackerNoon , queremos (pelo menos estamos tentando) dar a todos na TERRA com acesso à Internet uma chance justa de ler o conteúdo relevante que está movendo o mundo.
Usamos o aprendizado de máquina para traduzir todas as principais notícias da nossa plataforma, do inglês para o espanhol , hindi , mandarim , vietnamita , francês , português e japonês . Continuaremos traduzindo as novas notícias principais que estão por vir. As notícias principais agora verão todos esses idiomas no topo da imagem principal.
Além disso, se você navegar até a página de tags de um idioma específico, notará que a página inteira estará nesse idioma específico. https://hackernoon.com/tagged/hackernoon-hi , por exemplo, será exibido apenas no idioma específico, neste caso, hindi. Mas é o mesmo para outras línguas.
Pois bem, graças ao novo sistema de enquetes criado por Jeferson , pudemos perguntar aos usuários em quais idiomas eles gostariam de ler histórias. Também cruzamos referências com nossos leitores existentes. Os resultados da enquete foram bastante claros, então decidimos seguir em frente. projeto. Confira os resultados aqui mesmo: Como ouvimos nossos usuários, queremos ter certeza de que tudo o que construímos será benéfico. Então o espanhol foi o primeiro idioma traduzido e depois passamos para o resto. O impacto dessas traduções tem sido incrível devido à quantidade de novos leitores que encontram as histórias do HackerNoon .
Começamos com a API de tradução do Google . Gostamos muito da precisão e, com uma equipe diversificada , podemos verificar o conteúdo da maioria dos idiomas para garantir que a tradução dos artigos seja confiável. Depois de ver a simplicidade da API, acho que essa foi a melhor escolha. Estamos explorando diversas regras e ferramentas para melhorar a tradução base, mas no longo prazo apostaremos na comunidade para melhorar essas traduções (mais em breve!). Também criamos uma nova base de dados para armazenar artigos traduzidos, a fim de diferenciá-los do conteúdo original, com, claro, alguma correlação entre os dois.
A parte mais difícil deste projeto foi criar um framework que de alguma forma carregasse os dados estáticos de uma página específica no idioma dessa página específica. A ideia aqui é que se alguém estiver lendo uma história em francês , dados estáticos (texto que não muda) como “nova história” mostrarão a versão traduzida como “Nouvelle histoire”, o mesmo para outros idiomas.
Existem várias maneiras de fazer isso, decidi simplesmente criar um objeto para armazenar o texto de cada idioma, armazenar o objeto em nosso banco de dados e depois carregá-lo via API dependendo do idioma da página. Depois que a tradução estática foi concluída, tudo o que restou foi traduzir as principais notícias por meio do script. Foi um processo longo, demorou cerca de duas semanas para traduzir todas as histórias para todos esses idiomas. O melhor é que todas as histórias traduzidas também são adicionadas ao mapa do site HackerNoon com metadados no idioma da página, o que com certeza facilitará a experiência de compartilhamento. Curta esta pesquisa em vietnamita no Google:
Espero que todos gostem de ler em seu idioma nativo, comentem e compartilhem!