paint-brush
HackerNoon'un Çok Dilli Platformu: Tüm Önemli Haberler Artık 13 Dilde Mevcutby@fabian337
1,454
1,454

HackerNoon'un Çok Dilli Platformu: Tüm Önemli Haberler Artık 13 Dilde Mevcut

Marcos Fabian3m2022/11/21
Read on Terminal Reader
Read this story w/o Javascript

HackerNoon, platformumuzdaki tüm önemli haberleri İngilizce'den İspanyolca, Hintçe, Mandarin Çincesi, Vietnamca, Fransızca, Portekizce ve Japonca'ya çevirmek için makine öğrenimini kullandı. Gelecek yeni önemli hikayeleri çevirmeye devam edeceğiz. En çok okunan haberler artık tüm bu dilleri özellik görselinin üstünde görecek. Temel çeviriyi geliştirmek için çeşitli kuralları ve araçları araştırıyoruz, ancak uzun vadede bu çevirileri geliştirmek için topluluğa güveneceğiz (daha fazlası daha sonraki bir tarihte gelecek!).
featured image - HackerNoon'un Çok Dilli Platformu: Tüm Önemli Haberler Artık 13 Dilde Mevcut
Marcos Fabian HackerNoon profile picture
0-item



BU SADECE: Bu özelliğe 5 yeni dil ekledik ve HackerNoon'da mevcut olan toplam dil sayısını 13'e çıkardık! Yeni diller şunları içerir: Rusça , Koreli , Türkçe , Almanca Ve Bengalce .


Şu anki dünya nüfusu yaklaşık 8 milyar, öyleyse neden Amerikan nüfusunu sadece 331,9 milyon olarak hedefleyesiniz ki? İmkansızı, düşünülemezi ve öngörülemeyeni başardık. HackerNoon'da , EARTH'teki herkese internet erişimi sağlamak istiyoruz (en azından deniyoruz), Dünyayı harekete geçiren ilgili içeriği okuma konusunda adil bir şans.

Az önce ne oldu?

Platformumuzdaki tüm önemli haberleri İngilizce'den İspanyolca , Hintçe , Mandarin Çincesi , Vietnamca , Fransızca , Portekizce ve Japonca'ya çevirmek için makine öğrenimini kullandık. Gelecek yeni önemli hikayeleri çevirmeye devam edeceğiz. En çok okunan haberler artık tüm bu dilleri özellik görselinin üstünde görecek.


Ayrıca belirli bir dilin etiket sayfasına gittiğinizde sayfanın tamamının o dilde olacağını fark edeceksiniz. Örneğin https://hackernoon.com/tagged/hackernoon-hi yalnızca belirli bir dilde, bu durumda Hintçe olarak gösterilir. Ama diğer diller için de durum aynıdır.

Neden bu Diller?

Jeferson tarafından oluşturulan yeni anket sistemi sayesinde kullanıcılara hangi dillerdeki hikayeleri okumak istediklerini sorabildik. Ayrıca mevcut okuyucu kitlemizle de çapraz referanslarda bulunduk. Anketin sonuçları oldukça açıktı ve biz de ilerlemeye karar verdik. proje. Sonuçları buradan kontrol edin: Kullanıcılarımızı dinlediğimiz için, inşa ettiğimiz her şeyin faydalı olacağından emin olmak istiyoruz. Yani tercüme edilen ilk dil İspanyolcaydı , sonra diğer dillere geçtik. HackerNoon hikayelerini bulan yeni okuyucuların miktarı nedeniyle bu çevirilerin etkisi inanılmaz oldu.

Nasıl inşa edildi?

Google Çeviri API'sıyla başladık. Doğruluğu gerçekten seviyoruz ve çeşitliliğe sahip bir ekiple , makalelerin çevirisinin güvenilir olduğundan emin olmak için çoğu dilin içeriğini kontrol edebiliyoruz. API'nin basitliğini gördükten sonra bunun en iyi seçim olduğunu düşünüyorum. Temel çeviriyi geliştirmek için çeşitli kuralları ve araçları araştırıyoruz, ancak uzun vadede bu çevirileri geliştirmek için topluluğa güveneceğiz (daha fazlası daha sonraki bir tarihte gelecek!). Ayrıca, orijinal içerikten farklılaşmak amacıyla çevrilmiş makaleleri saklayacak yeni bir veri tabanı da oluşturduk ve elbette ikisi arasında bir miktar korelasyon var.

Çerçeve

Bu projenin en zor kısmı, belirli bir sayfanın statik verilerini bir şekilde o sayfanın diline yükleyecek bir çerçeve oluşturmaktı. Buradaki fikir, eğer birisi Fransızca bir hikaye okuyorsa, "yeni hikaye" gibi statik verilerin (değişmeyen metin), "Nouvelle histoire" gibi çevrilmiş versiyonu göstermesidir; diğer diller için de aynı şey geçerlidir.


Bunu başarmanın birden fazla yolu var; her dilin metnini saklamak için basitçe bir nesne oluşturmaya, nesneyi veritabanımızda saklamaya ve ardından sayfanın diline bağlı olarak onu API aracılığıyla yüklemeye karar verdim. Statik çeviri yapıldıktan sonra geriye kalan tek şey, en çok konuşulan hikayeleri senaryo aracılığıyla çevirmekti. Uzun bir süreçti, tüm hikayelerin tüm bu dillere çevrilmesi yaklaşık iki hafta sürdü. Daha iyi yanı, çevrilmiş tüm öykülerin HackerNoon site haritasına sayfanın dilindeki meta verilerle birlikte eklenmesidir, bu da paylaşım deneyimini kesinlikle kolaylaştıracaktır. Google'da Vietnamca yapılan şu aramayı beğenin:

Umarım hepiniz ana dilinizde okumaktan keyif alırsınız, yorum yapın ve paylaşın!