Bu sen misin 👆? CompSci yapmadınız ve şimdi saray soytarısınız, dünyanın şimdiye kadar gördüğü __ en hızlı hareket eden sektörde __ bilgiyi hızla ölçeklendirmeye mi çalışıyorsunuz?
Nefes al. İşte “ gerçekten aptalca bir soru” sorabileceğiniz ve kendinizi yargılanmış hissetmeyeceğiniz, temel konulara geri dönen bir gönderi.
Transformer — Göründüğünden daha fazlası… Makine öğreniminde, özellikle metin veya ses gibi veri dizilerini işlemek için kullanılan bir model türü. Cümlelerdeki bağlamı anlamada iyidir ve dilleri çevirmek, metni özetlemek veya sohbet robotu yanıtları oluşturmak için kullanılabilir.
Büyük Dil Modeli (LLM) — Makaleler yazabilen, soruları yanıtlayabilen veya gerçekçi diyaloglar oluşturabilen devasa bir dil bilgisi veritabanı gibidir.
Transformer, yapay zekada dili işlemek için kullanılan bir tekniktir. Yüksek Lisans, genellikle Transformer tekniği kullanılarak oluşturulan, dil görevleri için büyük bir yapay zeka modelidir.
Arayüz – Bir bilgisayar sisteminin veya yazılımın, kullanıcıların onunla etkileşime girmesine olanak sağlayan kısmı. Bunu, sorunuzu veya komutunuzu yazdığınız ve programın yanıt verdiği bir programın ön ucu olarak düşünün.
Çıkarım — Yapay zekada bu, tahminlerde bulunmak veya kararlar almak için eğitimli bir model kullanmak anlamına gelir. Örneğin, bir modeli resimlerdeki kedileri tanıyacak şekilde eğittikten sonra çıkarım, modelin yeni bir resme bakıp içinde kedi olup olmadığına karar vermesidir.🐈⬛
Denetimli Öğrenme - Model örneklerini cevaplarla birlikte verdiğiniz makineleri eğitmenin bir yolu. Bir programa çok sayıda kedi resmi gösterip ona 'Bu bir kedi' demek gibi, böylece kedilerin neye benzediğini öğrenir.
Denetimsiz Öğrenme ( heeeyo) — Bir makineyi, ona yanıtlar vermeden eğitmek. Model verilere bakar ve kendi başına kalıpları veya grupları bulmaya çalışır. Örneğin, tür adları söylenmeden farklı müzik türlerini türlere göre sıralayabilir.
Takviyeli Öğrenme – Makinelere deneme yanılma yoluyla öğretme. Makine bir durumda seçimler yapar ve seçimlerinin iyi ya da kötü olmasına bağlı olarak ödüller ya da cezalar alır, zamanla daha iyi kararlar almayı öğrenir ( ya da kırgın ve gizli olmayı)
Sinir Ağı – Biraz insan beyni gibi çalışacak şekilde tasarlandı. Bilgiyi işlemek ve sorunları çözmek için birlikte çalışan çok sayıda küçük birimden (beyin hücreleri gibi) oluşur.
Verilerinizi Toplama
Çok çeşitli metin verileri toplayarak başlayın. Bu, kitapları, çevrimiçi makaleleri veya veritabanlarındaki verileri içerebilir. Verileriniz ne kadar çeşitli olursa, LLM'niz dilin farklı yönlerini anlama konusunda o kadar iyi olacaktır.
Kaggle, makine öğrenimi ve veri bilimi projeleri için harika verilere sahiptir. Avustralyalı yerel ve Kaggle büyükustası Jeremy Howard'a göz atın.
GitHub genellikle araştırmacılar ve geliştiriciler tarafından yayınlanan veri kümelerini barındırır. Aramak için iyi bir yer.
Bahsetmeye değer - makaleler + resmi sitelerle ilgili veri kümeleri için Google Akademik
Verilerin Ön İşlenmesi
Şimdi bu verileri temizleyin. Bu adım, hataları düzeltmek, kullanışlı olmayan parçaları kaldırmak ve yapay zekanızın bunlardan etkili bir şekilde öğrenebilmesi için bunları düzenlemekle ilgilidir.
Hususlar
Eksik değerleri nasıl ele alacaksınız, biçimlendirme sorunlarını nasıl çözeceksiniz, yinelenen verilerle nasıl başa çıkacaksınız?
Model mimarisi esas olarak modelin tasarımı veya yapısıdır ve yapay zekanın bilgiyi nasıl işlediğine rehberlik eden plan görevi görür.
Transformer mimarisi, veri içindeki bağlamı anlamaya odaklanarak metin gibi sıralı verileri işlemek için özel olarak tasarlanmıştır ve bugünlük buna sadık kalacağız.
Hazırlanan verileri yapay zeka modelinize besleyin. Yapay zekanızın dilin inceliklerini öğrenmeye başladığı yer burasıdır. Eğitim, özellikle çok fazla veri söz konusu olduğunda zaman ve kaynak tüketen bir süreç olabilir. (Burası Unsloth'taki arkadaşlarımdan bahsetmek istediğim yer, podcast yakında gelecek)
Eğitimden sonra yapay zekanızın dili ne kadar iyi anladığını ve ürettiğini değerlendirin. Sonuçlara bağlı olarak performansını artırmak için ayarlamalar yapmanız ve yeniden eğitmeniz gerekebilir.
Şimdi, canavarı nasıl çalıştıracaksın?
Sıfırdan bir Yüksek Lisans eğitimi oluşturmak yerine, halihazırda çılgın miktarda veriyle eğitilmiş modellere erişmek için Hugging Face'i kullanabilirsiniz. Bu modelleri bulut hizmetlerinde çalıştırabilir veya makinenizde yerel olarak çalışacak şekilde indirebilirsiniz.
Seçiminiz ne olursa olsun, önemli olan eğitimli bir LLM modeline ve ister internet üzerinden ister doğrudan bilgisayarınız üzerinden onunla etkileşim kurma araçlarına sahip olmaktır.
Bu, açık kaynaklı yapay zekanın anlaşılması ve benimsenmesi engellerini azaltmayı amaçlayan bir dizi gönderinin birinci kısmıdır.
Burada podcast yazıp üretiyorum.
Diğer bağlantılar burada https://linktr.ee/Unsupervisedlearning
Burada da yayınlandı