Selam millet! Ben Nataraj ve tıpkı sizin gibi ben de yapay zekanın son zamanlardaki ilerlemelerine hayran kaldım. Olan tüm gelişmelere ayak uydurmam gerektiğini fark ederek kişisel bir öğrenme yolculuğuna çıkmaya karar verdim ve böylece 100 günlük yapay zeka doğdu! Bu seriyle yüksek lisans (LLM) hakkında bilgi edineceğim ve fikirleri, deneyleri, görüşleri, trendleri ve öğrendiklerimi blog yazılarım aracılığıyla paylaşacağım. Yolculuğumuzu HackerNoon'dan buradan veya kişisel web sitemden takip edebilirsiniz. Bugünkü makalemizde GPT-4'ün yardımıyla Semantik Çekirdek oluşturmaya bakacağız.
Üretken yapay zeka veya LLM alanını takip ediyorsanız İnce Ayar'ı zaten duymuşsunuzdur. Bu yazıda ince ayarın ne olduğunu ve gen yapay zeka uygulamalarının geliştirilmesindeki rolünün ne olduğunu anlamaya çalışalım.
İnce ayar, genel amaçlı bir temel modeli, özel bir kullanım durumunda çalışmasını sağlayacak şekilde değiştirme işlemidir. Örneğin Open AI'nin gpt-3 modelini alın. Gpt-3, bir sohbet botu olma amacıyla ince ayar yapılmış bir temel modeldir ve bu da insanların artık chat-gpt uygulaması olarak adlandırdığı şeyin ortaya çıkmasına neden olmuştur. Başka bir örnek, GitHub yardımcı pilotunu oluşturmak için GPT-4 modelinin kodlayıcılar için yardımcı pilot olacak şekilde değiştirilmesi olabilir.
İnce ayar, temel modellerin sınırlamalarının üstesinden gelmemizi sağlar. Open AI'nin gpt-3'ü veya Meta'nın Llama'sı gibi temel modeller genellikle internetin tüm verileri üzerinde eğitilir. Ancak kuruluşunuzun dahili verilerinin bağlamına sahip değiller. Kuruluşunuzla veya özel kullanım senaryonuzla ilgili tüm verileri istem yoluyla vermek mümkün değildir. İnce ayar, hızlı mühendisliğin izin verdiğinden çok daha fazla veriyi sığdırmamıza olanak tanır. İnce ayar aynı zamanda modelin tutarlı çıktılar oluşturmasına, halüsinasyonları azaltmasına ve modeli belirli bir kullanım durumu için özelleştirmesine olanak tanır.
Önceki yazılarda istem mühendisliğinin ne kadar güçlü olabileceğini görmüştük. Peki ince ayarın farkı nedir? İnce ayar, kurumsal uygulamaların kullanım durumu içindir; hızlı mühendislik ise genel kullanım durumları içindir ve veri gerektirmez. Teknik olarak RAG ile ek verilerle birlikte kullanılabilir ancak kurumsal kullanım senaryolarında var olan büyük verilerle kullanılamaz. İnce ayar sınırsız veriye izin verir, modelin yeni bilgiler öğrenmesini sağlar, aynı zamanda bir RAG ile birlikte de kullanılabilir.
İnce ayarlı ve ince ayarlı olmayan modeller arasındaki fark hakkında size daha iyi bir fikir verebilecek bir örnek verelim. Farkı göstermek amacıyla hem ince ayarlı hem de ince ayarlı olmayan Llama modellerini çağırmak için Lamini'nin kitaplıklarını kullanıyorum. Bunun için Lamini'nin api anahtarına ihtiyacınız olacak. Lamini, açık kaynaklı Yüksek Lisans Programlarıyla etkileşim kurmanın basit ve kolay bir yolunu sağlar. Bu konuda daha fazla bilgi edinmek istiyorsanız buraya göz atın.
Bu örnekte her iki modele de aynı soruyu sordum: “Ölüm hakkında ne düşünüyorsunuz?” ve işte yanıtlar.
İlk yanıtın yalnızca tek bir satırın tekrarı olduğunu, ikinci yanıtın ise çok daha tutarlı bir yanıt olduğunu fark edeceksiniz. Burada olup bitenlerden bahsetmeden önce modele “Adın ne?” diye sorduğum başka bir örnek verelim. İşte elde ettiğim şey.
İnce ayar yapılmamış model yanıtlarında yanıtlar tuhaf çünkü model yalnızca bir şey yapıyor. Giriş metninize göre bir sonraki olası metni tahmin etmeye çalışıyor, aynı zamanda ona bir soru sorduğunuzun da farkında değil. İnternet verileri üzerinde eğitilen tabanlı modeller, metin tahmin makineleridir ve bir sonraki en iyi metni tahmin etmeye çalışırlar. İnce ayar ile model, ek veriler vererek yanıtını temel alacak şekilde eğitilir ve soruları yanıtlayacak bir sohbet botu gibi davranacak yeni davranışı öğrenir. Ayrıca Open AI'nin gpt-3 veya gpt-4'ü gibi kapalı modellerin çoğunun, hangi veriler üzerinde eğitildiklerini tam olarak bilmediğimizi unutmayın. Ancak modellerinizi eğitmek için kullanılabilecek bazı harika açık veri kümeleri var. Daha sonra bunun hakkında daha fazla bilgi vereceğiz.
Yapay Zekanın 100 Günü'nün 11. Günü bu kadar.
Büyük teknolojide olup biten her şeyin ardındaki ikinci dereceden içgörülerden bahsettiğim Ortalamanın Üstünde adlı bir haber bülteni yazıyorum. Teknolojiyle ilgiliyseniz ve ortalama olmak istemiyorsanız abone olun .
Yapay zekanın 100 günüyle ilgili en son güncellemeler için beni Twitter , LinkedIn veya HackerNoon'da takip edin. Teknolojiyle ilgileniyorsanız, buradaki teknoloji profesyonellerinden oluşan topluluğuma katılmak ilginizi çekebilir.