paint-brush
100 Gün Yapay Zeka, 11. Gün: Nesil Yapay Zeka Uygulamalarında İnce Ayar Sihirbazı Olmakby@sindamnataraj
873
873

100 Gün Yapay Zeka, 11. Gün: Nesil Yapay Zeka Uygulamalarında İnce Ayar Sihirbazı Olmak

Nataraj4m2024/02/26
Read on Terminal Reader

İnce ayar, ChatGPT veya LLama'nın yanıt sağlamak için güvendiği temel modellerin sınırlamalarının üstesinden gelmemize olanak tanır. Temel modelinize nasıl ince ayar yapacağınız aşağıda açıklanmıştır!
featured image - 100 Gün Yapay Zeka, 11. Gün: Nesil Yapay Zeka Uygulamalarında İnce Ayar Sihirbazı Olmak
Nataraj HackerNoon profile picture

Selam millet! Ben Nataraj ve tıpkı sizin gibi ben de yapay zekanın son zamanlardaki ilerlemelerine hayran kaldım. Olan tüm gelişmelere ayak uydurmam gerektiğini fark ederek kişisel bir öğrenme yolculuğuna çıkmaya karar verdim ve böylece 100 günlük yapay zeka doğdu! Bu seriyle yüksek lisans (LLM) hakkında bilgi edineceğim ve fikirleri, deneyleri, görüşleri, trendleri ve öğrendiklerimi blog yazılarım aracılığıyla paylaşacağım. Yolculuğumuzu HackerNoon'dan buradan veya kişisel web sitemden takip edebilirsiniz. Bugünkü makalemizde GPT-4'ün yardımıyla Semantik Çekirdek oluşturmaya bakacağız.


Üretken yapay zeka veya LLM alanını takip ediyorsanız İnce Ayar'ı zaten duymuşsunuzdur. Bu yazıda ince ayarın ne olduğunu ve gen yapay zeka uygulamalarının geliştirilmesindeki rolünün ne olduğunu anlamaya çalışalım.

İnce Ayar Nedir?

İnce ayar, genel amaçlı bir temel modeli, özel bir kullanım durumunda çalışmasını sağlayacak şekilde değiştirme işlemidir. Örneğin Open AI'nin gpt-3 modelini alın. Gpt-3, bir sohbet botu olma amacıyla ince ayar yapılmış bir temel modeldir ve bu da insanların artık chat-gpt uygulaması olarak adlandırdığı şeyin ortaya çıkmasına neden olmuştur. Başka bir örnek, GitHub yardımcı pilotunu oluşturmak için GPT-4 modelinin kodlayıcılar için yardımcı pilot olacak şekilde değiştirilmesi olabilir.

Temel modellerde neden ince ayar yapmamız gerekiyor?

İnce ayar, temel modellerin sınırlamalarının üstesinden gelmemizi sağlar. Open AI'nin gpt-3'ü veya Meta'nın Llama'sı gibi temel modeller genellikle internetin tüm verileri üzerinde eğitilir. Ancak kuruluşunuzun dahili verilerinin bağlamına sahip değiller. Kuruluşunuzla veya özel kullanım senaryonuzla ilgili tüm verileri istem yoluyla vermek mümkün değildir. İnce ayar, hızlı mühendisliğin izin verdiğinden çok daha fazla veriyi sığdırmamıza olanak tanır. İnce ayar aynı zamanda modelin tutarlı çıktılar oluşturmasına, halüsinasyonları azaltmasına ve modeli belirli bir kullanım durumu için özelleştirmesine olanak tanır.

İnce ayarın hızlı mühendislikten farkı nedir?

Önceki yazılarda istem mühendisliğinin ne kadar güçlü olabileceğini görmüştük. Peki ince ayarın farkı nedir? İnce ayar, kurumsal uygulamaların kullanım durumu içindir; hızlı mühendislik ise genel kullanım durumları içindir ve veri gerektirmez. Teknik olarak RAG ile ek verilerle birlikte kullanılabilir ancak kurumsal kullanım senaryolarında var olan büyük verilerle kullanılamaz. İnce ayar sınırsız veriye izin verir, modelin yeni bilgiler öğrenmesini sağlar, aynı zamanda bir RAG ile birlikte de kullanılabilir.

İnce Ayar ve Hızlı Mühendislik Karşılaştırması

İnce ayarlı ve İnce ayarlı olmayan yanıtın karşılaştırılması

İnce ayarlı ve ince ayarlı olmayan modeller arasındaki fark hakkında size daha iyi bir fikir verebilecek bir örnek verelim. Farkı göstermek amacıyla hem ince ayarlı hem de ince ayarlı olmayan Llama modellerini çağırmak için Lamini'nin kitaplıklarını kullanıyorum. Bunun için Lamini'nin api anahtarına ihtiyacınız olacak. Lamini, açık kaynaklı Yüksek Lisans Programlarıyla etkileşim kurmanın basit ve kolay bir yolunu sağlar. Bu konuda daha fazla bilgi edinmek istiyorsanız buraya göz atın.

Lamini ince ayarlı vs İnce ayarsız yanıt

Bu örnekte her iki modele de aynı soruyu sordum: “Ölüm hakkında ne düşünüyorsunuz?” ve işte yanıtlar.

İnce Ayarlı Olmayan Lama Modelinden Yanıt:

İnce Ayarlı Olmayan Lama Modelinden Yanıt

İnce Ayarlı Lama Modelinden Yanıt:

İnce Ayarlı Lama Modelinden Yanıt


İlk yanıtın yalnızca tek bir satırın tekrarı olduğunu, ikinci yanıtın ise çok daha tutarlı bir yanıt olduğunu fark edeceksiniz. Burada olup bitenlerden bahsetmeden önce modele “Adın ne?” diye sorduğum başka bir örnek verelim. İşte elde ettiğim şey.

İnce Ayarlı Olmayan Lama Modelinden Yanıt:

İnce Ayarlı Olmayan Lama Modelinden Yanıt

İnce Ayarlı Lama Modelinden Yanıt:

İnce Ayarlı Lama Modelinden Yanıt


İnce ayar yapılmamış model yanıtlarında yanıtlar tuhaf çünkü model yalnızca bir şey yapıyor. Giriş metninize göre bir sonraki olası metni tahmin etmeye çalışıyor, aynı zamanda ona bir soru sorduğunuzun da farkında değil. İnternet verileri üzerinde eğitilen tabanlı modeller, metin tahmin makineleridir ve bir sonraki en iyi metni tahmin etmeye çalışırlar. İnce ayar ile model, ek veriler vererek yanıtını temel alacak şekilde eğitilir ve soruları yanıtlayacak bir sohbet botu gibi davranacak yeni davranışı öğrenir. Ayrıca Open AI'nin gpt-3 veya gpt-4'ü gibi kapalı modellerin çoğunun, hangi veriler üzerinde eğitildiklerini tam olarak bilmediğimizi unutmayın. Ancak modellerinizi eğitmek için kullanılabilecek bazı harika açık veri kümeleri var. Daha sonra bunun hakkında daha fazla bilgi vereceğiz.


Yapay Zekanın 100 Günü'nün 11. Günü bu kadar.


Büyük teknolojide olup biten her şeyin ardındaki ikinci dereceden içgörülerden bahsettiğim Ortalamanın Üstünde adlı bir haber bülteni yazıyorum. Teknolojiyle ilgiliyseniz ve ortalama olmak istemiyorsanız abone olun .


Yapay zekanın 100 günüyle ilgili en son güncellemeler için beni Twitter , LinkedIn veya HackerNoon'da takip edin. Teknolojiyle ilgileniyorsanız, buradaki teknoloji profesyonellerinden oluşan topluluğuma katılmak ilginizi çekebilir.