Çevrimiçi sohbet uygulamalarında insan benzeri yanıtlar üretmenin karmaşıklığını düşünün. Altyapıyı nasıl verimli ve yanıtları gerçekçi hale getirebilirsiniz? Çözüm yapay zeka dil modelleridir. Bu kılavuzda, a16z-infra'nın, özellikle sohbet uygulamaları için ince ayarlı 13 milyar parametreli bir dil modeli olan Meta'nın yeni llama13b-v2-chat LLM'sinin uygulanmasını derinlemesine inceliyoruz. Bu model, karmaşık ve güçlü modellerle yalnızca birkaç satır kodla veya basit bir API çağrısıyla etkileşim kurmanıza olanak tanıyan bir AI modeli barındırma hizmeti olan Replicate'de barındırılır.
Bu kılavuzda llama13b-v2-chat modelinin neyle ilgili olduğunu, girdileri ve çıktıları hakkında nasıl düşünüleceğini ve sohbet tamamlamaları oluşturmak için bunun nasıl kullanılacağını ele alacağız. Ayrıca AIModels.fyi kullanarak AI uygulamalarınızı geliştirmek için benzer modelleri nasıl bulacağınız konusunda da size yol göstereceğiz. Öyleyse yapay zeka jargonunu kesip özüne inelim.
Bunun gibi daha fazla içerik için abone olun veya beni Twitter'da takip edin !
Replicate'de bulunan LLaMA13b-v2-chat modeli , a16z-infra ekibi tarafından oluşturuldu ve Meta'nın yeni LLaMA v2 modelinin üzerine inşa edildi. Meta, LLaMA'yı insan dilini daha iyi anlama ve üretme amacıyla yarattı ve inceleyeceğimiz sohbet modelinde, insan kullanıcılar ile yapay zeka sohbet robotları arasındaki etkileşimi geliştirmek için daha da ince ayarlar yapıldı. 13 milyar gibi çok büyük bir parametreye sahip olan bu model, bu özel kullanım durumu için önemli ölçüde uyarlanmıştır. Bu model ve diğer modeller hakkında daha fazla ayrıntıyı a16z-infra tarafından AIModels.fyi'deki yaratıcı sayfasında bulabilirsiniz.
Llama13b-v2-chat modelinin Replicate uygulaması, tahminler için tahmin başına ortalama 7 saniye çalışma süresiyle güçlü Nvidia A100 (40 GB) GPU'yu kullanır. Çalıştırma başına yalnızca 0,014 ABD Doları fiyatla satılıyor, bu da onu düşük bütçeli projeler veya yeni kurulan şirketler için geniş çapta erişilebilir kılıyor.
Bir modele neyin girip çıktığını anlamak, modelin yeteneklerini etkili bir şekilde kullanmanın anahtarıdır. Şimdi modelin girdi ve çıktılarını tanıyalım.
Model aşağıdaki girdileri kabul eder:
prompt
(string): Llama v2'ye gönderilecek komut istemi.
max_length
(integer): Oluşturulacak maksimum jeton sayısı. Bir kelimenin genellikle 2-3 simgeden oluştuğunu unutmayın. Varsayılan değer 500'dür.
temperature
(sayı): Çıkışların rastgeleliğini ayarlar. 1'den büyük olması rastgele, 0 ise deterministiktir. İyi bir başlangıç değeri 0,75'tir.
top_p
(sayı): Metin kod çözme sırasında, en olası belirteçlerin en üst p yüzdesinden örnekler. Daha az olası belirteçleri göz ardı etmek için bunu düşürün. Varsayılan değer 1'dir.
repetition_penalty
(sayı): Oluşturulan metinde tekrarlanan kelimeler için ceza sağlar. 1 penaltı değildir. 1'den büyük değerler tekrarlamayı engeller, 1'den küçük değerler ise teşvik eder.
debug
(boolean): Günlüklerde hata ayıklama çıktısı sağlamak için kullanılır.
Modelin yaratıcılarının isteminizi oluştururken bu yapıyı izlemenizi önerdiğini unutmayın:
User: <your prompt goes here> Assistant:
Örneğin...
User: give me tips on things to do in Maine Assistant:
Model aşağıdaki çıktıyı üretir:
{ "type": "array", "items": { "type": "string" }, "title": "Output", "x-cog-array-type": "iterator", "x-cog-array-display": "concatenate" }
Şimdi bu modelin nasıl kullanılacağının en ince ayrıntılarına geçelim.
İster kodla uğraşan bir acemi olun, ister tecrübeli bir usta olun, gerçekçi sohbet tamamlamaları oluşturmak için llama13b-v2-chat modelini kullanmak oldukça eğlenceli olabilir.
Modelin arayüzüyle etkileşim kurmak ve sadece oyun oynuyorsanız ve nasıl çalıştığına dair bir fikir edinmek istiyorsanız, çalışmasını anlamak için bu demo bağlantısını kullanın . Bunu projenize uygulamaya hazır olduğunuzda aşağıdaki adımları izleyin.
npm install Replicate
Ardından API belirtecinizin kimliğini doğrulayın ve bunu bir ortam değişkeni olarak ayarlayın. Bu belirteç kişiseldir ve bu nedenle gizli tutulmalıdır:
export REPLICATE_API_TOKEN=r8_******
Daha sonra modeli aşağıdaki komut dosyasıyla çalıştırabilirsiniz:
import Replicate from "replicate"; const replicate = new Replicate({ auth: process.env.REPLICATE_API_TOKEN, }); const output = await replicate.run( "a16z-infra/llama13b-v2-chat:df7690f1994d94e96ad9d568eac121aecf50684a0b0963b25a41cc40061269e5", { input: { prompt: "..." } } );
Tahmininiz tamamlandığında çağrılacak bir web kancası da ayarlayabilirsiniz. Bu, günlüklerin tutulmasında veya otomatik uyarıların ayarlanmasında yararlı olabilir.
const prediction = await replicate.predictions.create({ version: "df7690f1994d94e96ad9d568eac121aecf50684a0b0963b25a41cc40061269e5", input: { prompt: "..." }, webhook: "https://example.com/your-webhook", webhook_events_filter: ["completed"] });
Daha fazla ayrıntı için her zaman Replicate'deki belgelere başvurabilirsiniz.
Uygulamanız için başka sohbet robotlarını keşfetmek ister misiniz? AIModels.fyi'yi kullanırken llama13b-v2-chat'e benzer modelleri bulmak kolaydır.
Özel ihtiyaçlarınızı karşılayan diğer yapay zeka modellerini bulmanıza yardımcı olacak adım adım kılavuzu burada bulabilirsiniz:
Araştırmanıza başlamak için AIModels.fyi'ye gidin.
"Metinden metne", "dil modelleri" vb. gibi anahtar ifadeleri yazın. Arama motoru, sorgunuza uygun modellerin bir listesini sağlayacaktır.
Aramanızı daraltmaya yönelik filtreleri arama sonuçları sayfanızda bulabilirsiniz. Modelleri türe, maliyete, popülerliğe ve hatta belirli yaratıcılara göre filtreleyebilir ve sıralayabilirsiniz. Örneğin, bütçeye uygun bir metinden metne modeli arıyorsanız, en ucuz seçeneği bulmak için modelleri fiyata göre sıralayabilirsiniz.
Bu kılavuzda, zengin özelliklere sahip, uygun maliyetli bir dil modeli olan LLaMA v2'nin potansiyelini araştırdık. Bir sonraki sohbet uygulamanızın potansiyel omurgasıdır, incelikli ve gerçekçi sohbeti güçlendirir. Artık bu modeli nasıl uygulayacağınızı, girdilerini/çıktılarını nasıl anlayacağınızı ve ilgili sohbet tamamlamalarını etkili bir şekilde nasıl oluşturacağınızı biliyorsunuz.
Hayal gücünüzü alıp bu yapay zeka araçlarıyla birleştirerek, kendinizi yapay zekanın geniş evrenine açarak yeni ve heyecan verici projeler yaratabilirsiniz. Bundan sonra nereye gideceğinizi görmek için heyecanlıyız. Daha fazla eğitime abone olmayı, yeni ve geliştirilmiş yapay zeka modelleri hakkında güncel bilgilere sahip olmayı ve bir sonraki yapay zeka projeniz için yaratıcılığınızı beslemeyi unutmayın. O zamana kadar, AI'nın maceraları kutlu olsun ve twitter'ımda merhaba demeyi unutmayın.
Bunun gibi daha fazla içerik için abone olun veya beni Twitter'da takip edin !