Üretken yapay zeka uygulamalarının geliştirilmesi
Bu serideki önceki makalede ,
Burada, Yüksek Lisans ile gerçek etkileşime bakacağız ve kötü sonuçlara yol açabilecek birkaç yaygın sorunu inceleyeceğiz: belirsiz yönlendirmeler ve yetersiz üretim yaklaşımları.
En iyi yerleştirme ve parçalama stratejileri bile kalite ihtiyacının yerini alamaz
Özellikle RAG uygulamalarına yönelik istemlerinizi oluştururken göz önünde bulundurmanız gereken birkaç nokta vardır. Bunlar şunları içerir:
Yüksek Lisans'a rolünü söyleyin: ChatGPT gibi Yüksek Lisans temsilcileriyle etkileşimde bulunurken, varsayılan olarak yardımcı bir sohbet robotu gibi davranacaklardır. Ancak LLM'ye belirli bir şekilde hareket etmesi talimatını vererek oluşturulacak yanıtların doğasını değiştirebilirsiniz. Örnekler arasında "taraflardan herhangi birinin bir anlaşmayı ihlal edip etmediğini değerlendiren bir avukatsınız" veya "bir internet servis sağlayıcısının müşteri hizmetleri temsilcisisiniz; göreviniz insanların internet sorunlarını gidermelerine yardımcı olmaktır” veya sizin özel durumunuz için anlamlı olan her neyse.
Yüksek Lisans'a sağlanan bağlamı kullanmasını açıkça söyleyin : Yüksek Lisans'a bağlam sağladığınızı ve oluşturulan yanıtın bu bağlamı yansıtmasını istediğinizi açıkça belirtin. Bunu, "cevabınız aşağıdaki bağlamı dikkate almalıdır" gibi bir şey söyleyerek ve ardından bağlamı söyleyerek yapabilirsiniz. Örnekleri kullanın: Az önce bahsedilen LLM'den sözleşmeleri değerlendiren bir avukat olarak hareket etmesini isteme senaryosunda, bilgi istemine birkaç örnek eklemek isteyebilirsiniz. Örneğin, ödemenin 30 gün içinde yapılacağını ancak alıcının ödemeyi sözleşmenin imzalanmasından 40 gün sonra göndermediğini ve dolayısıyla sözleşmeyi ihlal ettiğini belirten bir sözleşme örneği verebilirsiniz. Sözleşme ihlallerini gidermeye yönelik haklara ve olası çözüm yollarına ilişkin ek örnekler sağlayabilirsiniz.
Çıkış formatını belirtin: Kullanım durumunuz belirli bir çıktı gerektiriyorsa, oluşturulan çıktının uyması gereken formatı belirtebilirsiniz. LLM'ye hem nasıl yanıt vermesini istediğinizi, hem de oluşturulan yanıtta beklediğiniz önemli bilgi noktalarını açıklığa kavuşturmak için örnekler sağlamak amacıyla bu tekniği yukarıdaki ipucuyla birleştirebilirsiniz.
Düşünce zincirini kullanın : Uygun yanıtı belirlemek için akıl yürütmenin dahil olduğu kullanım durumları için, LLM'nin oluşturulan bir yanıta ulaşmak için izlemesini istediğiniz adımları açıklamaya yardımcı olması amacıyla düşünce zinciri adı verilen bir teknik kullanmayı düşünebilirsiniz. Örneğin, yasal sözleşmeler durumunda, bir kişinin bir sözleşme şartının ihlal edilip edilmediğini belirlemek için takip edeceği mantıksal adımları LLM'ye yönlendirmek isteyebilirsiniz. Örneğin, yasal sözleşmelerle uğraşırken LLM'ye öncelikle ödeme koşullarını belirten maddeleri aramasını, ardından alıcının ödemeyi yapması gereken süreyi belirlemesini, ardından ödemenin alındığı tarih ile ödemenin yapıldığı tarih arasındaki gün sayısını hesaplamasını söyleyebilirsiniz. sözleşmenin imzalandığı tarih. Daha sonra ödemenin kararlaştırılan süreden daha uzun sürmesi durumunda alıcı anlaşmayı ihlal etmiş demektir.
Hızlı mühendisliğinizi geliştirmek için bu tekniklerden yararlanmanız, RAG uygulamalarınızda üretebileceğiniz oluşturulan sonuçların kalitesi üzerinde önemli bir etkiye sahip olabilir. Ancak bazen kabul edilebilir bir yanıt elde etmek için LLM ile birden fazla değişimi içeren teknikleri kullanmanız gerekecektir.
İleriye dönük aktif geri alma veya
FLARE'in LangChain yemek kitabı örneğinde FLARE'in nasıl çalıştığına dair bir örnek görebilirsiniz.
Kullanıcının sorgusuna benzer sorgular oluşturarak ve hem orijinal sorgu hem de oluşturulan benzer sorgular için ilgili bağlamı alarak, doğru sonuçlar üretmek için en kullanışlı bağlamı seçme olasılığımızı artırabiliyoruz. "RAG füzyonu" adı verilen süreç şuna benzer:
Buradaki anahtar adım, bir yanıt oluşturmak için kullanılacak en ilgili bağlamı belirlemek amacıyla YSA sonuçlarını daha da hassaslaştırmak için karşılıklı sıralama fonksiyonunu kullanmaktır.
RAG, başlaması kolay bir yaklaşımdır ancak çoğu zaman geliştiricilerin belirsiz nedenlerden dolayı tatmin edici olmayan sonuçlardan dolayı hayal kırıklığına uğramasına neden olur. RAG'ın etkin olduğu üretken yapay zeka uygulamalarındaki çıktıların uygunluğu çeşitli faktörlerden etkilenebilir. Gömme modellerini titizlikle seçerek, parçalama stratejilerini formüle ederek ve istemleri tasarlayarak, ChatGPT gibi LLM'ler tarafından desteklenen sistemlerde oluşturulan yanıtların kalitesini ve hassasiyetini önemli ölçüde artırabilirsiniz. Bu ipuçlarının, hedeflediğiniz deneyimi ve değeri sunan daha kullanışlı RAG uygulamaları oluşturmanıza yardımcı olacağını umuyoruz.
Yazan: Chris Latimer, DataStax
Ayrıca burada görünür.