paint-brush
Ortak Erişim Artırılmış Üretim Zorluklarını Ele Alarak İlgili Yüksek Lisans Yanıtlarına Ulaşmakile@datastax
745 okumalar
745 okumalar

Ortak Erişim Artırılmış Üretim Zorluklarını Ele Alarak İlgili Yüksek Lisans Yanıtlarına Ulaşmak

ile DataStax4m2024/01/16
Read on Terminal Reader

Çok uzun; Okumak

RAG uygulamalarında ve LLM etkileşimlerinde ortaya çıkabilecek genel sorunlara bakıyoruz.
featured image - Ortak Erişim Artırılmış Üretim Zorluklarını Ele Alarak İlgili Yüksek Lisans Yanıtlarına Ulaşmak
DataStax HackerNoon profile picture
0-item
1-item


Üretken yapay zeka uygulamalarının geliştirilmesi artırılmış nesil alma (RAG) ve vektör veritabanları zorlayıcı olabilir. İlgili bağlamın alındığından emin olmak için vektör veritabanlarına dayanan RAG uygulamalarında sıklıkla sorun gidermeniz gerekecektir; bu kritiktir, çünkü bu bağlam daha sonra daha doğru sonuçlar sağlamak için büyük bir dil modeline yönelik bir istemde yer alır.


Bu serideki önceki makalede , vektör veritabanı kötü sonuçlara yol açabilecek üç alanı değerlendirdi: optimal olmayan yerleştirme modelleri, verimsiz parçalama stratejileri ve meta veri filtreleme eksikliği.

Burada, Yüksek Lisans ile gerçek etkileşime bakacağız ve kötü sonuçlara yol açabilecek birkaç yaygın sorunu inceleyeceğiz: belirsiz yönlendirmeler ve yetersiz üretim yaklaşımları.

Hızlı ayrıntılandırma

En iyi yerleştirme ve parçalama stratejileri bile kalite ihtiyacının yerini alamaz hızlı mühendislik . Bu, istemlerin daha açık, spesifik ve amaçlanan çıktıyla uyumlu hale getirilmesini içerir. RAG sürecine ince ayar yapmak için çeşitli bilgi istemi formatları, uzunlukları ve sözcük seçimleri test edilmelidir.

Yüksek Lisans'a basitleştirilmiş bir bakış


Özellikle RAG uygulamalarına yönelik istemlerinizi oluştururken göz önünde bulundurmanız gereken birkaç nokta vardır. Bunlar şunları içerir:


Yüksek Lisans'a rolünü söyleyin: ChatGPT gibi Yüksek Lisans temsilcileriyle etkileşimde bulunurken, varsayılan olarak yardımcı bir sohbet robotu gibi davranacaklardır. Ancak LLM'ye belirli bir şekilde hareket etmesi talimatını vererek oluşturulacak yanıtların doğasını değiştirebilirsiniz. Örnekler arasında "taraflardan herhangi birinin bir anlaşmayı ihlal edip etmediğini değerlendiren bir avukatsınız" veya "bir internet servis sağlayıcısının müşteri hizmetleri temsilcisisiniz; göreviniz insanların internet sorunlarını gidermelerine yardımcı olmaktır” veya sizin özel durumunuz için anlamlı olan her neyse.


Yüksek Lisans'a sağlanan bağlamı kullanmasını açıkça söyleyin : Yüksek Lisans'a bağlam sağladığınızı ve oluşturulan yanıtın bu bağlamı yansıtmasını istediğinizi açıkça belirtin. Bunu, "cevabınız aşağıdaki bağlamı dikkate almalıdır" gibi bir şey söyleyerek ve ardından bağlamı söyleyerek yapabilirsiniz. Örnekleri kullanın: Az önce bahsedilen LLM'den sözleşmeleri değerlendiren bir avukat olarak hareket etmesini isteme senaryosunda, bilgi istemine birkaç örnek eklemek isteyebilirsiniz. Örneğin, ödemenin 30 gün içinde yapılacağını ancak alıcının ödemeyi sözleşmenin imzalanmasından 40 gün sonra göndermediğini ve dolayısıyla sözleşmeyi ihlal ettiğini belirten bir sözleşme örneği verebilirsiniz. Sözleşme ihlallerini gidermeye yönelik haklara ve olası çözüm yollarına ilişkin ek örnekler sağlayabilirsiniz.


Çıkış formatını belirtin: Kullanım durumunuz belirli bir çıktı gerektiriyorsa, oluşturulan çıktının uyması gereken formatı belirtebilirsiniz. LLM'ye hem nasıl yanıt vermesini istediğinizi, hem de oluşturulan yanıtta beklediğiniz önemli bilgi noktalarını açıklığa kavuşturmak için örnekler sağlamak amacıyla bu tekniği yukarıdaki ipucuyla birleştirebilirsiniz.


Düşünce zincirini kullanın : Uygun yanıtı belirlemek için akıl yürütmenin dahil olduğu kullanım durumları için, LLM'nin oluşturulan bir yanıta ulaşmak için izlemesini istediğiniz adımları açıklamaya yardımcı olması amacıyla düşünce zinciri adı verilen bir teknik kullanmayı düşünebilirsiniz. Örneğin, yasal sözleşmeler durumunda, bir kişinin bir sözleşme şartının ihlal edilip edilmediğini belirlemek için takip edeceği mantıksal adımları LLM'ye yönlendirmek isteyebilirsiniz. Örneğin, yasal sözleşmelerle uğraşırken LLM'ye öncelikle ödeme koşullarını belirten maddeleri aramasını, ardından alıcının ödemeyi yapması gereken süreyi belirlemesini, ardından ödemenin alındığı tarih ile ödemenin yapıldığı tarih arasındaki gün sayısını hesaplamasını söyleyebilirsiniz. sözleşmenin imzalandığı tarih. Daha sonra ödemenin kararlaştırılan süreden daha uzun sürmesi durumunda alıcı anlaşmayı ihlal etmiş demektir.


Hızlı mühendisliğinizi geliştirmek için bu tekniklerden yararlanmanız, RAG uygulamalarınızda üretebileceğiniz oluşturulan sonuçların kalitesi üzerinde önemli bir etkiye sahip olabilir. Ancak bazen kabul edilebilir bir yanıt elde etmek için LLM ile birden fazla değişimi içeren teknikleri kullanmanız gerekecektir.

Gelişmiş Desenler

FİŞEK

İleriye dönük aktif geri alma veya FİŞEK , LLM'nin daha iyi bir yanıt oluşturmasına yardımcı olacak anahtar ifadeler hakkında ek sorular sunmasını isteyen isteminizdeki özel talimatlarla LLM'yi yinelemeli olarak çağırmayı içeren çoklu sorgu RAG tekniğinin bir örneğidir. LLM boşluksuz bir içeriğe sahip olduğunda, son yanıtla sona erer. Süreç, bu yinelemeleri kolaylaştırmak için LLM ile AI aracısı (şemadaki AI sohbet robotu) arasına bir döngü ekler:

FİŞEK


FLARE'in LangChain yemek kitabı örneğinde FLARE'in nasıl çalıştığına dair bir örnek görebilirsiniz.

RAG Füzyonu

Kullanıcının sorgusuna benzer sorgular oluşturarak ve hem orijinal sorgu hem de oluşturulan benzer sorgular için ilgili bağlamı alarak, doğru sonuçlar üretmek için en kullanışlı bağlamı seçme olasılığımızı artırabiliyoruz. "RAG füzyonu" adı verilen süreç şuna benzer:

RAG Füzyonu

Buradaki anahtar adım, bir yanıt oluşturmak için kullanılacak en ilgili bağlamı belirlemek amacıyla YSA sonuçlarını daha da hassaslaştırmak için karşılıklı sıralama fonksiyonunu kullanmaktır.

Çözüm

RAG, başlaması kolay bir yaklaşımdır ancak çoğu zaman geliştiricilerin belirsiz nedenlerden dolayı tatmin edici olmayan sonuçlardan dolayı hayal kırıklığına uğramasına neden olur. RAG'ın etkin olduğu üretken yapay zeka uygulamalarındaki çıktıların uygunluğu çeşitli faktörlerden etkilenebilir. Gömme modellerini titizlikle seçerek, parçalama stratejilerini formüle ederek ve istemleri tasarlayarak, ChatGPT gibi LLM'ler tarafından desteklenen sistemlerde oluşturulan yanıtların kalitesini ve hassasiyetini önemli ölçüde artırabilirsiniz. Bu ipuçlarının, hedeflediğiniz deneyimi ve değeri sunan daha kullanışlı RAG uygulamaları oluşturmanıza yardımcı olacağını umuyoruz.


DataStax Astra DB'yi deneyin , gerçek zamanlı veriler üzerinde üretim düzeyinde yapay zeka uygulamaları oluşturmaya yönelik tek vektör veritabanıdır .


Yazan: Chris Latimer, DataStax


Ayrıca burada görünür.