paint-brush
Yapay Zeka Halüsinasyonları Durdurulabilir mi? Bunu Yapmanın 3 Yoluna Bir Bakışby@datastax
2,966
2,966

Yapay Zeka Halüsinasyonları Durdurulabilir mi? Bunu Yapmanın 3 Yoluna Bir Bakış

DataStax6m2023/10/19
Read on Terminal Reader

Yüksek Lisans'ların halüsinasyon görmesini engellemek için üç yöntemin incelenmesi: Geri almayla artırılmış nesil (RAG), akıl yürütme ve yinelemeli sorgulama.
featured image - Yapay Zeka Halüsinasyonları Durdurulabilir mi? Bunu Yapmanın 3 Yoluna Bir Bakış
DataStax HackerNoon profile picture


Büyük dil modelleri bugün son derece güçlü hale geldi; en zor sorularımızdan bazılarına yanıt bulmamıza yardımcı olabilirler. Ama aynı zamanda bizi yoldan da çıkarabilirler: Halüsinasyona eğilimlidirler, bu da doğru gibi görünen ama aslında olmayan cevaplar verdikleri anlamına gelir.


Yüksek Lisans'lar eğitim veri kümelerinin parçası olmayan sorgularla karşılaştıklarında veya eğitim veri kümeleri hatalı bilgiler içerdiğinde halüsinasyon görürler (bu, yüksek lisans eğitimlerinin, hepimizin bildiği gibi her zaman güvenilemeyecek internet verileriyle eğitildiğinde meydana gelebilir) ). Yüksek Lisans'ların da belleği yoktur. Son olarak, "ince ayar" genellikle bir modeli yeni veriler üzerinde yeniden eğiterek halüsinasyonları azaltmanın bir yolu olarak kabul edilir; ancak bunun dezavantajları da vardır.


Burada, LLM'lerin halüsinasyon görmesini engellemek için üç yönteme bakacağız: Almayla artırılmış nesil (RAG), akıl yürütme ve yinelemeli sorgulama.

Alma-artırılmış nesil

İle paçavra , bilgi tabanına bir sorgu gelir (bu durumda bu bir sorgudur) vektör veritabanı ) anlamsal bir vektör olarak - bir sayı dizisi. Model daha sonra benzer belgeleri veritabanından şunu kullanarak alır: vektör arama , vektörleri sorgu vektörüne yakın olan belgeleri arıyoruz.


İlgili belgeler alındıktan sonra sorgu, bu belgelerle birlikte LLM tarafından kullanıcıya verilecek yanıtı özetlemek için kullanılır. Bu şekilde, model yalnızca kendi dahili bilgisine güvenmek zorunda kalmaz, ona sağladığınız verilere doğru zamanda erişebilir. Bir anlamda Yüksek Lisans'a kendi başına sahip olmadığı “uzun süreli hafıza”yı sağlıyor. Model, vektör veritabanında saklanan özel verileri dahil ederek daha doğru ve bağlamsal olarak uygun yanıtlar sağlayabilir.


Bilgi Sorgusu Oluşturma


Alternatif bir RAG yaklaşımı, olgu kontrolünü içerir. LLM'den bir cevap istenir ve bu cevap daha sonra vektör veri tabanındaki verilere göre kontrol edilir ve gözden geçirilir. Vektör veri tabanından sorguya bir yanıt üretilir ve LLM de bu yanıtı, bunun bir gerçekle ilgili olup olmadığını anlamak için bir ipucu olarak kullanır.


Gerçeklik kontrolünün dahil edilmesi

muhakeme

LLM'ler birçok konuda çok iyidir. Giriş verilerinin farklı bölümlerine değişen derecelerde dikkat göstererek makinelerin insan dilini anlama biçimini değiştiren "dönüştürücüler"deki ilerlemeler sayesinde, bir cümledeki sonraki kelimeyi tahmin edebiliyorlar. Yüksek Lisans'lar aynı zamanda pek çok bilgiyi çok kısa bir cevaba özetlemek ve büyük miktardaki metinden aradığınız şeyi bulup çıkarmak konusunda da iyidir. Şaşırtıcı bir şekilde, LLMS aynı zamanda planlama da yapabilir; kelimenin tam anlamıyla veri toplayabilir ve sizin için bir gezi planlayabilir.


Ve belki daha da şaşırtıcı olanı, Yüksek Lisans'ların neredeyse insani bir şekilde bir cevap üretmek için akıl yürütmeyi kullanabilmesidir. İnsanlar muhakeme edebildikleri için tahminde bulunmak veya karar vermek için tonlarca veriye ihtiyaç duymazlar. Muhakeme aynı zamanda yüksek lisans öğrencilerinin halüsinasyonlardan kaçınmasına da yardımcı olur. Bunun bir örneği “ düşünce zinciri teşviki .”


Bu yöntem, modellerin çok adımlı problemleri ara adımlara ayırmasına yardımcı olur. Düşünce zinciri yönlendirmesi ile Yüksek Lisans'lar, standart yönlendirme yöntemlerinin çözemediği karmaşık akıl yürütme sorunlarını çözebilir (ayrıntılı bir bakış için blog gönderisine göz atın) Dil Modelleri Düşünce Zinciri Yoluyla Muhakeme Gerçekleştirir Google'dan).


Yüksek Lisans'a karmaşık bir matematik problemi verirseniz, yanlış anlayabilir. Ancak Yüksek Lisans'a sorunu ve çözüm yöntemini sağlarsanız doğru bir yanıt üretebilir ve yanıtın ardındaki nedeni paylaşabilir. Bir vektör veritabanı, buna benzer soru örnekleri sağladığı ve bilgi istemini örnekle doldurduğu için bu yöntemin önemli bir parçasıdır.


Daha da iyisi, soruyu ve yanıtı aldıktan sonra, üretken yapay zeka uygulamalarınızın doğruluğunu ve kullanışlılığını daha da artırmak için bunu vektör veritabanına geri kaydedebilirsiniz.


Yanıtın vektör veritabanında saklanması


Öğrenebileceğiniz başka muhakeme ilerlemeleri de vardır: düşünce ağacı , en azından çoğuna , öz tutarlılık , Ve talimat ayarlama .

Yinelemeli sorgulama

LLM halüsinasyonlarını azaltmaya yardımcı olan üçüncü yöntem etkileşimli sorgulamadır. Bu durumda, bir AI aracısı, bir LLM ile bir vektör veritabanı arasında ileri geri hareket eden çağrılara aracılık eder. Bu, en iyi cevaba ulaşmak için defalarca yinelenebilir. FLARE olarak da bilinen bu ileriye dönük aktif geri alma neslinin bir örneği.


Bir soru alırsınız, daha fazla benzer soru için bilgi tabanınızı sorgularsınız. Bir dizi benzer soruyla karşılaşırsınız. Daha sonra tüm soruları içeren vektör veritabanını sorgular, yanıtı özetler ve yanıtın iyi ve makul görünüp görünmediğini kontrol edersiniz. Olmazsa, gerçekleşene kadar adımları tekrarlayın.


İleri aktif alma oluşturma


Diğer gelişmiş etkileşimli sorgulama yöntemleri şunları içerir: AutoGPT , Microsoft Jarvis'in , Ve Solo Performans Uyarısı .


Temsilci orkestrasyonu konusunda size yardımcı olabilecek birçok araç vardır. LangChain Yüksek Lisans ve vektör veritabanı arasındaki çağrıları düzenlemenize yardımcı olan harika bir örnektir. Temel olarak yönetim görevlerinin ve LLM'lerle etkileşimlerin çoğunu otomatikleştirir ve bellek, vektör tabanlı benzerlik araması, gelişmiş bilgi istemi şablonlama soyutlaması ve diğer birçok özellik için destek sağlar. Aynı zamanda düşünce zinciri ve FLARE gibi gelişmiş yönlendirme tekniklerine de yardımcı olur ve destekler.


Böyle bir başka araç da CassIO DataStax tarafından, Astra DB vektör veri tabanımızın üzerine bir soyutlama olarak, verileri ve belleği birinci sınıf vatandaşlar haline getirme fikriyle geliştirildi. üretken yapay zeka . CassIO, veritabanına erişim sürecini soyutlayarak Cassandra'nın üretken yapay zeka ve diğer makine öğrenimi iş yükleriyle entegrasyonunu kusursuz hale getiren bir Python kütüphanesidir. vektör arama yetenekleri ve ek kod ihtiyacını en aza indiren bir dizi kullanıma hazır araç sunar.

Hepsini bir araya getirmek: SkyPoint AI

SkyPoint AI yaşlı bakımı ve yaşam sektörüne yönelik veri, analiz ve yapay zeka hizmetlerinde uzmanlaşmış bir SaaS sağlayıcısıdır. Şirket, yaşlılar, bakıcılar ve yazılım sistemleri arasında doğal ve sezgisel etkileşimleri mümkün kılmak için üretken yapay zekadan yararlanıyor. Karmaşık uygulamaları basitleştirerek ve kullanıcı deneyimini kolaylaştırarak, SkyPoint AI yaşlıları ve bakıcıları güçlendiriyor bilgilere ve içgörülere zahmetsizce erişmenizi sağlar, bu da bakımın iyileştirilmesine yardımcı olur.


Şirket, "Şu anda Medicare'de kaç kişi var?" gibi sorulara yapay zeka tarafından oluşturulan yanıtlar sağlamak için hem yapılandırılmış hem de yapılandırılmamış çok çeşitli verilerden yararlanıyor. SkyPoint CEO'su Tisson Mathew geçenlerde bana şunu söyledi. Bu, bakım sağlayıcıların doğru verilere dayanarak hızlı bir şekilde bilinçli kararlar almasına yardımcı olduğunu söyledi.


Ancak Mathew, bu noktaya gelmenin bir süreç olduğunu söyledi. Ekibi, standart bir yüksek lisans alıp SkyPoint verileriyle ince ayar yaparak işe başladı. "Felaket sonuçlarla ortaya çıktı; hatta rastgele sözcüklerle bile" dedi. İstemleri anlamak ve oluşturmak SkyPoint'in üstesinden gelebileceği bir şeydi ancak geniş ölçekte doğru yanıtlar üretmeyi başarmak için bir yapay zeka teknolojisi yığınına ihtiyacı vardı.


SkyPoint, elektronik sağlık hizmeti kayıtları ve maaş bordrosu verileri de dahil olmak üzere, operatörlerden ve sağlayıcılardan yapılandırılmış verileri alan bir sistem kurmayı başardı. Bu, sütunlu bir veritabanında saklanır; RAG sorgulamak için kullanılır. Politikalar, prosedürler ve eyalet düzenlemeleri gibi yapılandırılmamış veriler bir vektör veritabanında depolanır: DataStax Astra DB .


Tisson örnek olarak bir soru sordu: Ya bir sakin istismarcı olursa? Astra DB, eyalet düzenlemelerine, kullanıcıların bağlamına ve çeşitli farklı belgelere dayalı olarak bir araya getirilmiş bir yanıt sağlar ve vektör yerleştirmeleri Bir yaşlı bakım tesisi çalışanının anlayabileceği doğal dilde ,


Tisson, "Bunlar doğru olması gereken spesifik yanıtlardır" dedi. "Bu, bir kuruluşun toplulukları ve işleri için bilinçli kararlar almak için güvendiği bilgidir."

Çözüm

SkyPoint AI, AI halüsinasyonları riskini azaltmanın önemini göstermektedir; Doğru yanıtları sağlayacak yöntemler ve araçlar olmadan sonuçlar potansiyel olarak vahim olabilir.


RAG, akıl yürütme ve FLARE gibi yinelemeli sorgulama yaklaşımlarıyla, üretken yapay zeka (özellikle özel verilerle desteklendiğinde) kuruluşların müşterilerine verimli ve etkili bir şekilde hizmet vermesine yardımcı olacak giderek daha güçlü bir araç haline geliyor.


Alan Ho, DataStax tarafından

DataStax'in size nasıl yardımcı olduğu hakkında daha fazla bilgi edinin gerçek zamanlı, üretken yapay zeka uygulamaları oluşturun .


Burada da yayınlandı.