paint-brush
RAG Berrikusitaarabera@docligot
360 irakurketak
360 irakurketak

RAG Berrikusita

arabera Dominic Ligot4m2024/10/03
Read on Terminal Reader

Luzeegia; Irakurri

AI ingeniaritza birpentsatzeko eta modetatik haratago joateko garaia da. RAGek badu bere lekua tresna-kutxan, baina ez da panazea.
featured image - RAG Berrikusita
Dominic Ligot HackerNoon profile picture
0-item

TRAPURU. TRAPURU. TRAPURU.


Negozio-prozesuetan eta produktuetan adimen artifiziala ezartzeko lasterketan, joera kezkagarri bat egon da: Berreskuratze-Augmented Generation (RAG) obsesioa. RAGek —hizkuntza eredu handiak (LLM) kanpoko ezagutza berreskuratzearekin nahasten dituen metodoak— ezagutzarekin elkarreragiteko bide berriak ireki dituen, zalantzarik gabe, praktikatzaile gehiegi ari dira horrekin borrokan.


Garaia da AIaren ezarpenaren inguruko elkarrizketa birformulatu, RAG-en gehiegizko konfiantzaren akatsak aitortzeko eta egokiagoak, errentagarriagoak eta dotoreagoak izan daitezkeen planteamendu alternatiboak aztertzeko.

RAG Mania: erabilera kasu askotarako gehiegikeria

RAG hizkuntza-ereduen zehaztasuna hobetu nahi duten AI ingeniari askoren teknika bihurtu da kanpoko testuingurua eskainiz. Premisa nahikoa sinplea da: testu-kopuru zabala bektorial-biltegietan kargatuz, AI sistema hauek dokumentu garrantzitsuak bilatu, datuak berreskura ditzakete eta hizkuntza-ereduaren sorkuntza-gaitasunekin konbinatu ditzakete erantzun zehatzagoak sortzeko.


Dena den, RAGekiko ilusioak bere erabilgarritasuna gainbaloratzen duten inplementazioen eztanda ekarri du. Ez da arraroa ingeniariak milioika dokumentu denda bektorialetara botatzen ikustea, hodeiko biltegiratze eta prozesatzeko kostuak puzten ikustea erabilera kasuak konplexutasun hori behar duen ala ez ulertu gabe. Askok ez dute kontuan hartzen konponbide sinpleago bat nahikoa izan daitekeen edo RAG ere beharrezkoa den beren arazo zehatzerako.

RAG inozoen inplementazioen akatsak

Are okerragoa dena, ingeniari gehienek RAG inplementazioa pentsamolde inozo batekin jorratzen dute, epe luzeko kostuei eta mantentze-kargari erreparatuz. Testu zati bakoitza bektore-denda batera igotzeak AI adimentsuago bihurtuko duela uste dute. Baina askotan, praktika honek kontrakoa egiten du. Dokumentu erredundante eta alferrikakoz gainezka dauden bektore-dendak, LLM-ak gainezka daude baliorik ematen ez duten datuak berreskuratzearekin. Horren ondorioz, erantzun denbora motelagoak, kostu handiagoak eta irtenbide eraginkorrak ez dira.


RAG-k hobeto funtzionatzen du ezagutza zehatzak eta garrantzitsuak areagotzeko erabiltzen denean, ez eskuragarri dauden dokumentuen zabortegietarako guzti-guztia gisa erabiltzen denean. RAG bidezko gehiegizko ingeniaritzak beste AI gaitasun gako batzuen azpierabilera ere eragiten du eta arazo asko logika eta egitura sinpleagoz konpondu daitezkeenean berreskurapenean arreta handiz gainditzea dakar.

Arazo guztiek ez dute RAG behar

Hona hemen egia: erabilera-kasu guztiek ez dute RAG konfiguraziorik behar. Zeregin estua eta ondo definituta badago (adibidez, ohiko galderei erantzutea, bezeroarentzako arretarako galderei edo egituratutako elkarrizketan parte hartzea), nahikoa izan daiteke bilaketa-taula edo ezagutza grafiko sinple bat. Ez da beharrezkoa denda bektorial masibo bat eta milioi anitzeko parametro-eredu bat exekutatzeko kosturik izan behar soluzioa arauetan oinarritutako sistema edo agente-esparru bat erabiliz eraiki daitekeenean.


RAG erabiltzeko gogoa datu gehiago errendimendu hobea dakarrela ideiatik dator. Baina kasu askotan, kalitatea kantitateari baino handiagoa da. Ezagutza zehatza duen eredu finko batek, edo arauetan oinarritutako gaitasunak dituen ezagutzak ezagutzen dituen txat-bot batek, hobeto funtziona dezake RAG kanalizazio bat inoiz ukitu gabe. RAG ezartzeko erabakia zereginaren konplexutasunaren arabera eman behar da, ez AI zaleen artean duen ospearen arabera.

Ezagutza estua duten agente txikien kasua

Puztutako RAG sistemen alternatiba dotoreagoa eta eraginkorragoa izan ohi da: ezagutza mugatu baina zehatza duten agente txiki eta espezializatuak. Agente hauek, tandem erabiltzen direnean, testu terabytez zamatutako eredu handi bakar bat gainditu dezakete. Agente bakoitza lan-fluxu baten atal zehatzak kudeatzeko edo kontsulta mota batzuei erantzuteko diseinatu daiteke, AI sistema modular eta malguak ahalbidetuz. Horrek kostuak murrizteaz gain, sistema osoa mantentzea eta eskalatzea errazten du.



Imajinatu eszenatoki bat non agente bat programazioaz arduratzen den, beste bat laburpenaz eta hirugarren bat web bilaketak egiteaz. Eragile horietako bakoitzak elkarrekin lan egin dezake, behar duten ezagutza soilik aprobetxatuz, sistema monolitiko baten gainkostu gabe. Eredu txiki edo logikan oinarritutako agente asko zabalduz, enpresek irteera zehatzagoak eta azkarragoak lor ditzakete, prozesatzeko eta biltegiratzeko kostuak nabarmen murrizten dituzten bitartean.

LLMak gehiegi erabiltzea: Logika sinplea egingo denean

Azkenik, LLMen gehiegizko erabilera dago logika sinplea egingo lukeen eszenatokietan. LLMak oso onak dira hizkuntza naturala ulertzeko eta sortzeko, baina horrek ez du esan nahi automatizazio mota guztiak ordezkatu behar dituztenik. Zeregin asko —esaterako, datuak baliozkotzea, inprimakiak betetzea edo txosten egituratuak sortzea— azkarrago eta fidagarritasun handiagoz egin daitezke oinarrizko scriptekin, arau-motorrekin edo sistema deterministikoekin.


Adibide nagusi bat LLM bat erabiltzea da zeregin aritmetiko baterako edo ordenatzeko arazo baterako. Hau ez da eraginkorra eta alferrikakoa. Baliabide konputazionalak xahutzeaz gain, akatsak izateko probabilitatea areagotzen du funtzio edo algoritmo sinple bat zehatzagoa izango litzatekeen kasuetan. Guztietarako LLMak ezartzeko gogoa "LLM mailua iltzeen bila" sindromea bihurtu da. Erabilera okerrak itxaropen handituak eta, azkenean, desilusioa dakar modeloek ez dutenean aurreikusitako moduan betetzen ez diren zereginetan.

AI Ingeniaritza birpentsatzea

Bada garaia AI ingeniaritza birpentsatzeko eta modetatik haratago joateko. RAGek badu bere lekua tresna-kutxan, baina ez da panazea. Etorkizuna zeregin egokietarako eredu egokiak ezartzean datza; batzuetan, horrek RAG esan nahi du, baina askotan ez da gertatzen. AI gaitasunak ñabarduraz ulertuta, ingeniariek eraginkorragoak, eraginkorragoak eta mantentzen errazagoak diren sistemak diseina ditzakete.


Niri buruz: 20 urtetik gorako beteranoa datuak, AI, arriskuen kudeaketa, estrategia eta hezkuntza konbinatzen ditu. 4x hackathonen irabazlea eta datuen defendatzailearen eragin soziala. Gaur egun, Filipinetan AIko langileria sustatzeko lanean. Lortu niri buruz gehiago hemen: https://docligot.com