paint-brush
RAG қайта қаралдыбойынша@docligot
418 оқулар
418 оқулар

RAG қайта қаралды

бойынша Dominic Ligot4m2024/10/03
Read on Terminal Reader

Тым ұзақ; Оқу

AI инженериясын қайта қарастырып, сәнден арылуға уақыт келді. RAG құралдар жинағында өз орны бар, бірақ бұл панацея емес.
featured image - RAG қайта қаралды
Dominic Ligot HackerNoon profile picture
0-item

RAG. RAG. RAG.


Бизнес-процестер мен өнімдерде жасанды интеллектті енгізу жарысында алаңдатарлық тенденция пайда болды: Retrieval-Augmented Generation (RAG) ға әуестену. RAG — үлкен тілдік үлгілерді (LLM) сыртқы білімді іздеумен біріктіретін әдіс — біліммен өзара әрекеттесу үшін жаңа жолдарды ашқанымен, тым көп практиктер онымен күресуде.


Біз AI енгізу төңірегінде әңгімені қайта өрбітетін, RAG-ге шамадан тыс тәуелділіктің қателіктерін мойындайтын және қолайлы, үнемді және талғампаз болуы мүмкін балама тәсілдерді зерттейтін уақыт келді.

RAG Mania: Көптеген пайдалану жағдайлары үшін шамадан тыс әрекет

RAG сыртқы контекстті қамтамасыз ету арқылы тіл үлгілерінің дәлдігін жақсартқысы келетін көптеген AI инженерлері үшін қолданылатын әдіс болды. Алғышарт жеткілікті қарапайым: векторлық дүкендерге мәтіннің үлкен көлемін жүктеп салу арқылы бұл AI жүйелері тиісті құжаттарды іздей алады, деректерді шығарып алады және дәлірек жауаптар алу үшін оны тілдік модельдің генеративті қабілеттерімен біріктіре алады.


Дегенмен, RAG-ға деген ынта оның пайдалылығын асыра бағалайтын іске асырудың жарылуына әкелді. Инженерлер миллиондаған құжаттарды векторлық дүкендерге тастап, бұлтты сақтау және өңдеу шығындарын көбейтіп, пайдалану жағдайы тіпті осындай күрделілікті қажет ететінін түсінбестен көру сирек емес. Көбісі қарапайым шешім жеткілікті ме, әлде RAG олардың нақты мәселесі үшін қажет пе деп ойламайды.

Аңғал RAG іске асырудың тұзақтары

Ең сорақысы, инженерлердің көпшілігі RAG-ны іске асыруға ұзақ мерзімді шығындар мен техникалық қызмет көрсету ауыртпалығын елемей, аңғалдықпен қарайды. Олар мәтіннің әрбір бөлігін векторлық дүкенге жүктеп салу AI-ны ақылды етеді деп сенеді. Бірақ көбінесе бұл тәжірибе керісінше жасайды. Векторлық дүкендер артық және қажет емес құжаттарға толы болғандықтан, LLMs мән қоспайтын деректерді шығарып алумен айналысады. Бұл жауап беру уақытының баяулауына, жоғары шығындарға және тиімді шешімдердің төмендеуіне әкеледі.


RAG қол жетімді кез келген құжат қоқысы үшін барлығын жинайтын құрал ретінде пайдаланылғанда емес, нақты және сәйкес білімді арттыру үшін пайдаланылғанда жақсы жұмыс істейді. RAG арқылы шамадан тыс инженерия басқа да негізгі AI мүмкіндіктерінің толық пайдаланылмауына және көптеген мәселелерді қарапайым логика мен құрылыммен шешуге болатын кезде іздеуге шамадан тыс назар аударуға әкеледі.

Кез келген мәселеге RAG қажет емес

Міне, шындық: барлық пайдалану жағдайлары RAG орнатуды қажет етпейді. Егер тапсырма тар және жақсы анықталған болса, мысалы, жиі қойылатын сұрақтарға жауап беру, тұтынушыларға қолдау көрсету сұраулары немесе құрылымдық диалогқа қатысу — қарапайым іздеу кестесі немесе білім графигі жеткілікті болуы мүмкін. Шешімді ережеге негізделген жүйе немесе тіпті агент құрылымы арқылы құруға болатын кезде, үлкен векторлар қоймасын және көп миллиондық параметр үлгісін іске қосу үшін қосымша шығындарды алудың қажеті жоқ.


RAG пайдалану құлшынысы көбірек деректер жақсы өнімділікке тең деген идеядан туындайды. Бірақ көп жағдайда сапа саннан асып түседі. Мақсатты білімі бар дәл бапталған модель немесе тіпті ережеге негізделген мүмкіндіктері бар білімді білетін чатбот RAG құбырына ешқашан қол тигізбестен жақсырақ жұмыс істей алады. RAG енгізу туралы шешім оның AI әуесқойлары арасында танымалдылығынан емес, тапсырманың күрделілігіне байланысты болуы керек.

Тар білімі бар шағын агенттерге арналған жағдай

Ісінген RAG жүйелеріне балама көбінесе талғампаз және тиімді: шектеулі, бірақ нақты білімі бар шағын, арнайы агенттер. Бұл агенттер тандемде қолданылғанда, мәтіннің терабайттары жүктелген жалғыз үлкен үлгіден асып түседі. Әрбір агент модульдік және икемді AI жүйелеріне мүмкіндік беретін жұмыс процесінің белгілі бір бөліктерін өңдеуге немесе сұраулардың белгілі бір түрлеріне жауап беруге арналған. Бұл тек шығындарды азайтып қана қоймайды, сонымен қатар бүкіл жүйеге техникалық қызмет көрсету мен масштабтауды жеңілдетеді.



Бір агент жоспарлауға, екіншісі қорытындылауға және үшінші веб-іздеулерді орындауға жауапты болатын сценарийді елестетіп көріңіз. Бұл агенттердің әрқайсысы монолитті жүйенің үстеме шығындарынсыз тек өздеріне қажетті білімді қолдана отырып, бірге жұмыс істей алады. Көптеген шағын үлгілерді немесе логикаға негізделген агенттерді қолдану арқылы кәсіпорындар өңдеу және сақтау шығындарын едәуір қысқарта отырып, дәлірек және жылдамырақ нәтижелер ала алады.

LLM-ді шамадан тыс пайдалану: Қарапайым логика қашан орындалады

Ақырында, қарапайым логика орындайтын сценарийлерде LLM-ді шамадан тыс пайдалану бар. LLMs табиғи тілді түсінуде және жасауда өте жақсы, бірақ бұл олар автоматтандырудың барлық түрлерін ауыстыру керек дегенді білдірмейді. Деректерді тексеру, пішінді толтыру немесе құрылымдық есепті құру сияқты көптеген тапсырмаларды негізгі сценарийлер, ереже қозғалтқыштары немесе детерминирленген жүйелер арқылы жылдамырақ және сенімдірек орындауға болады.


Негізгі мысал арифметикалық тапсырма немесе сұрыптау мәселесі үшін LLM пайдалану болып табылады. Бұл тиімсіз және қажетсіз. Ол есептеу ресурстарын ысырап етіп қана қоймайды, сонымен қатар қарапайым функция немесе алгоритм дәлірек болатын жағдайларда қателер ықтималдығын арттырады. Барлығына LLM енгізуге деген құлшыныс «тырнақ іздейтін LLM балғасы» синдромына айналды. Бұл дұрыс пайдаланбау үміттердің артуына және модельдер өңдеуге арналмаған тапсырмаларды күткендей орындамаған кезде үмітсіздікке әкеледі.

AI инженериясын қайта қарау

AI инженериясын қайта ойластырып, сәнден арылуға уақыт келді. RAG құралдар жинағында өз орны бар, бірақ бұл панацея емес. Болашақ дұрыс тапсырмалар үшін дұрыс үлгілерді қолдануда жатыр — кейде бұл RAG дегенді білдіреді, бірақ көбінесе олай емес. Жасанды интеллект мүмкіндіктерін терең түсінген инженерлер тиімдірек, тиімдірек және техникалық қызмет көрсету оңайырақ жүйелерді жобалай алады.


Мен туралы: деректерді, AI, тәуекелдерді басқару, стратегия және білімді біріктіретін 20 жастан асқан ардагер. 4 рет хакатон жеңімпазы және деректерді қорғаушының әлеуметтік әсері. Қазіргі уақытта Филиппиндегі AI жұмыс күшін бастау үшін жұмыс істеуде. Мен туралы толығырақ мына жерден біліңіз: https://docligot.com

L O A D I N G
. . . comments & more!

About Author

Dominic Ligot HackerNoon profile picture
Dominic Ligot@docligot
Technologist, Social Impact, Data Ethics, AI

ТЕГТЕРДІ АЛУ

БҰЛ МАҚАЛА БАСҚАРҒАН...