Bektore bilaketak modu eraginkorrean antzekotasun semantikoa eskaintzen du berreskurapen areagotua sortzeko, baina gaizki egiten du gako-bilaketa laburrekin edo domeinutik kanpoko bilaketa-terminoekin. Bektorearen berreskurapena BM25 bezalako gako-bilaketarekin osatzea eta emaitzak birranker batekin konbinatzea bi munduetako onena lortzeko modu estandarra bihurtzen ari da.  Rerankers ML ereduak dira, bilaketa-emaitza multzo bat hartu eta berrantolatzen dituztenak garrantzia hobetzeko. Emaitza hautagai bakoitzarekin parekatuta dagoen kontsulta zehatz-mehatz aztertzen dute, konputazionalki garestia dena baina berreskuratze metodo sinpleek baino emaitza zehatzagoak sortzen dituzte. Hau bigarren etapa gisa egin daiteke bilaketa bakar baten gainean (atera 100 emaitza bilaketa bektorialetik, eta gero eskatu birranketzaileari lehen 10ak identifikatzeko) edo, maizago, bilaketa mota ezberdinetako emaitzak konbinatzeko; kasu honetan, bilaketa bektoriala eta gako-hitzen bilaketa.  Baina zenbaterainoko onak dira apalategiko rerankers? Jakiteko, sei rerankers probatu nituen testutik  , Gemini Flash erabiliz irudietatik testua ateratzeko. Datu multzoei buruzko xehetasunak 3.1 atalean aurki daitezke  . Nabarmentzekoa, TabFQuAD eta Shift Project iturriak frantsesez daude; gainerakoak ingelesez dira.   ViDoRe erreferentzia   ColPali papera  Rerankers hauek probatu ditugu:  (RRF), hainbat iturritako emaitzak konbinatzeko formula bat, kontsulta edo dokumentuei buruz ezer jakin gabe; iturri bakoitzaren barneko ordenamendu erlatiboaren araberakoa da. RRF Elastic eta LlamaIndex-en erabiltzen da, beste proiektu batzuen artean.   Maila Elkarrekiko Fusioa  eta  , ziurrenik ostatatutako eredu ezagunenak.   Cohere Rerank v3   Jina Reranker v2  , puntuazio altuena kode irekiko eredua (Apache lizentziaduna).   BGE-reranker-v2-m3  eta rerank-2-lite, kaleratu berria (  ) enpresa sendo batek.   Bidaia berrantolaketa-2   irailean  Berriz sailkatutakoei DPR eta BM25eko 20 emaitzarik onenak eman zitzaizkien, eta NDCG@5 birsailkatua ebaluatu zen.  Emaitzetan, bektore gordinaren bilaketa (bge-m3 ereduko txertaketarekin) dpr (pasabide trinkoa berreskuratzea) etiketatua da. BGE-m3 aukeratu zen txertaketak kalkulatzeko, hori delako ColPali egileek oinarri gisa erabili zutena.  Hona hemen garrantziari buruzko datuak (NDCG@5):   Eta hona hemen zein azkar ari diren arxiv datu-multzoko bilaketak birsailkatzeko; latentzia dokumentuaren luzerarekiko proportzionala da. Hau grafikoaren latentzia da, beraz, txikiagoa da hobea. Auto-ostatatutako bge eredua NVIDIA 3090 batean exekutatu zen, zuzenean ateratako kode errazena erabiliz.  .    Hugging Face ereduaren txartela  Azkenik, hona hemen sei datu-multzoetako ia 3.000 bilaketak berrantolatzea eredu bakoitzarekin zenbat kostatzen den. Kohereatu bilaketa bakoitzeko prezioak (dokumentu luzeetarako kuota gehigarriekin), besteek token bakoitzeko prezioa duten bitartean.   Analisia  Eredu guztiak frantsesezko datu-multzoetan ingelesekoetan bezain ondo egiten dute.  Cohere nabarmen garestiagoa da eta beste ML birrankingek baino garrantzi apur bat (baina etengabe) okerragoa eskaintzen du, baina hurrengo zerbitzu azkarrenak baino hiru aldiz azkarragoa da. Gainera,  eskuzabalenak dira.   Cohere-ren tarifa-muga estandarrak  Voyage rerank-2 datu-multzo guztietan birrankingaren garrantziaren erregea da, latentziari arrakasta gehigarri bat emateko. Nabarmentzekoa, arxiv datu-multzoan DPR baino okerrago egiten ez duen eredu bakarra da, bereziki zaila dela dirudi.  Voyage rerank-2-lite eta jina reranker v2 oso-oso antzekoak dira: abiadura berdinak dira, prezio berean ostatutakoak eta garrantzi beretik hurbil (Voyage-ren ertz apur batekin). Baina  bikoitza da  , eta Voyage-rekin "benetako" bat lortzen duzu  http eskaera gordinak egin beharrean.   Bidaiaren tarifa-muga estandarra   jinarenak   Python bezeroa  BGE-reranker-v2-m3 hain eredu arina da (600M parametro baino gutxiago), kontsumitzaile GPU zaharrago batean ere erabilgarri azkarra dela.  Ondorioa  RRF-k balio gutxi ematen die bilaketa hibridoen eszenatokiei; datu multzoen erdian, BM25 edo DPR bakarrik baino okerragoa izan zen. Aitzitik, probatutako ML-n oinarritutako birranking guztiek hobekuntza esanguratsuak eman zituzten bektore hutsaren edo gako-hitz-bilaketarekin, eta Voyage rerank-2-k garrantziaren barra ezarri zuen.  Konpromisoak oraindik daude: Voyage rerank-2-ren zehaztasun handiagoa, Cohere-ren prozesamendu azkarragoa edo Jina edo Voyage-ren lite modeloaren erdiko errendimendu sendoa. Iturburu irekiko BGE reranker-ek ere, aukera komertzialen atzetik dagoen bitartean, balio handia ematen die auto-ostalari izatea aukeratzen duten taldeei.  Oinarrizko ereduek aurrera egiten jarraitzen duten heinean, are errendimendu hobea espero dezakegu. Baina gaur egungo ML birranking-ak nahiko helduak dira jada eduki eleaniztunetan konfiantzaz zabaltzeko.  Jonathan Ellis-ek, DataStax

The is an opinion piece based on the author’s POV and does not necessarily reflect the views of HackerNoon.

DataStax Astra DB is the vector database for getting GenAI apps into production, fast. Try it for free today!

DataStax

Audio hau istorioaren jatorrizko hizkuntzan ekoitzi da!

Bektore bilaketa: A Reranker Algorithm Showdown

About Author

IRUZKINAK

ESKEGI ETIKETAK

ARTIKULU HAU AURKEZTU ZEN

Related Stories

"Crypto Payments Will Become Commonplace In the Next 5 Years" - CoinsPaid’s CMO Eugen Kuzin

The Most Consequential Technology Stories of 2023, According to HackerNoon Editors

SECONDARY SEXUAL CHARACTERS OF MAN

THE SWORD OF PEACE

"Crypto Payments Will Become Commonplace In the Next 5 Years" - CoinsPaid’s CMO Eugen Kuzin

The Most Consequential Technology Stories of 2023, According to HackerNoon Editors

SECONDARY SEXUAL CHARACTERS OF MAN

THE SWORD OF PEACE

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps