Vektorové vyhľadávanie efektívne poskytuje sémantickú podobnosť pre rozšírené generovanie vyhľadávania, ale nefunguje to dobre s krátkymi kľúčovými slovami alebo hľadanými výrazmi mimo domény. Doplnenie vektorového vyhľadávania o vyhľadávanie kľúčových slov, ako je BM25, a spojenie výsledkov s rerankerom sa stáva štandardným spôsobom, ako získať to najlepšie z oboch svetov.
Rerankery sú modely ML, ktoré preberajú súbor výsledkov vyhľadávania a menia ich poradie, aby sa zvýšila relevancia. Podrobne skúmajú dotaz spárovaný s každým kandidátskym výsledkom, čo je výpočtovo nákladné, ale poskytuje presnejšie výsledky ako samotné jednoduché metódy vyhľadávania. Dá sa to urobiť buď ako druhá fáza nad jedným vyhľadávaním (vytiahnite 100 výsledkov z vyhľadávania vektorov, potom požiadajte preraďovača, aby určil 10 najlepších), alebo častejšie kombinujte výsledky z rôznych druhov vyhľadávania; v tomto prípade vyhľadávanie vektorov a vyhľadávanie kľúčových slov.
Ale akí dobrí sú bežní rerankeri? Aby som to zistil, otestoval som šesť rerankerov na texte z
Testovali sme tieto rerankery:
Rerankeri dostali 20 najlepších výsledkov z DPR aj BM25 a vyhodnotil sa prehodnotený NDCG@5.
Vo výsledkoch je vyhľadávanie surového vektora (s vloženými prvkami z modelu bge-m3) označené ako dpr (husté vyhľadávanie pasáží). BGE-m3 bol vybraný na výpočet vloženia, pretože to je to, čo autori ColPali použili ako základ.
Tu sú údaje o relevantnosti (NDCG@5):
A tu je to, ako rýchlo sú pri prehodnocovaní vyhľadávaní v súbore údajov arxiv; latencia je úmerná dĺžke dokumentu. Toto je graf latencie, takže nižšia je lepšia. Samoobslužný model bge bol spustený na oboch zariadeniach NVIDIA 3090 s použitím najjednoduchšieho možného kódu stiahnutého priamo z
Nakoniec, tu je, koľko stálo s každým modelom prehodnotenie takmer 3 000 vyhľadávaní zo všetkých šiestich súborov údajov. Súdržné ceny za vyhľadávanie (s dodatočnými poplatkami za dlhé dokumenty), zatiaľ čo ostatné ceny za token.
RRF pridáva malú alebo žiadnu hodnotu scenárom hybridného vyhľadávania; v polovici súborov údajov dosahoval horšie výsledky ako samotný BM25 alebo DPR. Naproti tomu všetky testované rerankery založené na ML priniesli zmysluplné vylepšenia oproti čistému vyhľadávaniu vektorov alebo kľúčových slov, pričom reranking Voyage-2 nastavil latku relevantnosti.
Kompromisy sú stále prítomné: vynikajúca presnosť od Voyage rerank-2, rýchlejšie spracovanie od Cohere alebo solídny stredný výkon od Jina alebo modelu Voyage lite. Dokonca aj open-source reranker BGE, hoci zaostáva za komerčnými možnosťami, pridáva významnú hodnotu pre tímy, ktoré sa rozhodnú hostiť sami.
Keďže modely základov neustále napredujú, môžeme očakávať ešte lepší výkon. Dnešné rerankery ML sú však už dostatočne vyspelé na to, aby sa s istotou nasadili do viacjazyčného obsahu.
Autor: Jonathan Ellis, DataStax