Вектарны пошук эфектыўна забяспечвае семантычнае падабенства для пошукавай дапоўненай генерацыі, але ён дрэнна спраўляецца з пошукам па кароткіх ключавых словах або па-за даменнымі тэрмінамі пошуку. Дапаўненне вектарнага пошуку пошукам па ключавых словах, такім як BM25, і аб'яднанне вынікаў з пераўпарадкаваннем становіцца стандартным спосабам атрымаць лепшае з абодвух сьветаў.
Рэранжыроўшчыкі - гэта мадэлі ML, якія бяруць набор вынікаў пошуку і змяняюць іх парадак для павышэння рэлевантнасці. Яны дэталёва вывучаюць запыт у спалучэнні з кожным магчымым вынікам, што патрабуе вылічэнняў, але дае больш дакладныя вынікі, чым простыя метады пошуку. Гэта можа быць зроблена або як другі этап у дадатак да адзінага пошуку (выцягнуць 100 вынікаў з вектарнага пошуку, затым папрасіць рэранжыроўшчыка вызначыць 10 лепшых), або, часцей за ўсё, аб'яднаць вынікі з розных відаў пошуку; у дадзеным выпадку вектарны пошук і пошук па ключавых словах.
Але наколькі добрыя стандартныя рэрэйкеры? Каб даведацца пра гэта, я пратэставаў шэсць рэранжыроўшчыкаў тэксту з
Мы пратэставалі гэтыя рэранжыроўшчыкі:
Перастаўшчыкі атрымалі 20 лепшых вынікаў як з DPR, так і з BM25, і быў ацэнены перастаўлены NDCG@5.
У выніках неапрацаваны вектарны пошук (з убудаваннямі з мадэлі bge-m3) пазначаны як dpr (шчыльны пошук праходу). BGE-m3 быў абраны для вылічэння ўкладанняў, таму што аўтары ColPali выкарыстоўвалі яго ў якасці базавага ўзроўню.
Вось дадзеныя аб рэлевантнасці (NDCG@5):
І вось наколькі хутка яны перастаўляюць пошукі ў наборы дадзеных arxiv; затрымка прапарцыйная даўжыні дакумента. Гэта затрымка графіка, таму меншая, тым лепш. Самастойна размешчаная мадэль bge запускалася як на NVIDIA 3090, выкарыстоўваючы найпросты магчымы код, узяты прама з
Нарэшце, вось колькі каштуе з кожнай мадэллю пераранжыраваць амаль 3000 пошукавых запытаў з усіх шасці набораў даных. Cohere цэны за пошук (з дадатковымі зборамі за доўгія дакументы), у той час як іншыя цэны за маркер.
RRF практычна не дадае значэння гібрыдным сцэнарыям пошуку; на палове набораў дадзеных ён працаваў горш, чым BM25 або DPR у адзіночку. У адрозненне ад гэтага, усе правераныя рэранжыроўшчыкі на аснове ML далі значныя паляпшэнні ў параўнанні з простым вектарным пошукам або пошукам па ключавых словах, а Voyage rerank-2 задаў планку рэлевантнасці.
Кампрамісы па-ранейшаму прысутнічаюць: найвышэйшая дакладнасць ад Voyage rerank-2, больш хуткая апрацоўка ад Cohere або добрая сярэдняя прадукцыйнасць ад Jina або палегчанай мадэлі Voyage. Нават рэранжыроўшчык BGE з адкрытым зыходным кодам, адстаючы ад камерцыйных варыянтаў, дадае значную каштоўнасць для каманд, якія выбіраюць самастойнае размяшчэнне.
Паколькі асноўныя мадэлі працягваюць развівацца, мы можам чакаць яшчэ лепшай прадукцыйнасці. Але сучасныя рэранжыроўшчыкі ML ужо дастаткова дарослыя, каб упэўнена разгортвацца ў шматмоўным змесце.
Джонатан Эліс, DataStax