AI-இயங்கும் இருள் இராணுவம் இது விளையாட்டு இரவு, உங்கள் நண்பர்கள் கேம்ஸ் டேபிளைச் சுற்றி அமர்ந்திருக்கிறார்கள், அவர்கள் என்ன டன்ஜியன்ஸ் & டிராகன்கள் (D&D) கதாபாத்திரமாக மாறுவார்கள் என்பதைப் பார்க்க காத்திருக்கிறார்கள் மற்றும் அவர்கள் தொடங்குவார்கள். இன்றிரவு, நீங்கள் டன்ஜியன் மாஸ்டர் (கதைசொல்லி மற்றும் வழிகாட்டி), உங்கள் வீரர்களுக்கு சவால் விடும் மற்றும் கவர்ந்திழுக்கும் சிலிர்ப்பான சந்திப்புகளை உருவாக்குபவர். உங்கள் நம்பகமான D&D மான்ஸ்டர் கையேட்டில் உயிரினங்கள் உள்ளன. எண்ணற்ற விருப்பங்களில் ஒவ்வொரு சூழ்நிலைக்கும் சரியான அரக்கனைக் கண்டறிவது மிகப்பெரியதாக இருக்கும். இலட்சிய எதிரி, அந்த தருணத்தின் அமைப்பு, சிரமம் மற்றும் கதையுடன் பொருந்த வேண்டும். ஆயிரக்கணக்கான ஒவ்வொரு சூழ்நிலைக்கும் மிகவும் பொருத்தமான அரக்கனை உடனடியாகக் கண்டுபிடிக்கும் கருவியை நாம் உருவாக்கினால் என்ன செய்வது? , ஒவ்வொரு சந்திப்பையும் முடிந்தவரை ஆழமாகவும் உற்சாகமாகவும் இருப்பதை உறுதிசெய்கிறதா? ஒரே நேரத்தில் பல காரணிகளைக் கருத்தில் கொள்ளும் ஒரு கருவி நமக்கான ஒரு தேடலைத் தொடங்குவோம்: பல பண்புக்கூறு வெக்டார் தேடலின் சக்தியைப் பயன்படுத்தி, இறுதி அரக்கனைக் கண்டறியும் அமைப்பை உருவாக்குங்கள்! திசையன் தேடலின் மூலம் உயிரினங்களை உருவாக்குதல், அதை ஏன் செய்வது? தகவல் மீட்டெடுப்பில் ஒரு புரட்சியைக் குறிக்கிறது. திசையன் உட்பொதித்தல் - சூழல் மற்றும் சொற்பொருள் அர்த்தத்தை கணக்கில் எடுத்துக்கொள்வதன் மூலம் - திசையன் தேடலுக்கு மிகவும் பொருத்தமான மற்றும் துல்லியமான முடிவுகளை வழங்க, கட்டமைக்கப்பட்ட ஆனால் கட்டமைக்கப்படாத தரவு மற்றும் பல மொழிகள் மற்றும் அளவைக் கையாளவும். ஆனால் நிஜ-உலகப் பயன்பாடுகளில் உயர்தரப் பதில்களை உருவாக்க, நமது தரவுப் பொருள்களின் குறிப்பிட்ட பண்புக்கூறுகளுக்கு வெவ்வேறு எடைகளை நாம் அடிக்கடி ஒதுக்க வேண்டும். திசையன் தேடல் என்பது பல பண்புக்கூறு திசையன் தேடலுக்கு இரண்டு பொதுவான அணுகுமுறைகள் உள்ளன. தரவுப் பொருளின் ஒவ்வொரு பண்புக்கூறையும் தனித்தனியாக உட்பொதிப்பதன் மூலம் இரண்டும் தொடங்குகின்றன. இந்த இரண்டு அணுகுமுறைகளுக்கும் இடையே உள்ள முக்கிய வேறுபாடு என்னவென்றால், எங்கள் உட்பொதிப்புகள் எவ்வாறு மற்றும் என்பதில் உள்ளது. சேமிக்கப்படுகின்றன தேடப்படுகின்றன அணுகுமுறை - ஒவ்வொரு பண்புக்கூறு வெக்டரையும் தனித்தனி வெக்டர் ஸ்டோர்களில் (ஒரு பண்புக்கூறுக்கு ஒன்று) சேமித்து, ஒவ்வொரு பண்புக்கும் தனித்தனியாகத் தேடவும், தேடல் முடிவுகளை ஒருங்கிணைக்கவும், தேவைக்கேற்ப பிந்தைய செயல்முறை (எ.கா. எடை) செய்யவும். அப்பாவி அணுகுமுறை - ஒரே திசையன் ஸ்டோரில் ( இன் உள்ளமைக்கப்பட்ட செயல்பாட்டைப் பயன்படுத்தி) அனைத்து பண்புக்கூறு வெக்டார்களையும் ஒருங்கிணைத்து சேமிக்கலாம் Superlinked's வினவல் நேரத்தில் ஒவ்வொரு பண்புக்கூறுகளையும் மிகவும் பொருத்தமான முடிவுகளை வெளியிடுவதற்கு, பிந்தைய செயலாக்கம் இல்லாமல் எடைபோட . Superlinked Superlinked spaces அனுமதிக்கின்றன கீழே, பல பண்புக்கூறு வெக்டர் தேடல் கருவியை செயல்படுத்த இந்த இரண்டு அணுகுமுறைகளையும் பயன்படுத்துவோம் - ஒரு Dungeons and Dragons monster Finder! எங்களின் எளிய செயலாக்கங்கள், குறிப்பாக இரண்டாவது, மிகவும் சக்திவாய்ந்த மற்றும் நெகிழ்வான தேடல் அமைப்புகளை எவ்வாறு உருவாக்குவது என்பதை விளக்கும், சிக்கலான, பன்முக வினவல்களை எளிதாகக் கையாளக்கூடியவை, உங்கள் பயன்பாடு எதுவாக இருந்தாலும். திசையன் ஒற்றுமை தேடலுக்கு நீங்கள் புதியவராக இருந்தால், கவலைப்பட வேண்டாம்! நாங்கள் உங்களைப் பாதுகாத்துள்ளோம் - எங்கள் பார்க்கவும். கட்டுமானத் தொகுதிகள் கட்டுரைகளைப் சரி, அசுர வேட்டைக்குப் போகலாம்! தரவுத்தொகுப்பு முதலில், ஒரு பெரிய மொழி மாதிரியை (LLM) தூண்டுவதன் மூலம், அரக்கர்களின் சிறிய செயற்கை தரவுத்தொகுப்பை உருவாக்குவோம்: Generate two JSON lists: 'monsters' and 'queries'. 1. 'monsters' list: Create 20 unique monsters with the following properties: - name: A distinctive name - look: Brief description of appearance (2-3 sentences) - habitat: Where the monster lives (2-3 sentences) - behavior: How the monster acts (2-3 sentences) Ensure some monsters share similar features while remaining distinct. 2. 'queries' list: Create 5 queries to search for monsters: - Each query should be in the format: {look: "...", habitat: "...", behavior: "..."} - Use simple, brief descriptions (1-3 words per field) - Make queries somewhat general to match multiple monsters Output format: { "monsters": [ {"name": "...", "look": "...", "habitat": "...", "behavior": "..."}, ... ], "queries": [ {"look": "...", "habitat": "...", "behavior": "..."}, ... ] } எங்கள் LLM உருவாக்கிய தரவுத்தொகுப்பின் மாதிரியைப் பார்ப்போம். குறிப்பு: எல்எல்எம் உருவாக்கம் தீர்மானிக்க முடியாதது, எனவே உங்கள் முடிவுகள் மாறுபடலாம். எங்கள் முதல் ஐந்து அரக்கர்கள் இங்கே: # பெயர் பார் வாழ்விடம் நடத்தை 0 லுமினோத் ஒளிரும் இறக்கைகள் மற்றும் ஆண்டெனாவுடன் அந்துப்பூச்சி போன்ற உயிரினம் பயோலுமினசென்ட் தாவரங்கள் கொண்ட அடர்ந்த காடுகள் மற்றும் காடுகள் இரையைத் தொடர்புகொள்வதற்கும் ஈர்ப்பதற்கும் இனிமையான ஒளி வடிவங்களை வெளியிடுகிறது 1 அக்வா ரைத் ஓடும் நீரால் செய்யப்பட்ட ஒளிஊடுருவக்கூடிய மனித உருவம் ஆறுகள், ஏரிகள் மற்றும் கடலோரப் பகுதிகள் நீர்நிலைகளுடன் கலக்க வடிவமாற்றங்கள் மற்றும் நீரோட்டங்களைக் கட்டுப்படுத்துகிறது 2 ஸ்டோன்ஹார்ட் கோலெம் ஒன்றோடொன்று இணைந்த பாறை அமைப்புகளால் ஆன மிகப்பெரிய மனித உருவம் பாறை மலைகள் மற்றும் பழங்கால இடிபாடுகள் பல நூற்றாண்டுகளாக உறங்குகிறது, அதன் பிரதேசத்தைப் பாதுகாக்க விழிக்கிறது 3 கிசுகிசுக்கும் நிழல் ஒளிரும் கண்களுடன் நிழலான, உருவமற்ற உயிரினம் இருண்ட காடுகள் மற்றும் கைவிடப்பட்ட கட்டிடங்கள் பயத்தை ஊட்டுகிறது மற்றும் அமைதியற்ற உண்மைகளை கிசுகிசுக்கிறது 4 செஃபிர் டான்சர் மாறுபட்ட இறகுகள் கொண்ட அழகான பறவை உயிரினம் உயரமான மலைச் சிகரங்கள் மற்றும் காற்று வீசும் சமவெளிகள் துணையை ஈர்ப்பதற்காக மயக்கும் வான்வழி காட்சிகளை உருவாக்குகிறது ... மேலும் நாங்கள் உருவாக்கிய வினவல்கள்: பார் வாழ்விடம் நடத்தை 0 ஒளிரும் இருண்ட இடங்கள் ஒளி கையாளுதல் 1 அடிப்படை தீவிர சூழல்கள் சுற்றுச்சூழல் கட்டுப்பாடு 2 வடிவமாற்றம் பல்வேறு நிலப்பரப்புகள் மாயை உருவாக்கம் 3 படிகமானது கனிம வளம் நிறைந்த பகுதிகள் ஆற்றல் உறிஞ்சுதல் 4 ஈதெரியல் வளிமண்டலம் மன தாக்கம் அசல் தரவுத்தொகுப்பு மற்றும் வினவல் எடுத்துக்காட்டுகளை பார்க்கவும். இங்கே மீட்டெடுப்பு எங்கள் இரண்டு அணுகுமுறைகளிலும் நாம் பயன்படுத்தும் அளவுருக்களை அமைப்போம் - அப்பாவி மற்றும் சூப்பர்லிங்க்டு - கீழே. நாங்கள் எங்கள் திசையன் உட்பொதிவுகளை உருவாக்குகிறோம்: sentence-transformers/all-mpnet-base-v2. எளிமைக்காக, எங்கள் வெளியீட்டை முதல் 3 பொருத்தங்களுக்கு வரம்பிடுவோம். (தேவையான இறக்குமதிகள் மற்றும் உதவி செயல்பாடுகள் உட்பட முழுமையான குறியீட்டிற்கு, பார்க்கவும்.) நோட்புக்கைப் LIMIT = 3 MODEL_NAME = "sentence-transformers/all-mpnet-base-v2" இப்போது, பல பண்புக்கூறுகள் கொண்ட அசுரன் தேடலைப் பெறுவோம்! முதலில், அணுகுமுறையை முயற்சிப்போம். அப்பாவியான அப்பாவி அணுகுமுறை எங்களின் அப்பாவி அணுகுமுறையில், தனித்தனியாக பண்புகளை உட்பொதித்து, வெவ்வேறு குறியீடுகளில் அவற்றைச் சேமிக்கிறோம். வினவல் நேரத்தில், அனைத்து குறியீடுகளிலும் பல kNN-தேடல்களை இயக்குவோம், பின்னர் எங்களின் அனைத்து பகுதி முடிவுகளையும் ஒன்றாக இணைக்கிறோம். ஒரு வகுப்பை வரையறுப்பதன் மூலம் தொடங்குகிறோம் NaiveRetriever எங்களின் உருவாக்கப்பட்ட உட்பொதிவுகளைப் பயன்படுத்தி, எங்கள் தரவுத்தொகுப்பில் ஒற்றுமை அடிப்படையிலான தேடலைச் செய்ய. all-mpnet-base-v2 class NaiveRetriever: def __init__(self, data: pd.DataFrame): self.model = SentenceTransformer(MODEL_NAME) self.data = data.copy() self.ids = self.data.index.to_list() self.knns = {} for key in self.data: embeddings = self.model.encode(self.data[key].values) knn = NearestNeighbors(metric="cosine").fit(embeddings) self.knns[key] = knn def search_key(self, key: str, value: str, limit: int = LIMIT) -> pd.DataFrame: embedding = self.model.encode(value) knn = self.knns[key] distances, indices = knn.kneighbors( [embedding], n_neighbors=limit, return_distance=True ) ids = [self.ids[i] for i in indices[0]] similarities = (1 - distances).flatten() # by definition: # cosine distance = 1 - cosine similarity result = pd.DataFrame( {"id": ids, f"score_{key}": similarities, key: self.data[key][ids]} ) result.set_index("id", inplace=True) return result def search(self, query: dict, limit: int = LIMIT) -> pd.DataFrame: results = [] for key, value in query.items(): if key not in self.knns: continue result_key = self.search_key(key, value, limit=limit) result_key.drop(columns=[key], inplace=True) results.append(result_key) merged_results = pd.concat(results, axis=1) merged_results["score"] = merged_results.mean(axis=1, skipna=False) merged_results.sort_values("score", ascending=False, inplace=True) return merged_results naive_retriever = NaiveRetriever(df.set_index("name")) மேலே உள்ள எங்களால் உருவாக்கப்பட்ட பட்டியலிலிருந்து முதல் வினவலைப் பயன்படுத்துவோம், மேலும் எங்கள் பயன்படுத்தி அரக்கர்களைத் தேடுவோம்: naive_retriever query = { 'look': 'glowing', 'habitat': 'dark places', 'behavior': 'light manipulation' } naive_retriever.search(query) எங்கள் naive_retriever ஒவ்வொரு பண்புக்கும் பின்வரும் தேடல் முடிவுகளை வழங்குகிறது: ஐடி மதிப்பெண்_பார்வை பார் கிசுகிசுக்கும் நிழல் 0.503578 ஒளிரும் கண்களுடன் நிழலான, உருவமற்ற உயிரினம் மணல் புயல் டிஜின் 0.407344 ஒளிரும் குறியீடுகளுடன் சுழலும் மணல் சுழல் லுமினோத் 0.378619 ஒளிரும் இறக்கைகள் மற்றும் ஆண்டெனாவுடன் அந்துப்பூச்சி போன்ற உயிரினம் அருமை! எங்கள் திரும்பிய அசுரன் முடிவுகள் பொருத்தமானவை - அவை அனைத்தும் சில "ஒளிரும்" பண்புகளைக் கொண்டுள்ளன. மற்ற இரண்டு பண்புக்கூறுகளைத் தேடும்போது அப்பாவி அணுகுமுறை என்ன திரும்பும் என்று பார்ப்போம். ஐடி மதிப்பெண்_வாழ்விடம் வாழ்விடம் கிசுகிசுக்கும் நிழல் 0.609567 இருண்ட காடுகள் மற்றும் கைவிடப்பட்ட கட்டிடங்கள் பூஞ்சை நெட்வொர்க் 0.438856 நிலத்தடி குகைகள் மற்றும் ஈரமான காடுகள் தோர்ன்வைன் எலிமெண்டல் 0.423421 வளர்ந்த இடிபாடுகள் மற்றும் அடர்ந்த காடுகள் ஐடி மதிப்பெண்_நடத்தை நடத்தை வாழும் கிராஃபிட்டி 0.385741 சுற்றுச்சூழலுடன் கலக்க வடிவமாற்றம் செய்து நிறமிகளை உறிஞ்சுகிறது கிரிஸ்டல்விங் டிரேக் 0.385211 விலைமதிப்பற்ற ரத்தினங்களைச் சேமித்து, ஒளியை ஒளிவிலகச் செய்து சக்திவாய்ந்த கற்றைகளாக மாற்ற முடியும் லுமினோத் 0.345566 இரையைத் தொடர்புகொள்வதற்கும் ஈர்ப்பதற்கும் இனிமையான ஒளி வடிவங்களை வெளியிடுகிறது மீட்டெடுக்கப்பட்ட அனைத்து அரக்கர்களும் விரும்பிய பண்புகளைக் கொண்டுள்ளனர். முதல் பார்வையில், அப்பட்டமான தேடல் முடிவுகள் நம்பிக்கைக்குரியதாகத் தோன்றலாம். ஆனால் கொண்ட அரக்கர்களை நாம் கண்டுபிடிக்க வேண்டும். இந்த இலக்கை அடைவதில் நமது அரக்கர்கள் எவ்வளவு சிறப்பாக செயல்படுகிறார்கள் என்பதைப் பார்க்க, எங்கள் முடிவுகளை ஒன்றிணைப்போம்: ஒரே நேரத்தில் மூன்று பண்புகளையும் ஐடி மதிப்பெண்_பார்வை மதிப்பெண்_வாழ்விடம் மதிப்பெண்_நடத்தை கிசுகிசுக்கும் நிழல் 0.503578 0.609567 மணல் புயல் டிஜின் 0.407344 லுமினோத் 0.378619 0.345566 பூஞ்சை நெட்வொர்க் 0.438856 தோர்ன்வைன் எலிமெண்டல் 0.423421 வாழும் கிராஃபிட்டி 0.385741 கிரிஸ்டல்விங் டிரேக் 0.385211 இங்கே, அப்பாவி அணுகுமுறையின் வரம்புகள் தெளிவாகின்றன. மதிப்பீடு செய்வோம்: பண்பு அடிப்படையில் பொருத்தம்: : மூன்று அரக்கர்கள் மீட்டெடுக்கப்பட்டனர் (விஸ்பரிங் ஷேட், சாண்ட்ஸ்டார்ம் டிஜின் மற்றும் லுமினோத்). look : முடிவுகளில் இருந்து ஒரே ஒரு அசுரன் மட்டுமே பொருத்தமானது (விஸ்பரிங் ஷேட்). habitat look : முடிவுகளில் ஒரே ஒரு அசுரன் மட்டுமே பொருத்தமானதாக இருந்தது (லுமினோத்), ஆனால் அது பொருத்தமான ஒன்றிலிருந்து வேறுபட்டது. behavior look habitat ஒட்டுமொத்த சம்பந்தம்: ஒரே நேரத்தில் மூன்று பண்புகளுக்காக எந்த ஒரு அரக்கனும் மீட்டெடுக்கப்படவில்லை. முடிவுகள் துண்டு துண்டாக உள்ளன: வெவ்வேறு அரக்கர்கள் வெவ்வேறு பண்புகளுக்கு பொருத்தமானவர்கள். சுருக்கமாக, அப்பாவியான தேடல் அணுகுமுறை அனைத்து அளவுகோல்களையும் ஒரே நேரத்தில் பூர்த்தி செய்யும் அரக்கர்களைக் கண்டுபிடிக்கத் தவறிவிட்டது. ஒரு பண்புக்கூறுக்கு 3க்கு பதிலாக 6 பேய்களை வைத்து முயற்சிப்போம். இந்த அணுகுமுறை என்ன உருவாக்குகிறது என்பதைப் பார்ப்போம்: ஒவ்வொரு பண்புக்கும் அதிகமான அரக்கர்களை முன்கூட்டியே மீட்டெடுப்பதன் மூலம் இந்த சிக்கலை சரிசெய்ய முடியுமா? ஐடி மதிப்பெண்_பார்வை மதிப்பெண்_வாழ்விடம் மதிப்பெண்_நடத்தை கிசுகிசுக்கும் நிழல் 0.503578 0.609567 மணல் புயல் டிஜின் 0.407344 0.365061 லுமினோத் 0.378619 0.345566 நெபுலா ஜெல்லிமீன் 0.36627 0.259969 ட்ரீம்வீவர் ஆக்டோபஸ் 0.315679 குவாண்டம் ஃபயர்ஃபிளை 0.288578 பூஞ்சை நெட்வொர்க் 0.438856 தோர்ன்வைன் எலிமெண்டல் 0.423421 மிஸ்ட் பாண்டம் 0.366816 0.236649 ஸ்டோன்ஹார்ட் கோலம் 0.342287 வாழும் கிராஃபிட்டி 0.385741 கிரிஸ்டல்விங் டிரேக் 0.385211 அக்வா ரைத் 0.283581 நாங்கள் இப்போது 13 பேய்களை மீட்டுள்ளோம் (எங்கள் சிறிய தரவுத்தொகுப்பில் பாதிக்கும் மேற்பட்டவை!), அதே சிக்கல் உள்ளது: இந்த மூன்று பண்புகளுக்கும் இந்த அரக்கர்கள் ஒன்று கூட மீட்டெடுக்கப்படவில்லை. இன்னும் மீட்டெடுக்கப்பட்ட அரக்கர்களின் எண்ணிக்கையை அதிகரிப்பது (6க்கு அப்பால்) எங்கள் சிக்கலை , ஆனால் இது கூடுதல் சிக்கல்களை உருவாக்குகிறது: தீர்க்கக்கூடும் தயாரிப்பில், கூடுதல் முடிவுகளை (பல kNN தேடல்கள்) மீட்டெடுப்பது தேடல் நேரத்தை குறிப்பிடத்தக்க வகையில் நீட்டிக்கிறது. நாம் அறிமுகப்படுத்தும் ஒவ்வொரு புதிய பண்புக்கும், ஒரு "முழுமையான" அசுரனைக் கண்டுபிடிப்பதற்கான வாய்ப்புகள் - எங்கள் வினவலில் உள்ள அனைத்து பண்புக்கூறுகளுடன் - அதிவேகமாகக் குறைகிறது. இதைத் தடுக்க, நாம் இன்னும் பல அருகிலுள்ள அண்டை நாடுகளை (அரக்கர்கள்) மீட்டெடுக்க வேண்டும், மீட்டெடுக்கப்பட்ட அரக்கர்களின் மொத்த எண்ணிக்கை அதிவேகமாக வளரும். நாங்கள் விரும்பிய அனைத்து பண்புகளையும் கொண்ட அரக்கர்களை மீட்டெடுப்போம் என்று எங்களுக்கு இன்னும் உத்தரவாதம் இல்லை. ஒரே நேரத்தில் அனைத்து அளவுகோல்களையும் பூர்த்தி செய்யும் பேய்களை மீட்டெடுக்க முடிந்தால், கூடுதல் மேல்நிலை சமரச முடிவுகளைச் செலவிட வேண்டியிருக்கும். மொத்தத்தில், அப்பட்டமான அணுகுமுறை மிகவும் நிச்சயமற்றது மற்றும் சாத்தியமான பல பண்புக்கூறு தேடலுக்கு, குறிப்பாக உற்பத்தியில் திறனற்றது. மிகைப்படுத்தப்பட்ட அணுகுமுறை இது அப்பாவியாக இருப்பதை விட சிறப்பாக செயல்படுகிறதா என்பதைப் பார்க்க, எங்கள் இரண்டாவது அணுகுமுறையை செயல்படுத்துவோம். முதலில், ஸ்கீமா, ஸ்பேஸ், இன்டெக்ஸ் மற்றும் வினவல் ஆகியவற்றை வரையறுக்கிறோம்: @schema class Monster: id: IdField look: String habitat: String behavior: String monster = Monster() look_space = TextSimilaritySpace(text=monster.look, model=MODEL_NAME) habitat_space = TextSimilaritySpace(text=monster.habitat, model=MODEL_NAME) behavior_space = TextSimilaritySpace(text=monster.behavior, model=MODEL_NAME) monster_index = Index([look_space, habitat_space, behavior_space]) monster_query = ( Query( monster_index, weights={ look_space: Param("look_weight"), habitat_space: Param("habitat_weight"), behavior_space: Param("behavior_weight"), }, ) .find(monster) .similar(look_space.text, Param("look")) .similar(habitat_space.text, Param("habitat")) .similar(behavior_space.text, Param("behavior")) .limit(LIMIT) ) default_weights = { "look_weight": 1.0, "habitat_weight": 1.0, "behavior_weight": 1.0 } இப்போது, எக்ஸிகியூட்டரைத் தொடங்கி, தரவைப் பதிவேற்றுகிறோம்: monster_parser = DataFrameParser(monster, mapping={monster.id: "name"}) source: InMemorySource = InMemorySource(monster, parser=monster_parser) executor = InMemoryExecutor(sources=[source], indices=[monster_index]) app = executor.run() source.put([df]) மேலே உள்ள எங்களின் அப்பாவி அணுகுமுறை செயலாக்கத்தில் நாங்கள் இயக்கிய அதே வினவலை இயக்குவோம்: query = { 'look': 'glowing', 'habitat': 'dark places', 'behavior': 'light manipulation' } app.query( monster_query, limit=LIMIT, **query, **default_weights ) ஐடி மதிப்பெண் பார் வாழ்விடம் நடத்தை கிசுகிசுக்கும் நிழல் 0.376738 ஒளிரும் கண்களுடன் நிழலான, உருவமற்ற உயிரினம் இருண்ட காடுகள் மற்றும் கைவிடப்பட்ட கட்டிடங்கள் பயத்தை ஊட்டுகிறது மற்றும் அமைதியற்ற உண்மைகளை கிசுகிசுக்கிறது லுமினோத் 0.340084 ஒளிரும் இறக்கைகள் மற்றும் ஆண்டெனாவுடன் அந்துப்பூச்சி போன்ற உயிரினம் பயோலுமினசென்ட் தாவரங்கள் கொண்ட அடர்ந்த காடுகள் மற்றும் காடுகள் இரையைத் தொடர்புகொள்வதற்கும் ஈர்ப்பதற்கும் இனிமையான ஒளி வடிவங்களை வெளியிடுகிறது வாழும் கிராஃபிட்டி 0.330587 தட்டையான பரப்பில் வசிக்கும் இரு பரிமாண, வண்ணமயமான உயிரினம் நகர்ப்புறங்கள், குறிப்பாக சுவர்கள் மற்றும் விளம்பர பலகைகள் சுற்றுச்சூழலுடன் கலக்க வடிவமாற்றம் செய்து நிறமிகளை உறிஞ்சுகிறது எட் வோய்லா! இந்த நேரத்தில், எங்களின் டாப் ரிடர்ன்ட் பேய்கள் ஒவ்வொன்றும், நமது அசுரனிடம் இருக்க வேண்டும் என்று நாம் விரும்பும் மூன்று குணாதிசயங்களின் ஒரு வகையான "சராசரியை" பிரதிநிதித்துவப்படுத்தும் மதிப்பெண்ணில் உயர்ந்த இடத்தில் உள்ளது. ஒவ்வொரு அசுரனின் ஸ்கோரையும் விரிவாக உடைப்போம்: ஐடி பார் வாழ்விடம் நடத்தை மொத்தம் கிசுகிசுக்கும் நிழல் 0.167859 0.203189 0.005689 0.376738 லுமினோத் 0.126206 0.098689 0.115189 0.340084 வாழும் கிராஃபிட்டி 0.091063 0.110944 0.12858 0.330587 எங்களின் இரண்டாவது மற்றும் மூன்றாவது முடிவுகள், லுமினோத் மற்றும் லிவிங் கிராஃபிட்டி ஆகிய இரண்டும் விரும்பிய மூன்று பண்புகளையும் கொண்டுள்ளன. சிறந்த முடிவு, விஸ்பரிங் ஷேட், ஒளி கையாளுதலின் அடிப்படையில் குறைவான பொருத்தமாக இருந்தாலும் - அதன் மதிப்பெண்ணில் (0.006) பிரதிபலிக்கிறது, "ஒளிரும்" அம்சங்கள் மற்றும் இருண்ட சூழலைக் கொண்டுள்ளது, அது அதன் (0.168) மற்றும் (0.203) மதிப்பெண்களை மிக அதிகமாகக் கொண்டுள்ளது. அதிக, இது அதிகபட்ச மொத்த மதிப்பெண்ணை (0.377) அளிக்கிறது, இது ஒட்டுமொத்தமாக மிகவும் பொருத்தமான அரக்கனாக அமைகிறது. என்ன ஒரு முன்னேற்றம்! behavior look habitat எங்கள் முடிவுகளைப் பிரதிபலிக்க முடியுமா? மற்றொரு வினவலை முயற்சி செய்து கண்டுபிடிக்கலாம். query = { 'look': 'shapeshifting', 'habitat': 'varied landscapes', 'behavior': 'illusion creation' } ஐடி மதிப்பெண் பார் வாழ்விடம் நடத்தை மிஸ்ட் பாண்டம் 0.489574 மூடுபனி போன்ற மனித உருவத்தை மாற்றியமைக்கும் அம்சங்களுடன் சதுப்பு நிலங்கள், மேடுகள் மற்றும் பனிமூட்டமான கடற்கரைகள் மாயைகள் மற்றும் கிசுகிசுக்கள் மூலம் பயணிகளை வழிதவறச் செய்கிறது செஃபிர் டான்சர் 0.342075 மாறுபட்ட இறகுகள் கொண்ட அழகான பறவை உயிரினம் உயரமான மலைச் சிகரங்கள் மற்றும் காற்று வீசும் சமவெளிகள் துணையை ஈர்ப்பதற்காக மயக்கும் வான்வழி காட்சிகளை உருவாக்குகிறது கிசுகிசுக்கும் நிழல் 0.337434 ஒளிரும் கண்களுடன் நிழலான, உருவமற்ற உயிரினம் இருண்ட காடுகள் மற்றும் கைவிடப்பட்ட கட்டிடங்கள் பயத்தை ஊட்டுகிறது மற்றும் அமைதியற்ற உண்மைகளை கிசுகிசுக்கிறது அருமை! எங்கள் முடிவுகள் மீண்டும் சிறப்பாக உள்ளன. எங்கள் தரவுத்தொகுப்பிலிருந்து ஒரு குறிப்பிட்ட அசுரனைப் போன்ற பேய்களை நாம் கண்டுபிடிக்க விரும்பினால் என்ன செய்வது? நாம் இதுவரை பார்த்திராத ஒரு அரக்கனுடன் இதை முயற்சிப்போம் - ஹார்மோனிக் பவளப்பாறை. இந்த அசுரனுக்கான பண்புகளை நாம் மற்றும் வினவல் அளவுருக்களை கைமுறையாக உருவாக்கலாம். ஆனால் வினவல் பொருளில் நாம் பயன்படுத்தக்கூடிய முறையை Superlinked கொண்டுள்ளது. ஒவ்வொரு அரக்கனின் ஐடியும் அதன் பெயராக இருப்பதால், எங்கள் கோரிக்கையை இவ்வாறு எளிமையாக வெளிப்படுத்தலாம்: பிரித்தெடுக்கலாம் with_vector app.query( monster_query.with_vector(monster, "Harmonic Coral"), **default_weights, limit=LIMIT ) ஐடி மதிப்பெண் பார் வாழ்விடம் நடத்தை ஹார்மோனிக் பவளம் 1 கிளைகள், இசைக்கருவி போன்ற அமைப்பு அதிர்வுறும் போக்குகளுடன் ஆழமற்ற கடல்கள் மற்றும் அலை குளங்கள் உணர்ச்சிகளைத் தொடர்புகொள்வதற்கும் செல்வாக்கு செலுத்துவதற்கும் சிக்கலான மெல்லிசைகளை உருவாக்குகிறது ட்ரீம்வீவர் ஆக்டோபஸ் 0.402288 அரோராஸ் போல மின்னும் கூடாரங்களைக் கொண்ட செபலோபாட் ஆழமான கடல் அகழிகள் மற்றும் நீருக்கடியில் குகைகள் அருகிலுள்ள உயிரினங்களின் கனவுகளை பாதிக்கிறது அக்வா ரைத் 0.330869 ஓடும் நீரால் செய்யப்பட்ட ஒளிஊடுருவக்கூடிய மனித உருவம் ஆறுகள், ஏரிகள் மற்றும் கடலோரப் பகுதிகள் நீர்நிலைகளுடன் கலக்க வடிவமாற்றங்கள் மற்றும் நீரோட்டங்களைக் கட்டுப்படுத்துகிறது எதிர்பார்த்தது போலவே ஹார்மோனிக் பவளமே மிகவும் பொருத்தமானது. ட்ரீம்வீவர் ஆக்டோபஸ் மற்றும் அக்வா வ்ரைத் ஆகிய இரண்டு பேய்களை நாங்கள் தேடுகிறோம். இருவரும் ஹார்மோனிக் பவளத்துடன் முக்கியமான கருப்பொருள் ( ) கூறுகளைப் பகிர்ந்து கொள்கிறார்கள்: பண்பு நீர்வாழ் வாழ்விடங்கள் ( ) habitat அவர்களின் சூழலில் செல்வாக்கு அல்லது கையாளும் திறன் ( ) behavior மாறும் அல்லது திரவ காட்சி பண்புகள் ( ) look பண்பு எடையிடல் இப்போது, நாம் பண்புக்கு அதிக முக்கியத்துவம் கொடுக்க விரும்புகிறோம் என்று வைத்துக்கொள்வோம். வினவல் நேரத்தில் எடைகளை எளிதாக சரிசெய்ய சூப்பர் லிங்க்ட் ஃப்ரேம்வொர்க் உதவுகிறது. எளிதாக ஒப்பிடுவதற்கு ஹார்மோனிக் பவளப்பாறை போன்ற அரக்கர்களைத் தேடுவோம். look look weights = { "look_weight": 1.0, "habitat_weight": 0, "behavior_weight": 0 } app.query( monster_query.with_vector(monster, "Harmonic Coral"), limit=LIMIT, **weights ) ஐடி மதிப்பெண் பார் வாழ்விடம் நடத்தை ஹார்மோனிக் பவளம் 0.57735 கிளைகள், இசைக்கருவி போன்ற அமைப்பு அதிர்வுறும் போக்குகளுடன் ஆழமற்ற கடல்கள் மற்றும் அலை குளங்கள் உணர்ச்சிகளைத் தொடர்புகொள்வதற்கும் செல்வாக்கு செலுத்துவதற்கும் சிக்கலான மெல்லிசைகளை உருவாக்குகிறது தோர்ன்வைன் எலிமெண்டல் 0.252593 முறுக்கப்பட்ட கொடிகள் மற்றும் முட்கள் கொண்ட உடல் போன்ற தாவரங்கள் போன்ற உயிரினம் வளர்ந்த இடிபாடுகள் மற்றும் அடர்ந்த காடுகள் விரைவாக வளரும் மற்றும் சுற்றியுள்ள தாவர வாழ்க்கையை கட்டுப்படுத்துகிறது பிளாஸ்மா பாம்பு 0.243241 வெடிக்கும் ஆற்றலால் ஆன பாம்பு போன்ற உயிரினம் மின் புயல்கள் மற்றும் மின் உற்பத்தி நிலையங்கள் மின்னோட்டங்களை ஊட்டுகிறது மற்றும் குறுகிய-சுற்று தொழில்நுட்பத்தில் முடியும் எங்கள் முடிவுகள் அனைத்தும் (பொருத்தமான முறையில்) ஒரே மாதிரியான தோற்றம் கொண்டவை - "அதிர்வுறும் தசைநாண்களுடன் கிளைத்தல்", "முறுக்கப்பட்ட கொடிகள் மற்றும் முட்கள் கொண்ட உடல் போன்ற உயிரினம்", "பாம்பு போன்றது". இப்போது, மற்றொரு தேடலைச் செய்வோம், தோற்றத்தைப் புறக்கணித்துவிட்டு, ஒரே நேரத்தில் மற்றும் அடிப்படையில் ஒரே மாதிரியான அரக்கர்களைத் தேடுவோம்: habitat behavior weights = { "look_weight": 0, "habitat_weight": 1.0, "behavior_weight": 1.0 } ஐடி மதிப்பெண் பார் வாழ்விடம் நடத்தை ஹார்மோனிக் பவளம் 0.816497 கிளைகள், இசைக்கருவி போன்ற அமைப்பு அதிர்வுறும் போக்குகளுடன் ஆழமற்ற கடல்கள் மற்றும் அலை குளங்கள் உணர்ச்சிகளைத் தொடர்புகொள்வதற்கும் செல்வாக்கு செலுத்துவதற்கும் சிக்கலான மெல்லிசைகளை உருவாக்குகிறது ட்ரீம்வீவர் ஆக்டோபஸ் 0.357656 அரோராஸ் போல மின்னும் கூடாரங்களைக் கொண்ட செபலோபாட் ஆழமான கடல் அகழிகள் மற்றும் நீருக்கடியில் குகைகள் அருகிலுள்ள உயிரினங்களின் கனவுகளை பாதிக்கிறது மிஸ்ட் பாண்டம் 0.288106 மூடுபனி போன்ற மனித உருவம் மாறக்கூடிய அம்சங்களுடன் சதுப்பு நிலங்கள், மேடுகள் மற்றும் பனிமூட்டமான கடற்கரைகள் மாயைகள் மற்றும் கிசுகிசுக்கள் மூலம் பயணிகளை வழிதவறச் செய்கிறது மீண்டும், Superlinked அணுகுமுறை சிறந்த முடிவுகளைத் தருகிறது. மூன்று பேய்களும் நீர் நிறைந்த சூழலில் வாழ்கின்றன மற்றும் மனதைக் கட்டுப்படுத்தும் திறன்களைக் கொண்டுள்ளன. இறுதியாக, மற்றொரு தேடலை முயற்சிப்போம், மூன்று பண்புகளையும் வித்தியாசமாக எடைபோடலாம் - ஹார்மோனிக் பவளத்துடன் ஒப்பிடுகையில் ஓரளவு ஒத்ததாக இருக்கும், மிகவும் வேறுபட்ட வாழ்விடங்களில் வாழும் மற்றும் மிகவும் ஒத்த நடத்தை கொண்ட அரக்கர்களைக் கண்டறிய: weights = { "look_weight": 0.5, "habitat_weight": -1.0, "behavior_weight": 1.0 } ஐடி மதிப்பெண் பார் வாழ்விடம் நடத்தை ஹார்மோனிக் பவளம் 0.19245 கிளைகள், இசைக்கருவி போன்ற அமைப்பு அதிர்வுறும் போக்குகளுடன் ஆழமற்ற கடல்கள் மற்றும் அலை குளங்கள் உணர்ச்சிகளைத் தொடர்புகொள்வதற்கும் செல்வாக்கு செலுத்துவதற்கும் சிக்கலான மெல்லிசைகளை உருவாக்குகிறது லுமினோத் 0.149196 ஒளிரும் இறக்கைகள் மற்றும் ஆண்டெனாவுடன் அந்துப்பூச்சி போன்ற உயிரினம் பயோலுமினசென்ட் தாவரங்கள் கொண்ட அடர்ந்த காடுகள் மற்றும் காடுகள் இரையைத் தொடர்புகொள்வதற்கும் ஈர்ப்பதற்கும் இனிமையான ஒளி வடிவங்களை வெளியிடுகிறது செஃபிர் டான்சர் 0.136456 மாறுபட்ட இறகுகள் கொண்ட அழகான பறவை உயிரினம் உயரமான மலைச் சிகரங்கள் மற்றும் காற்று வீசும் சமவெளிகள் துணையை ஈர்ப்பதற்காக மயக்கும் வான்வழி காட்சிகளை உருவாக்குகிறது மீண்டும் சிறந்த முடிவுகள்! எங்களுடைய மற்ற இரண்டு மீட்டெடுக்கப்பட்ட அரக்கர்கள் - லுமினோத் மற்றும் செஃபிர் டான்சர் - ஹார்மோனிக் பவளப்பாறையைப் போன்ற நடத்தை கொண்டவர்கள் மற்றும் ஹார்மோனிக் பவளப்பாறையிலிருந்து வேறுபட்ட வாழ்விடங்களில் வாழ்கின்றனர். அவை ஹார்மோனிக் பவளத்திலிருந்தும் மிகவும் வேறுபட்டவை. (ஹார்மோனிக் பவளத்தின் போக்குகளும் லுமினோத்தின் ஆண்டெனாவும் ஓரளவு ஒத்த அம்சங்களாக இருந்தாலும், நாங்கள் 0.5 ஆல் குறைத்தோம், மேலும் இரண்டு அரக்கர்களுக்கும் இடையிலான ஒற்றுமை அங்கேயே முடிகிறது.) look_weight தனிப்பட்ட பண்புகளின் அடிப்படையில் இந்த அரக்கர்களின் ஒட்டுமொத்த மதிப்பெண்கள் எவ்வாறு உடைகின்றன என்பதைப் பார்ப்போம்: ஐடி பார் வாழ்விடம் நடத்தை மொத்தம் ஹார்மோனிக் பவளம் 0.19245 -0.3849 0.3849 0.19245 லுமினோத் 0.052457 -0.068144 0.164884 0.149196 செஃபிர் டான்சர் 0.050741 -0.079734 0.165449 0.136456 லுமினோத் மற்றும் செஃபிர் டான்சரின் எதிர்மறை மதிப்பெண்களில் காணப்படுவது போல், (-1.0) எதிர்மறையாக எடைபோடுவதன் மூலம், ஒரே மாதிரியான வாழ்விடங்களைக் கொண்ட அரக்கர்களை நாங்கள் வேண்டுமென்றே "தள்ளுகிறோம்". லுமினோத் மற்றும் செஃபிர் டான்சரின் மதிப்பெண்கள் ஒப்பீட்டளவில் அதிகமாக உள்ளன, இது ஹார்மோனிக் கோரலுடன் அவர்களின் நடத்தை ஒற்றுமையைக் குறிக்கிறது. அவர்களின் மதிப்பெண்கள் நேர்மறையானவை, ஆனால் குறைவானவை, ஹார்மோனிக் கோரலுடன் ஆனால் தீவிர காட்சி ஒற்றுமையை பிரதிபலிக்கவில்லை. habitat habitat_weight behavior look சில சுருக்கமாக, ஹார்மோனிக் பவளத்துடன் முக்கிய நடத்தை பண்புகளைப் பகிர்ந்து கொள்ளும் ஆனால் மிகவும் வித்தியாசமான சூழல்களைக் கொண்ட மற்றும் குறைந்த பட்சம் வித்தியாசமாகத் தோற்றமளிக்கும் அசுரர்களை வெளிக்கொணர்வதில் எங்களுடைய உத்தி -1.0 ஆகவும், 0.5 ஆகவும் குறைக்கிறது. behavior_weight habitat_weight look_weight முடிவுரை மல்டி-அட்ரிபியூட் வெக்டார் தேடல் என்பது தகவல் மீட்டெடுப்பதில் குறிப்பிடத்தக்க முன்னேற்றமாகும், இது அடிப்படை சொற்பொருள் ஒற்றுமை தேடலை விட அதிக துல்லியம், சூழல் புரிதல் மற்றும் நெகிழ்வுத்தன்மையை வழங்குகிறது. இருப்பினும், எங்களின் அப்பாவி அணுகுமுறை (மேலே) - தனித்தனியாக பண்புக்கூறு திசையன்களை சேமித்து தேடுதல், முடிவுகளை ஒருங்கிணைத்தல் - திறன், நுணுக்கம் மற்றும் செயல்திறன் ஆகியவற்றில் நாம் ஒரே நேரத்தில் பல பண்புகளுடன் பொருட்களை மீட்டெடுக்க வேண்டும். (மேலும், பல kNN தேடல்கள் இணைக்கப்பட்ட திசையன்களுடன் ஒரு தேடலை விட அதிக நேரம் எடுக்கும்.) பின்னர் இது போன்ற காட்சிகளைக் கையாள, உங்கள் எல்லா பண்புக்கூறு வெக்டார்களையும் ஒரே திசையன் ஸ்டோரில் சேமித்து, வினவல் நேரத்தில் உங்கள் பண்புக்கூறுகளை எடைபோட்டு, செய்வது நல்லது. வேகமான, நம்பகமான, நுணுக்கமான, மல்டி-அட்ரிபியூட் வெக்டார் மீட்டெடுப்பு தேவைப்படும் எந்தவொரு பயன்பாட்டிற்கும் அப்பாவி அணுகுமுறையை விட சூப்பர் லிங்க் செய்யப்பட்ட அணுகுமுறை மிகவும் துல்லியமானது, திறமையானது மற்றும் அளவிடக்கூடியது - உங்கள் மின் வணிகம் அல்லது பரிந்துரை அமைப்பில் உள்ள நிஜ உலக தரவு சவால்களை உங்கள் பயன்பாட்டு வழக்கு சமாளிக்கிறதா ... அல்லது அசுரர்களுடன் சண்டையிடுவது போன்ற முற்றிலும் வேறுபட்ட ஒன்று. ஒரே தேடலைச் பங்களிப்பாளர்கள் ஆண்ட்ரி பிகுனோவ், ஆசிரியர் Mór Kapronczay, ஆசிரியர் முதலில் வெளியிடப்பட்டது. இங்கே