ይህ ቱሪት መውሰድ አስደናቂ ነበር: በዩናይትድ ስቴትስ ውስጥ በጣም ታዋቂ እና አስደናቂ የ AI ኩባንያዎች መካከል አንዱ በዩናይትድ ስቴትስ ላይ ይጫወታል. ነገር ግን ምንድን ነው? እነርሱ እንዴት ይጠቀማሉ? እና የእርስዎ AI መተግበሪያዎች ላይ ይህን ይመልከቱ? ቴክኖሎጂ እኔ የ LLMs ምን ነው ላይ ቁጥጥር ይሆናል. እኔ እዚህ አጠቃቀም በአሁኑ ጊዜ የ generative AI ኮርፖሬሽኖች ጋር ተስማሚ ነው. ነገር ግን ምናልባት, አዲስ ሞዴል ውሂብ አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም አጠቃቀም ነው. ይህ የንግድ ሂደቶች ወይም የሥራ ሂደቶች ጋር አንድ የ LLM መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ መተግበሪያ በአሁኑ ጊዜ, አብዛኞቹ የ LLM መተግበሪያ ስርዓቶች የኮምፒዩተር ፍጥነት ለማሻሻል - እንደ ወይም — ይህ ተጠቃሚዎች እና መተግበሪያዎች በዋነተኛ ሕይወት መተግበሪያዎች ውስጥ የሚጠቀሙትን አስደሳች, ትክክለኛ እና ተግባራዊ ግምገማዎችን ያተኮሩ አይደለም. በዋነተኛ ሕይወት ውስጥ, የ benchmark ግምገማዎች ዝቅተኛ ነው እና በዶሜን-መደሳች ትክክለኛነት, ፍጥነት እና ፍላጎት ተስማሚ እንደ ነገሮች ተጨማሪ ነው. አንድ ቀላል (1.5B parameter) ሮታሪ ሞዴል, እርስዎ ያግኙን ሞዴል ሮታኔት መፍትሔዎች አግኙን ግምገማዎች የ ARCH Router የእርስዎ የ ARCH Router እርስዎ እንደ "ጉዞ ማከማቻ" ወይም "ፎቶ መተግበሪያ" እንደ ተስማሚ ምድቦች ይመዝገቡ እና Arch-Router እያንዳንዱ ጥያቄን በግል ልምድ እና ግምገማ ላይ የተመሠረተ ሞዴል ላይ ይሰራል. ብጁ ብዛት-መተግበሪያ መተግበሪያዎች ከሁለቱም, Arch-Router ቀላል ነው, አዲስ ሞዴሎች ጋር ተስማሚ ነው, እና ፈጣን ነው - እያንዳንዱ መተግበሪያ መፍትሔ ላይ ብቻ 50ms ውስጥ ይጎብኙ - እንዲሁም እንደ Claude Sonnet 3.7 እና GPT-4o እንደ ባለቤትነት LLMs እንደ የእኛን ግምገማዎች በእያንዳንዱ እውነተኛ ግምገማ ውሂብ ላይ ያደርጋል. What is Arch-Router? እንደ ልማት, አንተ ብቻ በእርግጥ ያውቃሉ ማን LLM የእርስዎን መጠቀም ምሳሌ ለማግኘት የተሻለ ይሰራል በከፍተኛ ጥቅሞች እና ፍላጎቶች. የ LLM መተግበሪያ ላይ አዲስ መተግበሪያ ይሰጣል, በአጠቃቀም, የኮምፒዩተር ፍላጎቶች ላይ ተመሠረተ - ለምሳሌ, የዶሜን ባለሙያነት (መገንዘብ, ኮድ, የሕክምና) ወይም ልዩ እንቅስቃሴዎች (የተኮር, ፎቶ ማምረት) ያቀርባል. ይህ ሁለት ነገር ያደርጋል: Preference-aligned routing routing policy በድሜል ደረጃ (እንዴት, የገንዘብ, የሕክምና) እና, የሚፈልጉ ከሆነ, በፋይናንስ ደረጃ (እንዴት, "የተኮር", "SQL ለመፍጠር") የካርታ ስፋት (እንዴት, "Summarize", "Generate SQL") ውስጥ የካርታ ስፋት ይሸፍናል. እያንዳንዱ ፖሊሲ እያንዳንዱ የሥራ ቅርንጫፍ ለ ትክክለኛ ሞዴል ያረጋግጣል. የ LLM አንድ 1.5 ቢሊዮን ፓርሜትር ሞዴል ነው, ይህ ትክክለኛነት-መደበቅ ክስተት ላይ የተመሰረተ ነው. ጥቁር ኮድ መስፈርቶች ወይም ጥቁር ሣጥን ሮውተር ላይ የተመሠረተ helyett, የ Arch-Router የእርስዎን ሮውተር ፖሊሲዎን ይሰጣል እና ሌሎች ነገር ያደርጋል. ትክክክለኛ መጠን ቢሆንም, ሞዴል GPT-4o, Claude, እና Gemini ፋብሪካዎች ከከፍተኛ የግል LLMs ያደርጋል. በተጨማሪም, ይህ ፈጣን ይሰጣል, በ GPT-4o, Claude, እና Gemini ፋብሪካ ውስጥ መጨረሻ-የተግበሪያ መፍትሔዎችን ይሰጣል ዝቅተኛ የ LLMs አብዛኛውን ጊዜ በ 1 ሰከንዶች ብቻ አንድ ሮድ ለመምረጥ (እንዴታ 1). ውጤት: የቅርብ ጊዜ ትክክክለኛነት እና መተግበሪያ ወጪ አንድ ክፍሎች ላይ. የ ARCH Router 50ms (p50), 75ms (p99) የ ARCH Router How does it work? Arch-Router ሁለት ዋና ባህሪያት ይሰጣል: የዶሜን – የከፍተኛ ደረጃ የቴክኒክ ክፍል ወይም ትዕዛዞች (እን.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.) ተግባር - ተጠቃሚው የሚፈልጉትን ልዩ ዓይነት ተግባር (እን.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ. የ Domain እና Action Policy ሁለቱም ከባድ ሞዴሎች ወይም ሞዴል ስሪትዎች ጋር የተያያያዙ ናቸው. ከባድ ጊዜ ላይ, Arch-Router የ Domain እና Action ን በመጠቀም ከባድ ተመሳሳይነት, ተግባር መሳሪያዎች, እና የኮንክቶፕኒካል ትኩረት ይጠቀማል. ከዚያም በ 2 ውስጥ የተያያዙ እንደ ምርጥ ተስማሚ ሞዴል ለማስተካከል የተመሠረተ በይነገጽ ትኩረትዎችን ይጠቀማል. Performance አንድ ሞዴል በከፍተኛ ደረጃ (50 ms) እና ምርጥ የግል LLMs ላይ የተመሠረተ ፍጥነት ከከፍተኛ ደረጃ ያግኙ. ይህ የእርስዎን ፍላጎቶች ጋር ተስማሚ ነው, የተለያዩ ሰዎች ወይም ቡድን የእርስዎን የእርስዎን የተመሠረተ ፖሊሲዎችን ለመፍጠር ይችላሉ, ስለዚህ እያንዳንዱ ፍላጎት በጣም ተስማሚ ሞዴል ላይ ይምረጡ. እና ይህ ተስማሚ እና ተስማሚ ይሆናል: አንድ አዲስ ሞዴል ይመልከቱ, ወይም የእርስዎን ምርት ላይ አንድ ተግባር ያካትታል? ቀላል መተግበሪያ ፖሊሲ ፋይሎችን ማሻሻል እና ይጠቀማል - ምንም የሽያጭ መተግበሪያዎች, ምንም የፓይፕሊን መገንባት. እዚህ አንዳንድ ስቴትስቶች: Arch-Router 50ms (75ms በ p99 ላይ) Speed: የ 93,06% ትክክለኛነት በፈጠራ የ benchmark ላይ Accuracy : $0.00132 እያንዳንዱ ራውተር ፍላጎት Cost *: የተመሠረተ ራውተርዎች የ 1000ms+ ራውተር ጊዜ በ $ 5 ለ ራውተር ጥያቄ (GPT-4o) Comparison Ready to dive deeper? ይህ ጦማር ልጥፍ የ Arch-Router ምን እና እንዴት እንደሚጠቀሙ የሚችሉ ንጥረ ነው; ሙሉ ታሪክ በ Open-Source stack ውስጥ ይኖራሉ: የምስክር ወረቀት - ዝርዝር methodology, benchmarks, and ablation studies Arch-Router Collection - Arch-Router-1.5B ከ Hugging Face ጋር gguf ARCH: አንድ ሞዴል-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አንድ-አ የምስክር ወረቀት Arch-Router አጠቃቀም መግቢያ መተግበሪያ መመሪያዎች ለማግኘት የእኛን ማረፊያ ይጎብኙ, ለማሻሻል ይሰጣሉ, ወይም ጥያቄዎችን ያውቃሉ. እኛ የ LLM ላይ የተመሠረተ ኤች.ኤች.ኤች.ኤች.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.ኤ.