ስለ መንዳት ለመማር ትንሽ ጊዜ ወስደን እናስብ። ማናችንም ብንሆን የመንዳት መሰረታዊ መርሆችን ከጥቂት ሠርቶ ማሳያዎች መማር እንችላለን፣ እና እንደ መሪ፣ ማጣደፍ እና ብሬኪንግ የመሳሰሉትን ፅንሰ-ሀሳቦች ከተረዳን እነዚህን ችሎታዎች ለማንኛውም መኪና ተግባራዊ ማድረግ እንችላለን - ከታመቀ ሴዳን እስከ ትልቅ መኪና። በነዚህ ችሎታዎች ከተለያዩ የመንገድ ሁኔታዎች፣ የአየር ሁኔታ እና የትራፊክ ሁኔታዎች ጋር በፍጥነት መላመድ እንችላለን፣ ምንም እንኳን ከዚህ በፊት አጋጥሞን የማናውቀው ቢሆንም። ሆኖም፣ የአሁኑ AI ለእያንዳንዱ የተለየ ተሽከርካሪ እና ሁኔታ በሺዎች የሚቆጠር የሰአታት የስልጠና መረጃ ያስፈልገዋል፣ AGI ግን የመንዳት መሰረታዊ መርሆችን ተረድቶ በሰፊው ሊተገበር ይችላል።
AGI እውቀትን እና ክህሎቶችን በእውነት ሊያጠቃልሉ የሚችሉ AI ስርዓቶችን መፍጠር ነው - ሙሉ ለሙሉ አዲስ በሆኑ ሁኔታዎች ላይ ሊተገበሩ የሚችሉ መሰረታዊ መርሆችን መማር። መኪና መንዳት፣ አይብ መጫወት፣ ሂድ፣ ሚኔክራፍት፣ ወዘተ። ይህ ከዛሬዎቹ AI ሲስተሞች፣ LLMsን ጨምሮ፣ በዋናነት የሚንቀሳቀሰው ከብዙ የሥልጠና ዳታ ስብስቦች ጋር በተገናኘ በተራቀቀ ንድፍ ነው።
ዘመናዊ ኤል.ኤል.ኤም.ዎች ብልህ በሚመስል ውይይት ውስጥ መሳተፍ እና ውስብስብ ችግሮችን መፍታት ሲችሉ፣ በስልጠና ወቅት ያጋጠሟቸውን ዘይቤዎች በማወቅ እና በማጣመር በመሠረቱ ይሰራሉ። እውነተኛ የምክንያት ሞዴሎችን ወይም የአለምን ረቂቅ ውክልናዎችን ስለማይገነቡ ይህ ከእውነተኛ ግንዛቤ እና አጠቃላይ መግለጫ ይልቅ እጅግ የላቀ የማስታወስ እና የስታቲስቲክስ ትስስር ጋር ተመሳሳይ ነው። ጠቅለል ብለው ሲታዩ፣ አብዛኛውን ጊዜ ጥልቅ መርሆዎችን ከመረዳት ይልቅ በስልጠና ውሂባቸው ውስጥ ስውር ስታቲስቲካዊ ንድፎችን እያገኙ ነው።
ኤአርሲ በ AI ጥናት ውስጥ ወሳኝ የሆነ የመለኪያ ችግርን ይመለከታል - የ AI ስርዓት በአጠቃላይ ማጠቃለል የሚችል ከሆነ እንዴት እንሞክራለን?
ባህላዊ መመዘኛዎች በትላልቅ የሥልጠና ዳታ ስብስቦች በተወሰኑ ሥራዎች ላይ አፈጻጸምን ይለካሉ፣ ነገር ግን ከፍተኛ ውጤቶች የግድ እውነተኛ አጠቃላይ ችሎታን አያመለክቱም። አንድ AI እውነተኛ ግንዛቤን ከማዳበር ይልቅ የስልጠናውን መረጃ በማስታወስ በቀላሉ በደንብ ሊሰራ ይችላል።
ኤፍ. Chollet እንደጻፈው፡ “እኛ እስከምናውቀው ድረስ፣ ARC በማንኛውም ነባር የማሽን መማሪያ ቴክኒክ (ጥልቅ ትምህርትን ጨምሮ) የሚቀርብ አይመስልም።
ዋናዎቹ ችግሮች የሚከተሉት ናቸው:
- የሚጠበቀው ውጤት መለያ ወይም ሌላው ቀርቶ የመለያዎች ስብስብ አይደለም, ነገር ግን እስከ 30x30 መጠን ያለው እና እስከ 10 የተለያዩ ቀለሞች ያለው ባለ ቀለም ፍርግርግ ነው. ስለዚህ, በተዋቀረ ትንበያ ጎራ ውስጥ ይወድቃል.
- የተተነበየው ውጤት ከሚጠበቀው ውጤት ጋር በትክክል መመሳሰል አለበት። ነጠላ ሕዋስ ከተሳሳተ, ተግባሩ እንደ ውድቀት ይቆጠራል. ያንን ለማካካስ ለእያንዳንዱ የግቤት ፍርግርግ ሶስት ሙከራዎች ተፈቅደዋል።
- በእያንዳንዱ ተግባር ውስጥ በአጠቃላይ በሁለት እና በአራት የስልጠና አጋጣሚዎች (የግቤት ፍርግርግ + የውጤት ፍርግርግ) እና አንድ ወይም ሁለት የፈተና አጋጣሚዎች አሉ ትንበያ መደረግ ያለበት።
- እያንዳንዱ ተግባር ከግቤት ፍርግርግ ወደ የውጤት ፍርግርግ በተለየ ለውጥ ላይ የተመሰረተ ነው. በተለይም በስልጠና ተግባራት ላይ የተማረውን ለውጥ እንደገና በመጠቀም የትኛውም የግምገማ ተግባር መፍታት አይቻልም። እያንዳንዱ ተግባር የተለየ የመማር ችግር ነው፣ እና ARC የሚገመግመው ሰፋ ያለ አጠቃላይ እና ጥቂት-በጥይት ትምህርት ነው።
ARC እያንዳንዱን እንቆቅልሽ ከ3-5 ናሙናዎች ብቻ፣ ጥቂት ጥይት ብቻ በማቅረብ የበለጠ ጥብቅ የአጠቃላይ ሙከራን ያቀርባል። ይህ አነስተኛ የሥልጠና መረጃ AI በሰፊ ስርዓተ ጥለት ማዛመድ ላይ መተማመን አይችልም ማለት ነው - መሰረታዊ መርሆችን አውጥቶ ለአዳዲስ ሁኔታዎች መተግበር አለበት፣ ልክ ሰዎች እንደሚያደርጉት። እንቆቅልሾቹ አቋራጭ መፍትሄዎችን ወይም የማስታወስ ስልቶችን ለመቃወም ሆን ተብሎ የተነደፉ ናቸው።
ኤአርሲን በተለይ ዋጋ ያለው የሚያደርገው በቁጥር ሊገመት የሚችል የአጠቃላይ ችሎታ መለኪያ መስጠቱ ነው። የ AI ሲስተም በተወሰነ ፍልስፍናዊ መልኩ “ይገነዘባል” ወይ ብለን ከመወዛገብ ይልቅ፣ በእነዚህ በጥንቃቄ በተዘጋጁ የማመዛዘን ስራዎች ላይ ተጨባጭ አፈጻጸምን መለካት እንችላለን። ይህ ለተመራማሪዎች ወደ ሰዉ ሰራሽ ጪረቃ አጠቃላይ የማሰብ ሂደት ግስጋሴ ግልጽ መለኪያ ይሰጣል።
ስለ ARC መለኪያ እና ለ AI እድገት ምን ማለት እንደሆነ የበለጠ ማወቅ ከፈለጉ፣ ይህ ቪዲዮ ለመጀመር ጥሩ ቦታ ነው።
የ2020 Kaggle ውድድር ARCን ለመፍታት ከመጀመሪያዎቹ አቀራረቦች ውስጥ አንዱን አሳይቷል - በድብቅ ኃይል ፍለጋ አስቀድሞ በተገለጹ ለውጦች። አሸናፊው መፍትሄ 142 በእጅ የተሰሩ የፍርግርግ ስራዎችን የያዘ ጎራ-ተኮር ቋንቋ (DSL) ገንብቷል። እነዚህን ኦፕሬሽኖች በማጣመር ስልታዊ በሆነ መንገድ በመፈለግ በግል የግምገማ ስራዎች ላይ 20% ትክክለኛነትን አግኝቷል። የትራንስፎርሜሽን ፍለጋን ለመምራት ሰዋሰዋዊ ዝግመተ ለውጥን በመጠቀም ሌላ ተመሳሳይ መፍትሄ ከ3-7.68% ትክክለኛነት ደርሷል።
በመጀመሪያ ስኬታቸው ቢታወቅም፣ እነዚህ መፍትሔዎች ቁልፍ ውስንነትን አጉልተው አሳይተዋል፡ ማንኛውንም ትክክለኛ ግንዛቤ ወይም አጠቃላይ የማሳየት ችሎታን ከማዳበር ይልቅ ቀድሞ በታቀዱ ሕጎች ላይ ባለው ጥልቅ ፍለጋ ላይ ተመርኩ። ይህ በፕሮግራማዊ ፍለጋ እና በእውነተኛ የማሰብ ችሎታ መካከል ያለው ክፍተት ለምን ARC አጠቃላይ ችሎታዎችን ለመለካት ፈታኝ መለኪያ እንደሆነ ያሳያል።
አሁን ያለው አካሄድ ( https://github.com/sebferre/ARC-MDL/tree/master ) ቅጦችን ለማግኘት እና በተቻለ መጠን አጭር በሆነ መንገድ መረጃን በተሻለ ሁኔታ የሚያብራሩ ሞዴሎችን ለመገንባት በሚያገለግል መሠረታዊ መርህ ላይ የተመሠረተ ነው። በመሰረቱ፣ ኤምዲኤል “ለአንዳንድ መረጃዎች ምርጡ ሞዴል አብዛኛውን መረጃ የሚጨምቀው ነው” ይላል።
የፍርግርግ ንድፎችን በብቃት ለመግለጽ መፍትሄው ልዩ የሞዴሊንግ ቋንቋ ይጠቀማል። ይህ ቋንቋ ሁለቱንም የግቤት እና የውጤት ፍርግርግ እንደ መሰረታዊ ንጥረ ነገሮች ውህዶች ለመወከል የተዋቀረ መንገድ ያቀርባል፡-
በከፍተኛ ደረጃ፣ እያንዳንዱ እንቆቅልሽ እንደ ጥንድ ይወከላል እና ሁለት ፍርግርግ ይይዛል፡
● የግቤት ፍርግርግ (ውስጥ)
● የውጤት ፍርግርግ (ውጭ)
እያንዳንዱ ፍርግርግ በሦስት አካላት ይገለጻል፡-
እቃዎች የተቀመጡ ቅርጾች ናቸው, እያንዳንዱ ቅርጽ ምናልባት ሊሆን ይችላል:
● ነጠላ ቀለም ያለው ነጥብ
● የተወሰነ መጠን፣ ቀለም እና ጭምብል ያለው አራት ማዕዘን
የጭንብል ስርዓቱ በተለይ ኃይለኛ ነው ፣ አራት ማዕዘኖች የተለያዩ ቅርጾችን እንዲወስዱ ያስችላቸዋል።
● ሙሉ (ጠንካራ አራት ማዕዘን)
● ድንበር (ዝርዝር ብቻ)
● የቼክቦርድ ቅጦች (እንኳን ወይም ያልተለመደ)
● አቋራጭ ቅጦች (ፕላስ ወይም የጊዜ ቅርጽ)
● ብጁ የቢትማፕ ቅጦች
ይህ ቋንቋ ስርዓቱ የተወሳሰቡ የፍርግርግ ንድፎችን በተጨባጭ እንዲገልጽ ያስችለዋል። ለምሳሌ፣ 10x10 ፍርግርግ ፒክሰል በፒክሰል (100 እሴቶች) ከማጠራቀም ይልቅ “በቦታው (2,2) ላይ ባለ 3x3 ቀይ አራት ማዕዘን ያለው ጥቁር ዳራ” - አስፈላጊውን መዋቅር በሚይዝበት ጊዜ በጣም ያነሱ እሴቶችን በመጠቀም ሊያከማች ይችላል።
ስርዓተ ጥለቶችን በሚፈልጉበት ጊዜ ስርዓቱ ይህንን ቋንቋ በመጠቀም የሁለቱም የግብአት እና የውጤት ፍርግርግ በጣም አጭር መግለጫ ለማግኘት ይሞክራል። ጥሩ መፍትሄዎች በግብአት እና በውጤት መካከል ያሉ ንጥረ ነገሮችን (እንደ ከግቤት ውስጥ ቅርጽ መውሰድ እና በውጤቱ ውስጥ መለወጥ) እንደገና ጥቅም ላይ ይውላሉ, ይህም አጭር መግለጫዎችን እና የተሻለ መጨናነቅን ያመጣል.
የዚህ አቀራረብ ስኬት (94/400 የሥልጠና ተግባራት ተፈትተዋል) ይህ ቋንቋ በ ARC እንቆቅልሾች ውስጥ የሚገኙትን አብዛኛዎቹን ቁልፍ ዘይቤዎች እንደሚይዝ ይጠቁማል ለተወሰኑ ምሳሌዎች ከመጠን በላይ እንዳይገባ ተገድቧል።
ኤል.ኤል.ኤም.ዎች በብዙ ጎራዎች ላይ አስደናቂ ችሎታዎችን ያሳዩ ቢሆንም፣ በቀጥታ ARCን ለመፍታት መጠቀማቸው ሁለቱንም እድሎች እና ፈተናዎች ያቀርባል። የዋህ አቀራረብ LLMን ከግብአት-ውፅዓት ምሳሌዎች ጋር ማቅረብ እና ለአዳዲስ ግብአቶች መልሱን እንዲተነብይ መጠየቅን ያካትታል። ይሁን እንጂ ይህ ዘዴ ከፍተኛ ገደቦች አሉት. LLMs በዚህ አውድ ውስጥ በጣም ውስን የሆነ የቦታ የማመዛዘን ችሎታዎችን ያሳያሉ እና የፍርግርግ ለውጦችን ለመተንበይ ሲሞክሩ ለቅዠት በጣም የተጋለጡ ናቸው።
ይህ አካሄድ በቀጥታ የትንበያ ዘዴ ላይ ይገነባል በመጀመሪያ LLM በግቤት-ውፅዓት ጥንዶች ውስጥ የተመለከታቸው ንድፎችን እንዲመረምር እና እንዲገልጽ በመጠየቅ ነው። ይህ ተጨማሪ የማመዛዘን እርምጃ LLM ችግሩን እንዲበሰብስ በመርዳት የተሻለ ውጤት የሚያስገኝ ቢሆንም፣ አሁንም ተመሳሳይ መሠረታዊ ገደቦች አሉት። የመጨረሻውን ውጤት ለመተንበይ በሚሞክርበት ጊዜ ሞዴሉ ከፍተኛ የቅዠት ፍጥነት ማሳየቱን ቀጥሏል፣ እምቅ ንድፎችን ከለየ በኋላም ቢሆን። ይህ የሚያመለክተው የኤአርሲ ተግዳሮቶችን በመፍታት ረገድ የኤልኤልኤምን የቦታ አመክንዮ ገደቦችን ለማሸነፍ ግልጽ የማመዛዘን እርምጃዎችን ማከል ብቻ በቂ አለመሆኑን ነው።
በ WLTech.AI ፣ AGIን በማሳደድ የ AI ወኪሎች ትልቅ ሚና ትልቅ ጠቀሜታ እንዳለው እናያለን። እነሱ በተለዋዋጭ ከቅንብሮቻቸው ጋር መስተጋብር ለመፍጠር፣ በተማሩት ነገር ላይ ተመስርተው እና በራሳቸው ለመማር የተነደፉ ናቸው። አንድ ጊዜ ብቻ ከሰለጠኑ የማይንቀሳቀሱ ሞዴሎች በተለየ የ AI ወኪሎች ቀጣይነት ባለው መስተጋብር ሊማሩ እና ከተለዋዋጭ ሁኔታዎች ጋር መላመድ በ AGI እድገት ውስጥ ወሳኝ አካል ያደርጋቸዋል።
AI ወኪሎች ለአንድ ተግባር ልዩ ፍላጎቶች የተጣጣሙ የተለያዩ ቴክኒኮችን በማስተባበር የክዋኔው አንጎል ናቸው። ተምሳሌታዊ ሥርዓቶች በትክክል፣ ደንብን መሰረት ያደረጉ አመክንዮዎች በጣም ጥሩ ናቸው፣ ይህም እንደ ሽክርክር ወይም ነጸብራቅ ያሉ ለውጦችን ለመረዳት ለሚፈልጉ ተግባራት ፍጹም ያደርጋቸዋል። የነርቭ ኔትወርኮች ንድፎችን በማወቅ እና ከመረጃዎች አጠቃላይ እይታ በጣም ጥሩ ናቸው፣ ይህም በ ARC ተግባራት ውስጥ ያሉትን መሰረታዊ መዋቅሮችን ለመለየት በጣም ጠቃሚ ነው።
ሆኖም፣ የARC ተግዳሮቶች በምሳሌያዊ አያያዝ ወይም በስርዓተ-ጥለት እውቅና አያበቁም። ብዙ ተግባራት አዲስ ደንቦችን መፍጠር፣ ግንኙነት መፍጠር እና ከአዳዲስ ሁኔታዎች ጋር መላመድ መቻልን ጨምሮ የላቀ የማጠቃለያ ደረጃ ያስፈልጋቸዋል። የቋንቋ ሞዴሎች እንደ የፕሮግራም ውህደት እና የአብስትራክት ማመዛዘን ላሉ ነገሮች ጥቅም ላይ ሊውሉ ስለሚችሉ እዚህ ጠቃሚ ናቸው። የፍለጋ ስልተ ቀመሮች መፍትሄዎችን ለመለየት ሊደረጉ የሚችሉ ለውጦችን በብቃት ማሰስ ስለሚችሉ በሳጥኑ ውስጥ ያለው ሌላ መሳሪያ ነው። በሌላ በኩል የዕቅድ አወጣጥ ሥርዓቶች ውስብስብ ችግሮችን በአንድ ደረጃ ለማፍረስ እና ለመፍታት ማዕቀፉን ይሰጣሉ።
የ AI ወኪሎችን በጣም ብልህ የሚያደርጋቸው እነዚህን ሁሉ የተለያዩ አቀራረቦች አንድ ላይ ማምጣት መቻላቸው ነው። በአንድ ጊዜ አንድ ዘዴ ብቻ አይጠቀሙም. እያንዳንዱን ልዩ ችግር ለመፍታት ምርጡን የቴክኒኮች ጥምረት ይገመግማሉ እና ያሰማራሉ። ይህ በመብረር ላይ የመላመድ ችሎታ ሰዎችን የሚለየው እና AGI ን ለማራመድ አስፈላጊ አካል ነው።
በዋናነታቸው፣ AI ወኪሎች በመሠረቱ የማሰብ ችሎታ ያላቸው አስተባባሪዎች ናቸው። ካለፈው ልምዳቸው እንዲማሩ የሚጠቅመውንና የማይሰራውን በመመዝገብ ይመዘግባሉ።
የእኛ ወኪል AI መፍትሔ የእኛን መፍትሔ እዚህ ማግኘት ይችላሉ https://colab.research.google.com/drive/1-rQoqrGRGQE6M8bMpfzqf6tV3TnUi-Mp?usp=sharing ወይም Github ላይ: https://github.com/weblab-technology/ ቅስት-ፈተና-2024-10
ግኝታችን የመጣው የሰውን ችግር ፈቺ ባህሪ በመኮረጅ፡ ምሳሌዎችን በመተንተን፣ ህጎችን በመላምት፣ በመሞከር እና በማጣራት ነው። ከጭካኔ ኃይል ይልቅ፣ የእኛ AI የማመንጨት ተግባራትን በመጻፍ ላይ ያተኩራል - ትራንስፎርሜሽንን የሚገልጽ የፓይዘን ኮድ - እና ወዲያውኑ በስልጠናው መረጃ ላይ ይፈትሻቸዋል።
በአቀራረባችን ውስጥ አንድ አስገራሚ ግኝት ተደጋጋሚ ማሻሻያዎች ከመርዳት ይልቅ እድገትን እንደሚያደናቅፉ ነው። ከትውልድ ተግባር በስተጀርባ ያለው የመነሻ ግምት የተሳሳተ ከሆነ፣ ለማጣራት መሞከር ስህተቱን ከማረም ይልቅ ያሰፋዋል። ይህ ግንዛቤ የእኛን ዘዴ በመሠረታዊ መልኩ ቀይሯል.
የተሳሳቱ ግምቶችን ከማጥራት ይልቅ የሚከተሉትን ለማድረግ የበለጠ ውጤታማ ሆኖ አግኝተነዋል።
ይህ የተበላሸውን ስልት ከማስተካከል ይልቅ የመፍትሄው መንገድ ፍሬያማ ሆኖ ሲገኝ እንደገና የማስጀመር እና እንደገና የማሰብ ባህሪን ያንጸባርቃል።
ይህ ግንዛቤ የጄኔቲክ አልጎሪዝም ውጤቱን ማሻሻል ያልቻለው ለምን እንደሆነ ያብራራል። በንድፍ ፣ የጄኔቲክ ስልተ ቀመሮች መፍትሄዎችን ከጊዜ ወደ ጊዜ እያሻሻሉ በትውልዶች ውስጥ ያጠራሉ። ነገር ግን፣ የመሠረታዊ ግምቶች የተሳሳቱ ሲሆኑ፣ ጭማሪ ለውጦች ከትክክለኛው ለውጥ የራቁ የተጠናከረ መፍትሄዎችን ያስገኛሉ።
የኤልኤልኤም ግምገማ፡- ክላውድ 3.5 ሶኔት ከተወዳዳሪዎች ይበልጣል
የARC ተግዳሮትን ለመቅረፍ፣ የትልልቅ ቋንቋ ሞዴሎችን (LLMs) በመፃፍ የማመንጨት ተግባራትን በሰፊው ሞከርን። ከነሱ መካከል ክላውድ 3.5 ሶኔት ከተወዳዳሪዎቹ በጣም የላቀ ብቃት ያለው ሆኖ ተገኝቷል።
ቁልፍ ግኝቶች፡-
ክላውድ 3.5 ሶኔት ከ GPT-4o፡
● አፈጻጸም ፡ ክላውድ 3.5 ሶኔት ከ GPT-4o የበለጠ ንድፎችን ለይቷል፣ ይህም በስርዓተ ጥለት ማወቂያ ትክክለኛነት በእጥፍ የሚጠጋ ነው።
● ቅልጥፍና ፡ ክላውድ በ1/7 የአፈፃፀም ጊዜ ከOpenAI's GPT-4o ጋር ተመሳሳይ ውጤት አስመዝግቧል፣ ይህም የበለጠ ውጤታማ ብቻ ሳይሆን ፈጣንም እንዲሆን አድርጎታል።
የ GPT-4o ውድቅነት፡-
● የ GPT-4o አፈጻጸም ከጊዜ ወደ ጊዜ እየቀነሰ መሆኑን ተመልክተናል። የ GPT-4o የመጀመሪያ እትም ከተከታዮቹ ስሪቶች ይልቅ ለኤአርሲ ተግባራት የበለጠ አቅም ያለው ነበር፣ ይህም በዚህ ፈታኝ ሁኔታ የስርዓተ-ጥለት እውቅና እና ምክንያትን የሚያደናቅፍ በማመቻቸት ላይ ሊኖር እንደሚችል ያሳያል።
ለምን ክላውድ 3.5 ሶኔት ጎልቶ ይታያል
የክላውድ ጠርዝ ለ ARC ጥቂቶች ተኩስ ተፈጥሮ ወሳኝ የሆነውን አጠቃላይ የማጠቃለል እና ስውር ለውጦችን የመለየት ችሎታው ላይ ነው። ወጥነት ያለው አፈፃፀሙ እና ቅልጥፍናው ወደ AI ወኪል ማዕቀፋችን ለመዋሃድ ግልፅ ምርጫ አድርጎታል፣ ይህም በኤል ኤም ኤል ተነዱ ምክኒያቶች የተዋቀረ ችግር ፈቺ አዲስ መስፈርት አስቀምጧል።
አካሄዳችን በ ARC ግምገማ ስብስብ ላይ ወደ 30% ትክክለኝነት ማሳካት የቻለ ሲሆን ይህም የመነሻ ዘዴዎችን በእጅጉ የላቀ ነው። ይህ ውጤት የሰውን ችግር ፈቺ ባህሪ የመኮረጅ ጥንካሬን ያጎላል፣ አዳዲስ መላምቶችን በተደጋጋሚ ማሻሻያዎች ላይ መጠቀም እና እንደ ክላውድ 3.5 ሶኔት ያሉ በጣም አቅም ያላቸውን LLMs መጠቀም። አሁንም ለመሻሻል ትልቅ ቦታ ቢኖርም፣ ይህ ወሳኝ ምዕራፍ የARCን ተግዳሮቶች በመፍታት እና በ AI ውስጥ ወደ ሰፊው አጠቃላይነት በማራመድ ረገድ ትርጉም ያለው እድገት ያሳያል።
በ WLTech.AI ላይ የ ARCን የመፍታት የወደፊት ጊዜ የኤልኤልኤም አቅምን ቀጣይ እድገት እና እንደ ዝቅተኛው የመግለጫ ርዝመት (ኤምዲኤል) ወይም ተመሳሳይ አቀራረቦችን ለአጭር የስርዓተ-ጥለት ማብራራት ነው ብለን እናምናለን። እነዚህ እድገቶች ሞዴሎችን የተሻለ ረቂቅ እና አጠቃላይ ለውጦችን እንዲያደርጉ ያስችላቸዋል። በተጨማሪም፣ በማደግ ላይ ባለው የመፍትሄዎች ባንክ ላይ የተመሰረተ ራስን የማጣራት አፋጣኝ አሰራርን ማቀናጀት ሞዴሎች ደጋግመው አመክንዮአቸውን እንዲያሻሽሉ እና ካለፉት ስኬቶች በመነሳት የበለጠ መላመድ እና ቀልጣፋ ችግር ፈቺ የቧንቧ መስመር እንዲፈጥሩ ያስችላቸዋል። ይህ በላቁ የኤል.ኤል.ኤም.ዎች፣ የተዋቀሩ ማብራሪያዎች እና የመለማመጃ ትምህርት በ ARC እና AGI ልማት ውስጥ አዳዲስ ምእራፎችን የመክፈት አቅም አለው።
የአብስትራክሽን እና ማመራመር ኮርፐስ (ኤአርሲ) ማመሳከሪያው AI አጠቃላይ ህጎችን እንዴት በጥሩ ሁኔታ እንደሚተገበር እና የበለጠ ረቂቅ በሆነ መንገድ እንደሚያስብ ለመፈተሽ ቁልፍ ነበር። በዓመታት ውስጥ፣ እያንዳንዱ በሜዳው ላይ የተለየ ነገር ሲጨምር፣ በርካታ ጎልተው የሚወጡ ፈቺዎች ሲመጡ አይተናል።
● የራያን ግሪንብላት አቀራረብ
እ.ኤ.አ. በ 2024 የሬድዉድ ምርምር መሐንዲስ ራያን ግሪንብላት በ ARC-AGI የህዝብ ግምገማ ስብስብ ላይ 42% በማስቆጠር ትልቅ ደረጃ ላይ ደርሷል ፣ የማረጋገጫ ነጥብ 43% ነው። የእሱ አቀራረብ GPT-4oን በመጠቀም በርካታ የፓይዘን ፕሮግራሞችን ማመንጨት እና ማጣራት እና ምርጦቹን ለመምረጥ ነበር። ይህ የሚያሳየው ውስብስብ የማመዛዘን ስራዎችን ለመቅረፍ ትላልቅ የቋንቋ ሞዴሎችን ከፕሮግራም ውህደት ጋር እንዴት መጠቀም እንደምንችል ያሳያል።
● አይስኩበር 2020
የ"icecuber 2020" መፍትሄ፣ የቀድሞ ውድድር አሸናፊ፣ የህዝብ ግምገማ ነጥብ 39 በመቶ እና የ17 በመቶ የማረጋገጫ ነጥብ አግኝቷል። ስለ ዘዴው ሁሉም ዝርዝሮች ባይኖረንም፣ ይህ መፍትሔ ለቀጣይ ARC ፈላጊዎች ባር በማዘጋጀት ረገድ በጣም አስፈላጊ ነበር።
የ ARC ሽልማት 2024 መሪ ሰሌዳ የሚከተሉትን ከፍተኛ አፈፃፀም አሳይቷል
● MindsAI 55.5% በማምጣት ግንባር ቀደም ነው።
● አርኪቴክቶች በ53.5% ነጥብ ወደ ኋላ ይቀርባሉ ።
● ጊለርሞ ባርባዲሎ 40 በመቶ በማስቆጠር ሶስተኛ ደረጃን ይዟል።
● አሊጅስ በአራተኛ ደረጃ፣ እንዲሁም በ40%
● TuMinhDang አምስተኛ በ38 በመቶ ውጤት።
እነዚህ ውጤቶች ሁሉም ሰው እንዴት ጠንክሮ እንደሚሰራ እና የ ARC መለኪያን ለመቅረፍ አዳዲስ መንገዶችን እንደሚያመጣ ያሳያሉ። የተለያዩ ቡድኖች እንዴት የተለያዩ ስልቶችን እንደሚጠቀሙም ያሳያሉ።
የኤአርሲ ቤንችማርክ አሁንም AI ሲስተሞች ምን ያህል ማመዛዘን እና ማጠቃለል እንደሚችሉ ለመፈተሽ ጥሩ መንገድ ነው። ምንም እንኳን አንዳንድ ጥሩ እድገቶች ቢኖሩም፣ የትኛውም ሞዴል ሰው ሰራሽ አጠቃላይ የማሰብ ችሎታን ማግኘት ምን ያህል አስቸጋሪ እንደሆነ የሚያሳይ ከ ARC ጋር ሙሉ በሙሉ ሊይዝ አልቻለም። ተመራማሪዎች እና ባለሙያዎች ሁልጊዜ ችግሮችን ለመፍታት ከነርቭ አውታሮች ጋር ተምሳሌታዊ ምክንያትን በመጠቀም የተለያዩ አቀራረቦችን የሚያጣምሩ መንገዶችን ይፈልጋሉ።
እንደ ARC ያሉ ማመሳከሪያዎች ለ AI ምርምር የወደፊት ዕጣ ፈንታ ምን እንደሚሆን ፍንጭ ይሰጡናል። ሜዳውን እንደ ሰው ሊያስቡ እና ሊላመዱ ወደሚችሉ ሥርዓቶች እያንቀሳቀሱ ነው። አሁንም ቀርፋፋ መሻሻል እያደረግን ሳለ፣ ARC AGIን ለማግኘት ግልጽ መንገድ አስቀምጧል።
● ትኩረቱ ወደ አጠቃላይነት እየሄደ ነው። ( https://arxiv.org/abs/2305.07141?utm_source=chatgpt.com )
ለወደፊቱ, የ AI ስርዓቶች ከልዩነት ይልቅ ለአጠቃላይ የተነደፉ ይሆናሉ. የ ARC ተግባራት እንደሚያሳየው፣ እንደገና ማሰልጠን ሳያስፈልግ አዳዲስ ችግሮችን መፍታት መቻል የእውነተኛ ብልህነት ቁልፍ ምልክት ነው። ተመራማሪዎች አእምሯችን እንዴት እንደሚሰራ መነሳሳትን በመውሰድ በጥቂት-በጥይት ወይም በዜሮ-ሾት ትምህርት ጥሩ ሞዴሎችን ያዘጋጃሉ.
● ዲቃላ ሞዴሎች መደበኛ ይሆናሉ።
የARC ፈቺዎች ስኬት የነጠላ አቀራረብ ስርዓቶች ገደብ እንዳላቸው አስቀድሞ አሳይቶናል። የ AI የወደፊት ጊዜ የነርቭ አውታረ መረቦችን ፣ ተምሳሌታዊ ስርዓቶችን እና ምክንያታዊ አስተሳሰብን የሚያዋህዱ ድብልቅ ሞዴሎች ይሆናሉ። እነዚህ ሞዴሎች በኤአርሲ ላይ ጥሩ ይሰራሉ፣ ነገር ግን ተለዋዋጭነት እና መላመድ ቁልፍ በሆኑባቸው የገሃዱ ዓለም ችግሮችን ማስተናገድ ይችላሉ።
● በእውቀት (ኮግኒቲቭ) አርክቴክቸር ላይ አዲስ ትኩረት አለ።
ARC ሰዎች የሰውን አእምሮ የተለያዩ የማመዛዘን መንገዶችን የማጣመር ችሎታን የሚኮርጁ የግንዛቤ አርክቴክቸር እንዲያስቡ አድርጓል። ወደ ሥራ ማህደረ ትውስታ፣ ሜታ-ትምህርት እና ባለብዙ ወኪል ሲስተሞች ላይ ተጨማሪ ምርምር እናያለን፣ ይህም ለአይአይኤ መንገድን ለመክፈት የሚረዳ፣ ሊመራመር፣ ሊማር እና ሊላመድ ይችላል።
የ AI ስርዓቶች ብልህ ሲሆኑ፣ ስራዎቻችንን ለእኛ ብቻ ከማድረግ ይልቅ ከእኛ ጋር መስራት ይጀምራሉ። እንደ ARC ያሉ መመዘኛዎች እንደ ሳይንሳዊ ግኝት እና ፈጠራ ችግር አፈታት ባሉ ውስብስብ አካባቢዎች ግንዛቤዎችን እና መፍትሄዎችን በማቅረብ ከሰዎች ጋር አብረው የሚሰሩ AI ስርዓቶችን ለማዳበር እየረዱ ነው።
እንደነዚህ ያሉት ውድድሮች የ AI ማህበረሰብን አነሳስተዋል. ከ1,000,000 ዶላር በላይ ሽልማት በማግኘት፣ የARC ሽልማት ለተመራማሪዎች አሁን ያለውን መመዘኛዎች ሊያሸንፉ የሚችሉ ክፍት ምንጭ መፍትሄዎችን እንዲያቀርቡ ትልቅ ማበረታቻ ነው።
በ WLTech.AI ፣ የእነዚህ የመፍትሄ ሃሳቦች ዋጋ ከ1,000,000 ዶላር በላይ እንደሚበልጥ እንገነዘባለን።