I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. Az elmúlt hetekben dokumentáltam az utazási épületemet. , egy AI-rendszer, amely képes a homályos felhasználói szándékot repülésbiztos hardverre fordítani. OpenForge A cél a Google érvelési képességeinek tesztelése volt. Szeretném megválaszolni egy konkrét kérdést: Lehet-e egy LLM túllépni a Python szkriptek írásán, és valójában fizikai rendszereket tervezni, ahol a tolerancia, a feszültség és a kompatibilitás számít? Gemini 3.0 A válasz, kiderül, egy bonyolult „Igen, de...” Itt van a posztmortem arról, hogy mi működött, mi nem sikerült, és a kritikus különbség Kód és A rendszerek. Generating Refactoring A győzelem: Drone_4 Works Először is, a jó hír. A drone_4 ága a raktár egy siker. Ha klónozza a repo-t és kér egy "Long Range Cinema Drone" -t, a rendszer a vetőmagtól a szimulációig működik. Megértette a szándékot: Tudja, hogy a "Cinema" zökkenőmentes repülést jelent, és a "Long Range" a GPS és a Crossfire protokollokat jelenti. A kompatibilitási motor sikeresen elutasítja a motor/akkumulátor kombinációkat, amelyek túlmelegednek vagy felrobbannak. A valóságot szimulálja: az NVIDIA Isaac Sim számára generált USD fájlok valójában repülnek. Bevallom, pragmatikusnak kellett lennem. a make_fleet.py-ban egy kicsit "csaltam". Kevesebbet támaszkodtam az LLM-re, hogy dinamikusan feltaláljam a flotta logikáját, és többet a kemény kódú Python-orkestrálásra. Emlékeztetnem kellett magamra, hogy ez a Gemini 3.0 érvelésének tesztje volt, nem egy verseny, hogy megnézzem, elkerülhetem-e egyetlen kódvonal írását. A koncepció bizonyítéka a - ahol az LLM foglalkozik a kreatív fordítással, és a Python foglalkozik a fizika törvényeivel - az OpenForge egy győzelem. Neuro-Symbolic AI A kudarc: A négyzet alakú pivot A kihívás második fele az volt, hogy ezt a működő motort vegyem és forgassam. A Gemini 3.0-at a teljes kódbázisra (88k token) adtam, és megkérdeztem a refaktorot. I am officially shelving the Quadruped branch. Nyilvánvalóvá vált, hogy az a mód, ahogy elkezdtem ezt a pivotot, egy kör alakú lefolyó nyúl lyukba vezetett a hibaelhárításban. Olyan hurokban találtam magam, ahol a nyomaték kiszámításának rögzítése megszakítaná a készletek beszerzését, és a beszerzés rögzítése megszakítaná a szimulációt. Ha meg akarom építeni a Ranch Dog-t, vissza kell lépnem, és a semmiből kell építenem, a Drone-motort pusztán referenciamodellként használva, nem pedig felülírni. A tanulság: a laposító hatás Miért sikerült a Drone motor, míg a Quadruped refaktor kudarcot vallott? Ez egy konkrét viselkedésre utal, amit a Gemini 3.0-ban (és más magas kontextusú modellekben) megfigyeltem. Amikor a földről felfelé építesz, te és az AI lépésről lépésre építed az építészetet. Azonban, ha kér egy LLM, hogy egy meglévő alkalmazás, nem látja a kód történetét, nem látja a csata sebeket. pivot Az eredeti Drone kódot különálló, lineáris lépésekre bontották. Voltak konkrét hibaelhárítási kapuk és várakozási állapotok, amelyek a korábbi kudarcokból származtak. Gemini 3.0, annak érdekében, hogy hatékony, Különböző logikai lépéseket tömörített egyedülálló, monolitikus folyamatokká.A felszínen a kód tisztábbnak és pythonikusabbnak tűnt.De valójában eltávolította a strukturális terhelést hordozó falakat, amelyek stabilan tartották az alkalmazást. flattened the architecture Feltételezte, hogy a kód stílusirányító, nem pedig szerkezeti szükségszerűség. A képességek paradoxonja: Gemini 2.5 vs. 3.0 Ez a projekt kiemelte az intuitív valóságot: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. A korábbi verziókban a kimenetek úgy voltak felépítve, hogy megmutassák, hogyan lehet építeni. Ezután egy tervet kell készítenie a programon belüli csomópontok felépítésére. Néha az egész fájlt leírhatja. A Gemini 2.5 arra kényszerített, hogy az Építész legyek. programról programra kellett mennem, pontosan leírva, mit akartam. A Gemini 3.0 rendelkezik a sebességgel és az érveléssel, hogy mindent egyszerre tegyen. A Gemini 3.0 olyan kódot hoz létre, amely azonnal működőképesnek tűnik, de belül szerkezetileg elrontott. Végső ítélet Ha Generative Manufacturing Engine-t vagy bármilyen komplex rendszert szeretne építeni az LLM-ekkel, itt vannak az OpenForge kísérletből származó végső visszajelzések: Greenfield könnyű, Brownfield kemény: LLM-k kiemelkednek az építésben a semmiből. Ha meg szeretné változtatni egy alkalmazás célját, ne kérje meg az AI-t, hogy írja újra ezt az X-re. Az építészet még mindig király: A kódbázist nem lehet olyan folyékony dokumentumként tekinteni, amelyet egy LLM morfalizálhat. Az OpenForge bebizonyította, hogy áthidalhatjuk a szakadékot a homályos felhasználói szándék és a fizikai mérnöki szándék között. Ez azt jelenti, hogy a Gemini 3.0 egy hatalmas ugrás a 2.5-ből.Az, amit itt vizsgálok, az, hogy hogyan lehet a legjobban kihasználni egy teljesen új eszközt.