I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. În ultimele săptămâni, am documentat construcția mea de călătorie , un sistem AI capabil să traducă intenția vagi a utilizatorului în hardware dovedit de zbor. OpenForge Scopul a fost de a testa capacitățile de raționament ale Google. Am vrut să răspund la o întrebare specifică: poate un LLM să meargă dincolo de scrierea scripturilor Python și de fapt să realizeze sisteme fizice în care toleranța, tensiunea și compatibilitatea contează? Gemini 3.0 Răspunsul, se pare, este un „da, dar...” complicat. Iată post-mortem-ul despre ce a funcționat, ce a eșuat și diferența critică dintre Codul şi sistemelor . Generating Refactoring Cuvânt cheie: drone_4 works În primul rând, vestea bună. ramura drone_4 a depozitului este un succes. Dacă clonați repo-ul și cereți un "Long Range Cinema Drone", sistemul funcționează de la sămânță la simulare. Înțelege intenția: Știe că "Cinema" înseamnă zbor neted și "Long Range" înseamnă protocoale GPS și Crossfire. Se supune fizicii: Motorul de compatibilitate respinge cu succes combinațiile motor/baterie care ar supraîncălzi sau ar exploda. Simulează realitatea: fișierele USD generate pentru NVIDIA Isaac Sim zboară de fapt. Recunosc, a trebuit să fiu pragmatic. în make_fleet.py, am "înșelat" un pic. M-am bazat mai puțin pe LLM pentru a inventa dinamic logica flotei și mai mult pe orchestrarea Python cu coduri dure. Am trebuit să îmi amintesc că acesta a fost un test al raționamentului Gemini 3.0, nu un concurs pentru a vedea dacă aș putea evita scrierea unei singure linii de cod. Ca dovadă a conceptului de —în cazul în care LLM se ocupă de traducerea creativă, iar Python se ocupă de legile fizicii — OpenForge este o victorie. Neuro-Symbolic AI Eșecul: Quadruped Pivot A doua jumătate a provocării a fost să iau acest motor de lucru și să-l pivot. am vrut să transform Designerul Drone într-un Designer Robot Câine (Câinele Ranch). Am hrănit Gemini 3.0 întreaga bază de coduri (88k token-uri) și am cerut-o refactorului. I am officially shelving the Quadruped branch. A devenit evident că modul în care am început acest pivot m-a condus într-o gaură circulară de evacuare a problemelor. m-am găsit într-o buclă în care fixarea unui calcul de cuplu ar rupe sursa de inventar, iar fixarea sursei ar rupe simularea. Dacă vreau să construiesc Ranch Dog, trebuie să fac un pas înapoi și să-l construiesc de la zero, folosind motorul Drone doar ca model de referință, nu o bază de suprascriere. Lecția: Efectul de flattening De ce a reușit motorul Drone în timp ce refactorul Quadruped a eșuat? Se reduce la un comportament specific pe care l-am observat în Gemini 3.0 (și alte modele de înaltă context). Când construiți de la zero, tu și AI construiți arhitectura pas cu pas. Puneți fundația, apoi cadrul, apoi acoperișul. Cu toate acestea, atunci când solicitați un LLM pentru O aplicație existentă nu vede istoricul codului, nu vede cicatricile de luptă. pivot Codul original Drone a fost rupt în etape distincte, liniare. Au existat porți specifice de gestionare a erorilor și stări de așteptare derivate din eșecurile anterioare. Gemini 3.0, în încercarea de a fi eficient, A strâns pași logici distincți în procese singulare, monolitice. Pe suprafață, codul părea mai curat și mai pitonic. Dar, în realitate, a îndepărtat pereții structurali de încărcare care păstrează aplicația stabilă. flattened the architecture Se presupunea că codul era un ghid de stil, nu o necesitate structurală. Paradoxul capacității: Gemini 2.5 vs. 3.0 Acest proiect a evidențiat o realitate contraintuitivă: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. În versiunile anterioare, ieșirile au fost structurate pentru a vă arăta cum puteți merge cu construcția. Apoi va trebui să construiți un plan pentru a construi țesuturile din program. Uneori, ar putea scrie întregul fișier. Gemini 2.5 m-a forțat să fiu arhitectul. a trebuit să merg program după program, cartografiind exact ceea ce doream. a trebuit să țin mâna AI. Gemini 3.0 are viteza și raționamentul de a face totul dintr-o dată. Gemini 3.0 creează cod care pare funcțional imediat, dar este strict putrezit în interior. Verdictul final Dacă sunteți în căutarea de a construi un Generative Manufacturing Engine, sau orice sistem complex cu LLM-uri, aici sunt ultimele mele ipoteze de la experimentul OpenForge: Greenfield este ușor, Brownfield este greu: LLM-urile excelează în construirea de la zero. Dacă doriți să schimbați scopul unei aplicații, nu cereți AI să rescrie acest lucru pentru X. În schimb, cartografiați fluxul logic al aplicației vechi și cereți AI să construiască o nouă aplicație folosind acea hartă logică. Arhitectura este încă rege: Nu puteți vedea o bază de cod ca un document fluid care poate fi modificat de un LLM. OpenForge a dovedit că putem depăși decalajul dintre intenția vagi a utilizatorului și ingineria fizică. Acestea fiind spuse, Gemini 3.0 este un salt masiv de la 2.5.