I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. En les últimes setmanes, he estat documentant la meva construcció de viatge , un sistema d'IA capaç de traduir la intenció vaga de l'usuari en maquinari provat de vol. OpenForge L'objectiu era provar les capacitats de raonament de Google. Volia respondre a una pregunta específica: pot un LLM anar més enllà d'escriure scripts de Python i en realitat enginyer sistemes físics on la tolerància, la tensió i la compatibilitat tinguin importància? Gemini 3.0 La resposta, resulta, és un complicat “sí, però...” Aquí teniu el post-mortem sobre el que va funcionar, el que va fallar i la diferència crítica entre El codi i els sistemes. Generating Refactoring La victòria: Drone_4 Works La branca drone_4 del repositori és un èxit. Si cloneu el repo i demaneu un "Drone de Cinema de llarg abast", el sistema funciona de la llavor a la simulació. Comprèn la intenció: sap que "Cinema" significa vol suau i "Long Range" significa GPS i protocols Crossfire. Obeeix a la física: El motor de compatibilitat rebutja amb èxit les combinacions de motor i bateria que es sobreescalfen o exploten. Simula la realitat: els arxius USD generats per a NVIDIA Isaac Sim realment volen. Admeto, vaig haver de ser pragmàtic. En make_fleet.py, vaig "enganyar" una mica. em vaig basar menys en el LLM per inventar dinàmicament la lògica de la flota i més en l'orquestració de Python amb codi dur. em vaig haver de recordar que això era una prova del raonament de Gemini 3.0, no un concurs per veure si podia evitar escriure una sola línia de codi. Com a prova del concepte de —on el LLM gestiona la traducció creativa, i Python gestiona les lleis de la física—OpenForge és un triomf. Neuro-Symbolic AI El fracàs: el pivot quadrupè La segona meitat del repte va ser prendre aquest motor de treball i girar-lo.Volia convertir el dissenyador de drons en un dissenyador de gossos robòtics (el gos de ranxo). Vaig alimentar a Gemini 3.0 tota la base de codi (88k tokens) i la vaig demanar al refactor. I am officially shelving the Quadruped branch. Ha esdevingut evident que la manera en què vaig començar aquest pivot em va portar cap avall un forat de rebuig circular de solució de problemes. em vaig trobar en un bucle on fixar un càlcul de torque trencaria el subministrament d'inventari, i fixar el subministrament trencaria la simulació. Si vull construir el Ranch Dog, he de fer un pas enrere i construir-lo des de zero, utilitzant el motor de drons simplement com un model de referència, no una base per sobreescriure. La lliçó: l'efecte aplanador Per què el motor del Drone va tenir èxit mentre que el refactor Quadruped va fallar? Es redueix a un comportament específic que he observat en Gemini 3.0 (i altres models d'alt context). Quan construeixes des del principi, tu i l’IA construïm l’arquitectura pas a pas. Col·loqueu la base, després el marc, després el sostre. No obstant això, quan es demana un LLM a una aplicació existent, no veu l'historial del codi. pivot El codi original del Drone es va trencar en diferents passos lineals. Hi havia portes específiques de gestió d'errors i estats d'espera derivats de fallades anteriors. Gemini 3.0, en un intent de ser eficient, Va agrupar diferents passos lògics en processos singulars, monolítics. A la superfície, el codi semblava més net i més pitònic. Però en realitat, havia eliminat les parets estructurals de càrrega que mantenia l'aplicació estable. flattened the architecture Va assumir que el codi era una guia d'estil, no una necessitat estructural. La paradoxa de la capacitat: Gemini 2.5 vs. 3.0 Aquest projecte va posar en relleu una realitat contraintuïtiva: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. En versions anteriors, les sortides estaven estructurades per mostrar-vos com es podia construir. Llavors hauríeu de construir un pla per construir els intestins dins del programa. De vegades, podia escriure tot el fitxer. De vegades, havíeu d'anar funció per funció. Gemini 2.5 em va obligar a ser l'Arquitecte. vaig haver d'anar programa per programa, cartografiant exactament el que volia. Gemini 3.0 té la velocitat i el raonament per fer-ho tot alhora. Gemini 3.0 crea codi que sembla funcionable immediatament, però està estructuralment corromput a l'interior. Sentència final Si estàs buscant construir un motor de fabricació generativa, o qualsevol sistema complex amb LLMs, aquí hi ha les meves conclusions finals de l'experiment OpenForge: Greenfield és fàcil, Brownfield és difícil: LLMs excel·lència en la construcció des de zero. Don't Refactor with Prompts: Si voleu canviar l'objectiu d'una aplicació, no demaneu a la IA que ho reescrigui per a X. En lloc d'això, mapeu el flux lògic de l'antiga aplicació i demaneu a la IA que construeixi una nova aplicació utilitzant aquest mapa lògic. L'arquitectura encara és rei: No es pot veure una base de codi com un document fluid que pot ser morficat per un LLM. OpenForge ha demostrat que podem trencar la bretxa entre la intenció vaga de l'usuari i l'enginyeria física. Dit això, Gemini 3.0 és un salt massiu de 2.5. part del que estic explorant aquí és com treure el millor d'una eina nova.