I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. Nas últimas semanas, estou documentando minha construção de viagem Um sistema de IA capaz de traduzir a intenção vaga do usuário em hardware comprovado. OpenForge O objetivo era testar as capacidades de raciocínio do Google. Eu queria responder a uma pergunta específica: um LLM pode ir além da escrita de scripts Python e realmente engenhar sistemas físicos onde a tolerância, tensão e compatibilidade importam? Gemini 3.0 A resposta, parece, é um “sim, mas...” complicado. Aqui está o post-mortem sobre o que funcionou, o que falhou e a diferença crítica entre Código e dos sistemas. Generating Refactoring A vitória: Drone_4 Works Primeiro, a boa notícia.O ramo drone_4 do repositório é um sucesso. Se você clonar o repo e pedir um "Long Range Cinema Drone", o sistema funciona de semente para simulação. Ele entende a intenção: Ele sabe que "Cinema" significa voo suave e "Long Range" significa GPS e protocolos Crossfire. Obedece à física: O Compatibility Engine rejeita com sucesso combinações de motor / bateria que poderiam sobreaquecer ou explodir. Simula a realidade: os arquivos USD gerados para o NVIDIA Isaac Sim realmente voam. Eu confesso, eu tive que ser pragmático. Em make_fleet.py, eu "enganoi" um pouco. confiei menos no LLM para inventar dinamicamente a lógica da frota e mais na orquestração de Python com código rígido. tive que me lembrar que isso era um teste do raciocínio de Gemini 3.0, não um concurso para ver se eu poderia evitar escrever uma única linha de código. Como prova do conceito de — Onde o LLM lida com a tradução criativa, e Python lida com as leis da física — OpenForge é uma vitória. Neuro-Symbolic AI O Fracasso: O Quadruped Pivot Eu queria transformar o Drone Designer em um Robot Dog Designer (o Ranch Dog). Eu alimentei o Gemini 3.0 toda a base de códigos (88k tokens) e pedi para refactor. I am officially shelving the Quadruped branch. Tornou-se óbvio que a maneira como comecei este pivote me levou a um buraco de solução de problemas de drenagem circular.Encontrei-me em um loop onde fixar um cálculo de torque quebraria o fornecimento de inventário e fixar o fornecimento quebraria a simulação. Se eu quiser construir o Ranch Dog, eu tenho que dar um passo atrás e construí-lo do zero, usando o motor Drone apenas como um modelo de referência, não uma base para escrever. A Lição: O Efeito Flattening Por que o motor Drone teve sucesso enquanto o refactor Quadruped falhou? Isso se resume a um comportamento específico que observei no Gemini 3.0 (e outros modelos de alto contexto). Quando você constrói do zero, você e a IA construem a arquitetura passo a passo. Você coloca a fundação, depois o enquadramento, depois o telhado. No entanto, quando você pede um LLM para um aplicativo existente, não vê o histórico do código. Não vê as cicatrizes da batalha. pivot O código original do Drone foi dividido em etapas distintas e lineares. Havia portas específicas de gerenciamento de erros e estados de espera derivados de falhas anteriores. Gemini 3.0, em uma tentativa de ser eficiente, Ele aglomerou passos lógicos distintos em processos monolíticos singulares. Na superfície, o código parecia mais limpo e mais pitônico. Mas na realidade, ele tinha removido as paredes estruturais de carga que mantiveram a aplicação estável. flattened the architecture Ele assumiu que o código era um guia de estilo, não uma necessidade estrutural. O paradoxo da capacidade: Gemini 2.5 vs. 3.0 Este projeto destacou uma realidade contra-intuitiva: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. Nas versões anteriores, as saídas foram estruturadas para mostrar como você poderia ir sobre a construção. Você teria então que construir um plano para construir os intestinos dentro do programa. Às vezes, ele poderia escrever todo o arquivo. Às vezes, você teve que ir função por função. Gemini 2.5 me forçou a ser o Arquiteto. tive que ir programa por programa, mapeando exatamente o que eu queria. tive que segurar a mão da IA. Gemini 3.0 tem a velocidade e o raciocínio para fazer tudo de uma vez. O Gemini 3.0 cria código que parece operável imediatamente, mas que está estruturalmente corrompido por dentro. Verdade Final Se você está procurando construir um Generative Manufacturing Engine, ou qualquer sistema complexo com LLMs, aqui estão minhas conclusões finais do experimento OpenForge: Greenfield é Fácil, Brownfield é Difícil: LLMs excelem na construção do zero. Se você quiser mudar o propósito de um aplicativo, não peça à IA para reescrever isso para X. Em vez disso, mapeie o fluxo lógico do aplicativo antigo e peça à IA para construir um novo aplicativo usando esse mapa lógico. Arquitetura ainda é rei: Você não pode ver uma base de código como um documento fluido que pode ser morfificado por um LLM. O OpenForge provou que podemos colmatar a lacuna entre a intenção vaga do usuário e a engenharia física. Dito isto, o Gemini 3.0 é um enorme salto de 2.5. parte do que estou explorando aqui é como tirar o máximo proveito de uma nova ferramenta.