I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. Během posledních několika týdnů jsem dokumentoval svou cestovní budovu , systém AI schopný překládat nejasné záměry uživatelů do letově ověřeného hardwaru. OpenForge Cílem bylo otestovat schopnosti Google Chtěl jsem odpovědět na konkrétní otázku: Může LLM jít nad rámec psaní Pythonových skriptů a skutečně inženýrství fyzických systémů, kde záleží na toleranci, napětí a kompatibilitě? Gemini 3.0 Odpověď, jak se ukázalo, je složitý „Ano, ale...“ Zde je post-mortem o tom, co fungovalo, co selhalo a kritický rozdíl mezi Kód a a systémů. Generating Refactoring Vítězství: Drone_4 Works First, the good news. The drone_4 branch of the repository is a success. Pokud repo klonujete a požádáte o "Long Range Cinema Drone", systém funguje od semene k simulaci. Chápe záměr: Ví, že „Cinema“ znamená hladký let a „Long Range“ znamená GPS a Crossfire protokoly. The Compatibility Engine successfully rejects motor/battery combinations that would overheat or explode. It obeys physics: The USD files generated for NVIDIA Isaac Sim actually fly. It simulates reality: Přiznám se, že jsem musel být pragmatický. V make_fleet.py jsem trochu "podváděl". spoléhal jsem se méně na LLM, abych dynamicky vynalezl logiku flotily a více na hard-codované orchestrování Python. Musel jsem si připomenout, že to bylo testem uvažování Gemini 3.0, nikoliv soutěží, abych zjistil, zda se mohu vyhnout psaní jediného řádku kódu. Jako důkaz konceptu pro —where the LLM handles the creative translation, and Python handles the laws of physics—OpenForge is a win. Neuro-Symbolic AI The Failure: Quadruped Pivot ke stažení Druhou polovinou výzvy bylo vzít tento pracovní motor a otočit ho. Chtěl jsem proměnit Drone Designer v Robot Dog Designer (Ranch Dog). Podal jsem Gemini 3.0 celou kódovou základnu (88k tokenů) a požádal o to refaktor. I am officially shelving the Quadruped branch. Stalo se zřejmým, že způsob, jakým jsem začal tento pivot, mě přivedl dolů do kruhové drenážní králíkové díry řešení potíží. ocitl jsem se v kruhu, kde by fixace výpočtu točivého momentu přerušila zdroje zásob a fixace zdrojů by přerušila simulaci. Pokud chci postavit Ranch Dog, musím o krok zpět a postavit ho od nuly, pomocí dronového motoru pouze jako referenčního modelu, nikoliv základu k přepisu. Lekce: Flattening efekt Proč byl Drone motor úspěšný, zatímco Quadruped refactor selhal? Jedná se o specifické chování, které jsem pozoroval v Gemini 3.0 (a dalších vysoce kontextuálních modelech). Když budujete od začátku, vy a AI budujete architekturu krok za krokem. However, when you ask an LLM to Existující aplikace nevidí historii kódu, nevidí bitevní jizvy. pivot Původní Drone kód byl rozdělen na odlišné, lineární kroky. Existovaly specifické brány pro manipulaci s chybami a čekací stavy odvozené z předchozích selhání. Gemini 3.0, ve snaze být efektivní, Skládala odlišné logické kroky do monolitických procesů.Na povrchu vypadal kód čistší a pythoničtější.Ale ve skutečnosti odstranila strukturální zátěžové zdi, které udržovaly aplikaci stabilní. flattened the architecture Předpokládalo se, že kód je stylovým průvodcem, nikoliv strukturální nutností. The Paradox of Capability: Gemini 2.5 vs. 3.0 Tento projekt zdůraznil kontroverzní realitu: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. V předchozích verzích byly výstupy strukturovány tak, aby vám ukázaly, jak byste mohli postupovat při budování. Poté byste museli vytvořit plán, abyste mohli vytvářet výstupy uvnitř programu. Někdy by to mohlo napsat celý soubor. Gemini 2.5 mě donutila být architektem. musel jsem jít program za programem, mapovat přesně to, co jsem chtěl. musel jsem držet ruku AI. Gemini 3.0 má rychlost a uvažování, aby to všechno najednou. vytváří věrohodnou iluzi One-Shot Pivot. Gemini 3.0 vytváří kód, který okamžitě vypadá funkční, ale je strukturálně zkažený uvnitř. Konečný verdikt Pokud hledáte vytvořit generativní výrobní engine, nebo jakýkoli složitý systém s LLM, zde jsou mé konečné tipy z experimentu OpenForge: Greenfield je snadné, Brownfield je těžké: LLM vynikají při budování od začátku. Pokud chcete změnit účel aplikace, nepožádejte AI, aby to přepsala pro X. Místo toho mapujte logický tok staré aplikace a požádejte AI, aby vytvořila novou aplikaci pomocí této logické mapy. You cannot view a codebase as a fluid document that can be morphed by an LLM. You must respect the scaffolding. Architecture is Still King: OpenForge dokázal, že můžeme překlenout propast mezi nejasným záměrem uživatele a fyzickým inženýrstvím. To znamená, že Gemini 3.0 je obrovský skok z 2.5. část toho, co zde zkoumám, je, jak získat to nejlepší z zcela nového nástroje.