I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. За последние несколько недель я документировал свое путешествие , система ИИ, способная переводить неясные намерения пользователей в летательное оборудование. OpenForge Целью было проверить рациональные возможности Google. Я хотел ответить на конкретный вопрос: может ли LLM выйти за рамки написания Python-скриптов и фактически разработать физические системы, где важны толерантность, напряжение и совместимость? Gemini 3.0 Ответ, оказывается, является сложным «да, но...» Вот пост-мортем о том, что работало, что потерпело неудачу, и критическая разница между Код и Системы Generating Refactoring Описание игры Drone_4 Works Во-первых, хорошая новость.Отрасль drone_4 репозитория является успехом. Если вы клонируете репо и запрашиваете «Дроновый кинотеатр большой дальности», система работает от семени до симуляции. Он понимает намерения: он знает, что «Кино» означает плавный полет, а «Long Range» означает GPS и протоколы Crossfire. Он подчиняется физике: двигатель совместимости успешно отвергает комбинации двигателя и аккумулятора, которые могут перегреться или взорваться. Он симулирует реальность: USD-файлы, созданные для NVIDIA Isaac Sim, на самом деле летают. Я признаюсь, мне пришлось быть прагматичным. В make_fleet.py я немного «обманул».Я меньше полагался на LLM, чтобы динамически изобретать логику флота, а больше на оркестрацию с жестким кодом Python.Я должен был напомнить себе, что это был тест рассуждений Gemini 3.0, а не конкурс, чтобы увидеть, могу ли я избежать написания одной строки кода. В качестве доказательства концепции для — где LLM занимается творческим переводом, а Python занимается законами физики — OpenForge является победой. Neuro-Symbolic AI Оригинальное название: The Failure: The Quadruped Pivot Вторая половина задачи состояла в том, чтобы взять этот рабочий двигатель и перевернуть его.Я хотел превратить Дизайнера дронов в Дизайнера роботов-собак (Ранч-собака). Я кормил Gemini 3.0 всю кодовую базу (88 000 токенов) и попросил ее в refactor. I am officially shelving the Quadruped branch. Стало очевидным, что то, как я начал этот поворот, привело меня вниз по круговой дренажной кроличьей дыре устранения неполадок.Я оказался в цепи, где фиксирование вычисления крутящего момента нарушило бы поступление запасов, а фиксирование поступления нарушило бы симуляцию. Если я хочу построить Ranch Dog, я должен сделать шаг назад и построить его с нуля, используя двигатель Drone только в качестве справочной модели, а не в качестве основы для переписки. Урок: Уплотнительный эффект Почему двигатель Drone увенчался успехом, а Quadruped refactor потерпел неудачу? Это сводится к конкретному поведению, которое я наблюдал в Gemini 3.0 (и других высококонтекстных моделях). Когда вы строите с нуля, вы и ИИ строите архитектуру шаг за шагом. Однако, когда вы запрашиваете LLM для существующее приложение, оно не видит историю кода, оно не видит шрамы битвы. pivot Оригинальный код Drone был разбит на отдельные, линейные шаги. Существовали специфические ворота обработки ошибок и состояния ожидания, вытекающие из предыдущих сбоев. Gemini 3.0, в попытке быть эффективным, На поверхности код выглядел более чистым и более питоническим, но в действительности он удалил структурные стенки, несущие нагрузку, которые держали приложение стабильным. flattened the architecture Он предположил, что код является руководством по стилю, а не структурной необходимостью. Парадокс способности: Близнецы 2.5 vs. 3.0 Этот проект подчеркнул контринтуитивную реальность: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. В предыдущих версиях выходы были структурированы, чтобы показать вам, как вы можете идти о строительстве. Затем вам придется построить план, чтобы построить органы внутри программы.Иногда, он мог написать весь файл.Иногда, вы должны были идти функция по функциям. Близнецы 2.5 заставили меня стать архитектором.Я должен был идти по программе, описывая именно то, что я хотел. Gemini 3.0 обладает скоростью и рассуждениями, чтобы сделать все сразу. Gemini 3.0 создает код, который выглядит рабочим сразу, но структурно гниет внутри. Окончательный приговор Если вы хотите построить генеративный производственный двигатель или любую сложную систему с помощью LLM, вот мои заключительные выводы из эксперимента OpenForge: Гринфилд легко, Браунфилд трудно: LLM отличается в строительстве с нуля.Они ужасны в обновлении сложных, существующих архитектур без массивной человеческой руки. Если вы хотите изменить цель приложения, не просите ИИ переписать это для X. Вместо этого набросьте логический поток старого приложения и попросите ИИ построить новое приложение с помощью этой логической карты. Архитектура все еще король: Вы не можете рассматривать кодовую базу как жидкий документ, который может быть изменен LLM. OpenForge доказал, что мы можем преодолеть разрыв между неясным намерением пользователя и физической инженерии. Тем не менее, Gemini 3.0 - это огромный скачок от 2.5.Часть того, что я исследую здесь, это как извлечь максимум из совершенно нового инструмента.