I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. Последњих неколико недеља, документовао сам своју путничку зграду , АИ систем способан да преведе нејасну намеру корисника у опрему која је доказана летом. OpenForge Циљ је био да се тестирају могућности размишљања Google-а Желео сам да одговорим на специфично питање: Може ли ЛЛМ ићи изван писања Питон скрипта и заправо инжењерски физички системи где су толеранција, напон и компатибилност важни? Gemini 3.0 Одговор, испоставља се, је компликовано "Да, али..." Ево пост-мортма о томе шта је функционисало, шта је пропало и критична разлика између Код и Систем је . Generating Refactoring Sledeći članak Drone_4 Works Drone_4 grana repozitorija je uspeh. Ако клонирате репо и затражите "Лонг Ранге Цинема Дроне", систем ради од семена до симулације. Razume nameru: zna da „Cinema“ znači glatki let, a „Long Range“ znači GPS i Crossfire protokole. Поштује физику: Мотор компатибилности успешно одбацује комбинације мотора / батерије које би се прегрејале или експлодирале. Симулира стварност: УСД датотеке генерисане за НВИДИА Исац Сим заправо лете. Признајем, морао сам да будем прагматичан. У маке_флеет.пи, мало сам "преварио". Мање сам се ослањао на ЛЛМ да динамички измишљам логику флоте и више на хард-цодед Питхон оркестрацију. Морао сам да се подсетим да је ово тест размишљања Гемини 3.0, а не такмичење да видим да ли бих могао избјећи писање једне линије кода. Као доказ концепта за Gde se LLM bavi kreativnim prevodom, a Python se bavi zakonima fizike, OpenForge je pobeda. Neuro-Symbolic AI Неуспех: Квадратни пивот Druga polovina izazova bila je da uzmem ovaj radni motor i okrenem ga.Hteo sam da pretvorim Drone Designer u Robot Dog Designer (Ranch Dog). Ја сам нахранио Гемини 3.0 целу базу кода (88к токена) и замолио га на рефактор. I am officially shelving the Quadruped branch. Постало је очигледно да ме је начин на који сам започео овај корак довео до кружне рупе за решавање проблема.Нашао сам се у луку у којој би фиксирање обрачуна обртног момента прекинуло извођење инвентара, а фиксирање извоза би прекинуло симулацију. Ако желим да изградим Ранцх Дог, морам се вратити и изградити га од нуле, користећи Дроне мотор само као референтни модел, а не базу за преписивање. Лекција: Флаттенинг ефекат Зашто је Дрон мотор успео док је Квадрап Рефацтор пропао? То се своди на специфично понашање које сам посматрао у Близанцима 3.0 (и другим моделима високог контекста). Kada gradite odozdo, vi i AI gradite arhitekturu korak po korak. Међутим, када тражите ЛЛМ за Постојећа апликација не види историју кода, не види битке. pivot Оригинални Дрон код је сломљен у различите, линеарне кораке. Постојале су специфичне капије за управљање грешкама и стања чекања која су настала из претходних неуспјеха. Близанци 3.0, у покушају да буде ефикасан, На површини, код је изгледао чистији и више питонски.Али у стварности, уклонио је структурне зидове који носе оптерећење који су држали апликацију стабилном. flattened the architecture Претпоставило се да је код стилски водич, а не структурна неопходност. Парадокс способности: Близанци 2.5 против 3.0 Овај пројекат је истакао контраинтуитивну стварност: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. У претходним верзијама, излази су структурирани да вам покажу како бисте могли да идете о изградњи. Затим бисте морали да изградите план за изградњу зглобова унутар програма. Понекад, то би могло да напише целу датотеку. Понекад, морали сте да идете функција по функцији. Близанци 2.5 ме је присилио да будем Архитекта. Морао сам да идем програм по програм, мапирајући управо оно што сам желео. Близанци 3.0 има брзину и размишљање да све уради одједном. Близанци 3.0 ствара код који изгледа радно одмах, али је структурно покварен унутра. Завршна пресуда Ако тражите да изградите генеративни производни мотор, или било који сложен систем са ЛЛМ-има, ево мојих коначних узимања из експеримента ОпенФорге: Гринфиелд је лако, Браунфиелд је тешко: ЛЛМ-ови се одликују изградњом од нуле. Ако желите да промените сврху апликације, немојте тражити од АИ да то поново напише за Кс. Уместо тога, нацртајте логички ток старе апликације и замолите АИ да изгради нову апликацију користећи ту логичку мапу. Архитектура је још увек краљ: Не можете видети базу кода као течни документ који може бити морфиран од стране ЛЛМ. ОпенФорге је доказао да можемо премостити јаз између нејасне намјере корисника и физичког инжењерства. То је рекао, Близанци 3.0 је огроман скок од 2.5. део онога што истражујем овде је како добити најбоље од потпуно новог алата.