I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. گزشتہ چند ہفتوں میں، میں نے اپنے سفر کی تعمیر کو دستاویز کیا ہے ، ایک AI نظام، طیارے کی تصدیق کی ہارڈ ویئر میں واضح صارف کے ارادے کو ترجمہ کرنے کے قابل ہے. OpenForge اس کا مقصد گوگل کی سوچ کی صلاحیتوں کو ٹیسٹ کرنا تھا. میں نے ایک خاص سوال کا جواب دینا چاہا: کیا ایک ایل ایل ایم پی پیٹن سکرپٹ لکھنے سے زیادہ چل سکتا ہے اور اصل میں جسمانی نظام انجینئرنگ کر سکتا ہے جہاں معیار، بجلی اور مطابقت اہم ہیں؟ Gemini 3.0 جواب، یہ ظاہر ہوتا ہے، ایک پیچیدہ "ہاں، لیکن ..." میں آج اس منصوبے کو پھینک رہا ہوں. یہاں کیا کام کرتا ہے، کیا ناکام ہوا، اور اہم فرق کے بارے میں post-mortem ہے. کوڈ اور نظام کے Generating Refactoring The Win: Drone_4 کام کرتا ہے سب سے پہلے، اچھی خبر. ڈرون_4 اسٹوریج کی فہرست ایک کامیابی ہے. اگر آپ ریپو کو کلون کرتے ہیں اور ایک "لوگ رینج فلم ڈرون" کی درخواست کرتے ہیں، تو نظام نمونہ سے نمونہ تک کام کرتا ہے. یہ ارادہ سمجھتا ہے: یہ جانتا ہے کہ "سیینما" صاف پرواز کا مطلب ہے اور "لیکن رینج" GPS اور Crossfire پروٹوکولز کا مطلب ہے. یہ فیزیک کی اطاعت کرتا ہے: Compatibility Engine کامیابی سے موٹر / بیٹری کے مجموعات کو رد کرتا ہے جو زیادہ گرم یا دھماکہ ہوسکتا ہے. یہ حقیقت کی نمائش کرتا ہے: NVIDIA Isaac Sim کے لئے پیدا USD فائلوں کو اصل میں پرواز. میں اعتراف کروں گا، میں pragmatic ہونا پڑا. in make_fleet.py میں، میں نے تھوڑا سا "جھوٹ" کیا. میں نے کم سے کم LLM پر بھروسہ کیا کہ میں تیزی سے فلیٹ منطق کی تخلیق کرنے کے لئے اور زیادہ ہارڈ کوڈ پائٹون آرکسٹریشن پر. میں نے اپنے آپ کو یاد کرنے کی ضرورت تھی کہ یہ ایک ٹیسٹ Gemini 3.0 کی سوچ کا تھا، نہیں ایک مقابلہ دیکھنے کے لئے اگر میں ایک ہی لائن کوڈ لکھنے سے بچ سکتا ہوں. کے لئے ایک نمونہ کے طور پر - جہاں LLM تخلیقی ترجمہ کا کام کرتا ہے، اور پائٹون جسمانی قوانین کا کام کرتا ہے - OpenForge ایک جیت ہے. Neuro-Symbolic AI The Failure: The Quadruped Pivot کے مترادفات میں نے ڈرون ڈیزائنر کو ایک روبوٹ کتے ڈیزائنر میں تبدیل کرنا چاہتا تھا (ریانچ کتے). میں نے Gemini 3.0 کو پورے کوڈ بیس (88k ٹکینز) کھایا اور اسے refactor سے پوچھا. یہ مطمئن طور پر نئی فیزیک، نئے sourcing ایجنٹ، اور نئے kinematics حل کرنے والوں کو پھینک دیا. I am officially shelving the Quadruped branch. یہ واضح ہو گیا ہے کہ جس طرح میں نے اس pivot کو شروع کیا ہے اس نے مجھے مشکل حل کرنے کے لئے ایک حلقہ ڈرائیونگ کینسر گھوڑے کے نیچے لایا ہے. میں نے اپنے آپ کو ایک چمچ میں پایا جہاں ایک ٹورک کی شرح کو ٹھیک کرنا ذخیرہ کی فراہمی کو توڑ دے گا، اور اس کی فراہمی کو ٹھیک کرنا نمائش کو توڑ دے گا. اگر میں Ranch Dog تعمیر کرنا چاہتا ہوں، تو مجھے ایک قدم واپس کرنا پڑے گا اور اسے نیچے سے تعمیر کرنا پڑے گا، ڈرون انجن کو صرف ایک رینج ماڈل کے طور پر استعمال کرتے ہوئے، نہیں ایک بنیاد پر لکھنے کے لئے. The Lesson: Flattening اثر ڈرون کے انجن کی کامیابی کیوں ہوئی جبکہ چارپائیڈ ریفیکٹر ناکام ہوگیا؟ یہ ایک مخصوص رویے کے لئے آتا ہے جو میں نے جیمنی 3.0 (اور دیگر اعلی معیار کے ماڈلوں) میں دیکھا ہے. جب آپ نیچے سے تعمیر کرتے ہیں تو، آپ اور AI اس آرکیٹیکل کو قدم سے قدم پر تعمیر کرتے ہیں. اگر آپ ایک LLM کی درخواست کرتے ہیں تو ایک موجودہ ایپلی کیشن، یہ کوڈ کی تاریخ نہیں دیکھتا. pivot اصل ڈرون کوڈ مختلف لائن مرحلے میں تقسیم کیا گیا تھا. کچھ خاص غلطیوں کے انتظام کے دروازے اور انتظار کے حالات پہلے کی ناکامیوں سے منسلک تھے. Gemini 3.0، مؤثر ہونے کی کوشش میں، اس نے منفرد، منفرد عملوں میں منفرد منطقی قدموں کو جمع کیا. سطح پر، کوڈ زیادہ صاف اور زیادہ پائٹونک نظر آیا. لیکن حقیقت میں، یہ ساختی لوڈ رکھنے والے دیواروں کو ہٹا دیا تھا جو درخواست کو مستحکم رکھتا تھا. flattened the architecture اس نے تجاویز کو ایک سٹائل گائیڈ کے طور پر فرض کیا، نہ ایک ساختی ضروریات. توانائی کے مترادفات: جیمنی 2.5 vs. 3.0 اس منصوبے نے ایک contraintuitive حقیقت کو ظاہر کیا: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. پچھلے ورژن میں، outputs آپ کو دکھانے کے لئے ڈھانپ کیا گیا تھا کہ کس طرح آپ کو تعمیر کے بارے میں جا سکتا ہے. آپ کو پھر پروگرام کے اندر اندر گیسوں کو تعمیر کرنے کے لئے ایک منصوبہ بنانا پڑے گا. کبھی کبھی، یہ پورے فائل کو لکھ سکتا ہے. Gemini 2.5 نے مجھے آرکیٹسٹ بننے کے لئے مجبور کیا. میں نے پروگرام کے بعد پروگرام چلنے کی ضرورت تھی، جو میں کیا چاہتا تھا اس کا نقشہ نکالنے کے لئے. Gemini 3.0 ایک ہی وقت میں سب کچھ کرنے کے لئے تیزی اور تفہیم ہے. یہ ایک One-Shot Pivot کی ایک قابل اعتماد illusion پیدا کرتا ہے. Gemini 3.0 کوڈ پیدا کرتا ہے جو فوری طور پر کام کرنے کے قابل لگتا ہے لیکن اس کے اندر اندر ساختی طور پر خراب ہے. آخری فیصلہ اگر آپ ایک Generative Manufacturing Engine، یا LLMs کے ساتھ کسی بھی پیچیدہ نظام کی تعمیر کرنے کے لئے چاہتے ہیں، یہاں OpenForge تجربے سے میری آخری لے جانے والی ہے: Greenfield آسان ہے، Brownfield سخت ہے: LLMs نیچے سے تعمیر میں بہترین ہیں. Prompts کے ساتھ Refactor نہ کریں: اگر آپ ایک اپلی کیشن کے مقصد کو تبدیل کرنا چاہتے ہیں تو، AI کو X کے لئے یہ دوبارہ لکھنے کے لئے مت پوچھیں. آرکیٹیکل اب بھی بادشاہ ہے: آپ کو ایک کوڈ بیس کو ایک فلائڈ دستاویز کے طور پر نہیں دیکھ سکتے ہیں جو ایک ایل ای ڈی کی طرف سے مرمت کیا جا سکتا ہے. OpenForge ثابت کیا ہے کہ ہم واضح صارف کے ارادے اور جسمانی انجینئرنگ کے درمیان فاصلے کو پلٹ سکتے ہیں. یہ کہا گیا ہے کہ، جیمنی 3.0 2.5 سے ایک بڑے ہجوم ہے. میں یہاں تلاش کر رہا ہوں کہ کس طرح ایک نئے آلے سے سب سے زیادہ حاصل کرنے کے لئے.