I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. গত কয়েক সপ্তাহে, আমি আমার ভ্রমণ নির্মাণ ডকুমেন্টিং করেছি। , একটি এআই সিস্টেম যা অনিশ্চিত ব্যবহারকারীর উদ্দেশ্যকে ফ্লাইট প্রমাণিত হার্ডওয়্যারে অনুবাদ করতে সক্ষম। OpenForge লক্ষ্য ছিল গুগলের ধারণক্ষমতা পরীক্ষা করা। আমি একটি নির্দিষ্ট প্রশ্নের উত্তর দিতে চেয়েছিলাম: একটি এলএলএম পাইথন স্ক্রিপ্টগুলি লিখতে এবং প্রকৃতপক্ষে শারীরিক সিস্টেমগুলি প্রকৌশল করতে পারে যেখানে সহনশীলতা, টেনশন এবং সামঞ্জস্যপূর্ণতা গুরুত্বপূর্ণ? Gemini 3.0 উত্তরটি, এটি বেরিয়ে আসে, একটি জটিল "হ্যাঁ, কিন্তু ..." আমি আজ এই প্রকল্পটি প্যাকেজ করছি. এখানে কী কাজ করেছিল, কী ব্যর্থ হয়েছিল, এবং এর মধ্যে গুরুত্বপূর্ণ পার্থক্য কোড এবং সিস্টেম Generating Refactoring ড্রোন_4 কাজ প্রথমে, ভাল খবর. ড্রোন_4 ফিল্ম রিপোর্টার একটি সাফল্য। আপনি যদি রিপো ক্লোন করেন এবং একটি "লং র্যাঞ্জ সিনেমা ড্রোন" অনুরোধ করেন, তাহলে সিস্টেমটি বীজ থেকে সিমুলেশন পর্যন্ত কাজ করে। এটি উদ্দেশ্য বুঝে: এটি জানে যে "কিনেমা" নরম ফ্লাইট মানে এবং "দীর্ঘ দূরত্ব" জিপিএস এবং ক্রসফায়ার প্রোটোকল মানে। এটি পদার্থবিজ্ঞান অনুসরণ করে: সামঞ্জস্যপূর্ণ ইঞ্জিন সফলভাবে ইঞ্জিন / ব্যাটারি সংমিশ্রণ প্রত্যাহার করে যা অতিরিক্ত তাপ বা বিস্ফোরণ করবে। এটি বাস্তবতা সিমুলেশন করে: NVIDIA Isaac Sim জন্য তৈরি USD ফাইলগুলি আসলে উড়ছে। আমি স্বীকার করব, আমি বাস্তববাদী হওয়া উচিত ছিল. make_fleet.py এ, আমি "ভুয়া" একটু. আমি অলিম্পিক লোগিক শক্তিশালীভাবে আবিষ্কার করতে এবং কঠোর-কোড পাইথন অর্কস্ট্রেশন উপর কম নির্ভর করে. আমি মনে রাখতে হবে যে এটি জিমনি 3.0 এর পরিকল্পনা একটি পরীক্ষা ছিল, একটি প্রতিযোগিতা না দেখতে যদি আমি একটি একক লাইন কোড লিখতে এড়াতে পারি. একটি ধারণার প্রমাণ হিসাবে - যেখানে LLM সৃজনশীল অনুবাদ পরিচালনা করে এবং পাইথন শারীরিক আইন পরিচালনা করে - OpenForge একটি জয়। Neuro-Symbolic AI ব্যর্থতা: Quadruped Pivot চ্যালেঞ্জের দ্বিতীয় অর্ধেকটি ছিল এই কাজের ইঞ্জিনটি গ্রহণ করা এবং এটি ঘূর্ণন করা. আমি ড্রোন ডিজাইনারকে একটি রোবট কুকুর ডিজাইনার (রানচ কুকুর) রূপান্তর করতে চাই। আমি জিমনি 3.0 পুরো কোড বেস (88k টোকেন) খাওয়ান এবং এটি রিফ্যাক্টরকে জিজ্ঞাসা করেছি. এটি আত্মবিশ্বাসীভাবে নতুন পদার্থবিজ্ঞান, নতুন সার্চিং এজেন্ট এবং নতুন kinematics solvers ছড়িয়ে দেয়। I am officially shelving the Quadruped branch. এটি স্পষ্ট হয়ে উঠেছে যে এই পিভটটি শুরু করার উপায়টি আমাকে সমস্যা সমাধানের একটি সার্কুলার ড্রাইনিং খাঁটি নীচে নিয়ে গিয়েছিল. আমি নিজেকে এমন একটি সার্কুলার মধ্যে পেয়েছি যেখানে একটি ঘূর্ণিঝড় গণনা সংশোধন সরবরাহকে ভাঙবে এবং সরবরাহ সংশোধন সিমুলেশনটি ভাঙবে। যদি আমি রানচ কুকুর নির্মাণ করতে চাই, তাহলে আমি পিছনে হাঁটতে হবে এবং এটি শূন্য থেকে তৈরি করতে হবে, ড্রোন ইঞ্জিনটি কেবলমাত্র একটি রেফারেন্স মডেল হিসাবে ব্যবহার করে, একটি ভিত্তি হিসাবে লিখার জন্য নয়। ট্যাগ: ফ্ল্যাটেডিং প্রভাব কেন ড্রোন ইঞ্জিন সফল হয়, যখন Quadruped রিফ্যাক্টর ব্যর্থ হয়? এটি একটি নির্দিষ্ট আচরণের উপর নির্ভর করে যা আমি জিমনি 3.0 (এবং অন্যান্য উচ্চ-সংক্রান্ত মডেলগুলিতে) পর্যবেক্ষণ করেছি। যখন আপনি নিখুঁত থেকে তৈরি করেন, তখন আপনি এবং AI ধাপে ধাপে আর্কিটেকচারটি তৈরি করেন. আপনি ভিত্তিটি স্থাপন করেন, তারপর ফ্রেমিং, তারপরে ছাদ। যখন আপনি একটি LLM জিজ্ঞাসা একটি বিদ্যমান অ্যাপ্লিকেশন, এটি কোডের ইতিহাস দেখতে পায় না. এটি যুদ্ধের চিহ্ন দেখতে পায় না. pivot মূল ড্রোন কোডটি আলাদা, লাইনীয় ধাপে ভেঙে দেওয়া হয়েছিল। পূর্ববর্তী ব্যর্থতার কারণে নির্দিষ্ট ত্রুটি পরিচালনা গেট এবং অপেক্ষা অবস্থা ছিল। জিমনি 3.0, কার্যকর হওয়ার চেষ্টা, এটি আলাদা যুক্তিগত পদক্ষেপগুলি একক, একক প্রক্রিয়াগুলিতে একত্রিত করে। পৃষ্ঠে, কোডটি আরও পরিষ্কার এবং আরো পাইথনিক দেখায়. কিন্তু বাস্তবে, এটি গঠনগত লোড-ভিত্তিক দেয়ালগুলি মুছে ফেলেছিল যা অ্যাপ্লিকেশনটি স্থিতিশীল রাখে। flattened the architecture এটি নমুনার উপর ছড়িয়ে পড়েছিল. এটি অনুমান করে যে কোডটি একটি স্টাইল গাইড ছিল, একটি গঠনগত প্রয়োজনীয়তা নয়। ক্ষমতার বিরোধিতা: জিমনি 2.5 vs. 3.0 এই প্রকল্পটি একটি counterintuitive বাস্তবতা তুলে ধরেছে: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. পূর্ববর্তী সংস্করণগুলিতে, আউটপুটগুলি আপনাকে নির্মাণ সম্পর্কে কীভাবে যেতে পারে তা দেখানোর জন্য গঠন করা হয়েছিল। তারপর আপনাকে প্রোগ্রামের ভেতরে আউটপুট নির্মাণ করার জন্য একটি পরিকল্পনা তৈরি করতে হবে। জিমনি ২.৫ আমাকে আর্কিটেক্ট হতে বাধ্য করেছিলেন. আমি প্রোগ্রামের পর প্রোগ্রামে যেতে বাধ্য হয়েছিলাম, ঠিক কি আমি চাইলাম তা মানচিত্র করেছিলাম. আমাকে এআই এর হাত ধরে রাখতে হয়েছিল। জিমনি 3.0 একই সময়ে সবকিছু করার জন্য গতি এবং পরিকল্পনা আছে. এটি একটি এক-শট পিভ্টের একটি বিশ্বাসযোগ্য ইলেকশন তৈরি করে। জিমনি 3.0 এমন কোড তৈরি করে যা অবিলম্বে কার্যকরী মনে হয় কিন্তু ভিতরে গঠনগতভাবে নষ্ট হয়। চূড়ান্ত রায় আপনি যদি একটি জেনারেটিভ উত্পাদন ইঞ্জিন তৈরি করতে চান, অথবা LLMs সঙ্গে কোনও জটিল সিস্টেম তৈরি করতে চান, এখানে OpenForge পরীক্ষা থেকে আমার শেষ takeaways আছে: গ্রিনফিল্ড সহজ, ব্রাউনফিল্ড কঠিন: এলএলএমগুলি শূন্য থেকে বিল্ডিংয়ের ক্ষেত্রে অসাধারণ। Prompts দিয়ে রিফ্যাক্টর করবেন না: যদি আপনি একটি অ্যাপ্লিকেশনের উদ্দেশ্য পরিবর্তন করতে চান তবে এই আইটিকে X এর জন্য এটি পুনরায় লিখতে বলবেন না. পরিবর্তে, পুরোনো অ্যাপ্লিকেশনের লজিক ফ্লাইটটি মানচিত্র করুন এবং এই লজিক মানচিত্রটি ব্যবহার করে একটি নতুন অ্যাপ্লিকেশন তৈরি করার জন্য AIকে বলুন। আর্কিটেকচার এখনও রাজা: আপনি একটি কোড বেসকে একটি তরল ডকুমেন্ট হিসাবে দেখতে পারবেন না যা একটি এলএলএম দ্বারা রূপান্তরিত করা যেতে পারে। OpenForge প্রমাণ করেছে যে আমরা অনিশ্চিত ব্যবহারকারীর উদ্দেশ্য এবং শারীরিক প্রকৌশল মধ্যে পতন করতে পারি. আমরা এখনও আর্কিটেকচার চেয়ার থেকে মানবকে বের করতে পারি না। যেটি বলা হয়েছে, জিমনি 3.0 2.5 থেকে একটি বিশাল হাঁটু।