I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. Trong vài tuần qua, tôi đã ghi lại công trình du lịch của mình , một hệ thống AI có khả năng dịch ý định của người dùng mơ hồ thành phần cứng đã được chứng minh bay. OpenForge Mục tiêu là kiểm tra khả năng lý luận của Google. Tôi muốn trả lời một câu hỏi cụ thể: Liệu một LLM có thể vượt ra ngoài việc viết các kịch bản Python và thực sự kỹ thuật các hệ thống vật lý nơi khoan dung, điện áp và khả năng tương thích quan trọng? Gemini 3.0 Câu trả lời, hóa ra, là một “Có, nhưng...” phức tạp. Tôi đang đóng gói dự án này ngày hôm nay. đây là post-mortem về những gì đã làm việc, những gì đã thất bại, và sự khác biệt quan trọng giữa code và hệ thống Generating Refactoring Lời bài hát: Drone_4 Works Đầu tiên, tin tốt. chi nhánh drone_4 của kho là một thành công. Nếu bạn nhân bản repo và yêu cầu một "Range Cinema Drone", hệ thống hoạt động từ hạt giống đến mô phỏng. Nó hiểu ý định: Nó biết rằng "Cinema" có nghĩa là chuyến bay trơn tru và "Long Range" có nghĩa là GPS và giao thức Crossfire. Nó tuân theo vật lý: Động cơ tương thích từ chối thành công các kết hợp động cơ / pin có thể quá nóng hoặc nổ. Nó mô phỏng thực tế: Các tập tin USD được tạo ra cho NVIDIA Isaac Sim thực sự bay. Tôi sẽ thừa nhận, tôi phải thực dụng. trong make_fleet.py, tôi đã "lừa dối" một chút. tôi ít dựa vào LLM để phát minh ra logic hạm đội một cách năng động và nhiều hơn nữa về quy hoạch Python mã cứng. tôi phải nhắc nhở bản thân rằng đây là một bài kiểm tra lý luận của Gemini 3.0, không phải là một cuộc thi để xem liệu tôi có thể tránh viết một dòng mã duy nhất hay không. Như một bằng chứng về khái niệm cho -Nơi mà LLM xử lý bản dịch sáng tạo, và Python xử lý các định luật vật lý - OpenForge là một chiến thắng. Neuro-Symbolic AI Lời bài hát: The Quadruped Pivot Nửa thứ hai của thách thức là lấy động cơ làm việc này và xoay nó.Tôi muốn biến nhà thiết kế máy bay không người lái thành nhà thiết kế chó robot (con chó trang trại). Tôi đã cung cấp cho Gemini 3.0 toàn bộ cơ sở mã (88k token) và yêu cầu nó để refactor. nó tự tin phun ra vật lý mới, các đại lý nguồn mới, và các giải pháp kinematics mới. I am officially shelving the Quadruped branch. Nó đã trở nên rõ ràng rằng cách tôi bắt đầu pivot này đã dẫn tôi xuống một lỗ thỏ thoát nước tròn của khắc phục sự cố. tôi thấy mình trong một vòng tròn nơi sửa đổi một phép tính xoắn ốc sẽ phá vỡ nguồn cung cấp hàng tồn kho, và sửa chữa nguồn cung cấp sẽ phá vỡ mô phỏng. Nếu tôi muốn xây dựng Ranch Dog, tôi phải lùi lại và xây dựng nó từ đầu, sử dụng động cơ Drone chỉ như một mô hình tham chiếu, không phải là một cơ sở để viết lại. Lời bài hát: The Flattening Effect Tại sao động cơ Drone thành công trong khi lò phản ứng Quadruped thất bại? Nó đi xuống đến một hành vi cụ thể mà tôi đã quan sát thấy trong Gemini 3.0 (và các mô hình bối cảnh cao khác). Khi bạn xây dựng từ đầu, bạn và AI xây dựng kiến trúc từng bước, bạn đặt nền tảng, sau đó là khung hình, sau đó là mái nhà. Tuy nhiên, khi bạn yêu cầu một LLM để một ứng dụng hiện có, nó không thấy lịch sử của mã. Nó không thấy vết sẹo chiến đấu. pivot Mã Drone ban đầu được chia thành các bước phân biệt, tuyến tính. Có các cổng xử lý lỗi cụ thể và trạng thái chờ phát sinh từ các thất bại trước đó. Gemini 3.0, trong một nỗ lực để có hiệu quả, Nó tập hợp các bước logic riêng biệt thành các quá trình đơn giản, đơn điệu.Trên bề mặt, mã trông sạch hơn và Pythonic hơn.Nhưng trong thực tế, nó đã loại bỏ các bức tường chịu tải cấu trúc giữ cho ứng dụng ổn định. flattened the architecture Nó lấp lánh sắc thái. nó cho rằng mã là một hướng dẫn phong cách, không phải là một nhu cầu cấu trúc. Sự nghịch lý của khả năng: Gemini 2.5 vs. 3.0 Dự án này làm nổi bật một thực tế mâu thuẫn: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. Trong các phiên bản trước, các đầu ra được cấu trúc để cho bạn thấy làm thế nào bạn có thể đi về xây dựng. Sau đó, bạn sẽ phải xây dựng một kế hoạch để xây dựng các đầu ra bên trong chương trình. Đôi khi, nó có thể viết toàn bộ tệp. Gemini 2.5 buộc tôi phải trở thành kiến trúc sư.Tôi phải đi chương trình theo chương trình, lập bản đồ chính xác những gì tôi muốn.Tôi phải nắm tay AI. Gemini 3.0 có tốc độ và lý luận để làm tất cả mọi thứ cùng một lúc. Gemini 3.0 tạo ra mã có vẻ có thể làm việc ngay lập tức nhưng bị hư cấu bên trong. phán quyết cuối cùng Nếu bạn đang tìm kiếm để xây dựng một Generative Manufacturing Engine, hoặc bất kỳ hệ thống phức tạp nào với LLMs, đây là những ý tưởng cuối cùng của tôi từ thí nghiệm OpenForge: Greenfield là dễ dàng, Brownfield là khó khăn: LLM xuất sắc trong việc xây dựng từ đầu. Đừng Refactor với Prompts: Nếu bạn muốn thay đổi mục đích của một ứng dụng, đừng yêu cầu AI viết lại điều này cho X. Thay vào đó, lập bản đồ dòng logic của ứng dụng cũ và yêu cầu AI xây dựng một ứng dụng mới bằng cách sử dụng bản đồ logic đó. Kiến trúc vẫn còn là vua: Bạn không thể xem một cơ sở mã như một tài liệu lỏng có thể được hình thành bởi một LLM. OpenForge đã chứng minh rằng chúng ta có thể thu hẹp khoảng cách giữa ý định của người dùng mơ hồ và kỹ thuật vật lý. Điều đó nói rằng, Gemini 3.0 là một bước nhảy vọt lớn từ 2.5. một phần của những gì tôi đang khám phá ở đây là làm thế nào để có được tốt nhất từ một công cụ hoàn toàn mới.