Cách đây không lâu, các đại lý AI vẫn đang trong giai đoạn phát triển.Hầu hết ngành công nghiệp không chắc chắn họ là gì, họ có thể thực tế làm gì, hoặc liệu họ chỉ là một từ ngữ tiếp thị khác. Gần như mọi kỹ sư khác dường như đang xây dựng, thử nghiệm, hoặc ít nhất là nói về AI đại lý dưới một hình thức nào đó. Tôi nhớ khi tôi lần đầu tiên bắt đầu nghe thuật ngữ “các đại lý AI”, nó cảm thấy giống như một trong những khái niệm mà mọi người đều gật đầu nhưng rất ít người có thể giải thích rõ ràng. Ngay cả tôi cũng không chắc chắn liệu đó là một sự thay đổi thực sự hay chỉ là một từ vựng khác trên thị trường. nhưng theo thời gian trôi qua và tôi càng khám phá; tôi càng nhận ra rằng đây là một cái gì đó sẽ gắn bó và một cái gì đó mà mọi kỹ sư dữ liệu nên học và hiểu. Một điều tôi nhận thấy trong giai đoạn học tập của mình là nhiều blog hiện có, giải thích về chủ đề này tập trung vào nền tảng lý thuyết hoặc trên các khung và công cụ thực hành. AI đại lý tồn tại ở nơi đầu tiên và khi nó thực sự có ý nghĩa để sử dụng nó. Tại sao Trong bài viết này, tôi cố gắng trả lời những câu hỏi cơ bản này cho một đối tượng mục tiêu nhưng . already have a tech background haven’t worked with AI agents yet Đến cuối, bạn sẽ: Hiểu những gì Agent AI thực sự có nghĩa là Tìm hiểu các khái niệm và thuật ngữ cốt lõi Xây dựng một dự án “Hello World” đơn giản mà bạn có thể chạy tại địa phương Agent AI là gì? một giống như một hệ thống AI không chỉ Nhưng cũng có thể , và AI agent Trả lời câu hỏi take actions make decisions work toward a goal. Hãy nghĩ đến một người bình thường Giống như một người bạn hỏi: AI chatbot Nhà hàng tốt nhất gần đó là gì? Nhà hàng tốt nhất gần đó là gì? Và nó trả lời bằng những gợi ý. Nhưng một giống như một trợ lý thực sự có thể làm nhiều hơn là chỉ đề xuất; như AI agent Xem các nhà hàng Kiểm tra rating Sách và bàn Thêm nó vào lịch của bạn Set nhắc nhở Thay vì chỉ cung cấp thông tin, nó . acts on your behalf Một cách đơn giản để suy nghĩ về nó sẽ là với sự tương tự sau: LLM = não bộ Agent = Brain + Memory + Tools + Decision Loop LLM = Brain Agent = Brain + Memory + Tools + Decision Loop Nếu một LLM trả lời các câu hỏi, một . agent gets things done Tại sao chúng ta thậm chí cần các đại lý? Bởi vì các vấn đề thực sự không phải là lời nhắc một lần.Trong sự tiếp nối với ví dụ chúng tôi đã thấy trong phần trước, đây là một ví dụ khác để làm cho mọi thứ rõ ràng về cách các tác nhân AI khác nhau cho hệ thống AI thông thường và nhu cầu cụ thể hoặc khoảng cách mà họ đáp ứng. Giả sử chúng ta cần biết thời tiết ngày hôm nay trông như thế nào và dựa trên đó quyết định xem có nên chạy hay không Điều này sẽ đòi hỏi: Tải dữ liệu lý luận về nó đưa ra quyết định Sản xuất một action Một đại lý trong trường hợp này có thể hữu ích với: Quyết định công cụ nào để gọi Thực hiện các bước trung gian Retry nếu một cái gì đó thất bại Dừng lại khi nhiệm vụ được hoàn thành Core Agentic AI Concepts (Các khái niệm cơ bản) Tôi hy vọng đến bây giờ bạn đã khá rõ ràng về các đại lý AI là gì và tại sao chúng ta thậm chí còn cần nó. 1. nhân viên một Là một hệ thống mà: agent Bạn có mục tiêu Có thể hành động Có thể lý luận về các bước hoặc các mục hành động Có thể sử dụng công cụ Hãy nghĩ về nó như một Không phải chatbot. long-running task executor Mục tiêu / Objective Đây là những Đối với đại lý Ngôi sao Bắc Các ví dụ: “Tóm tắt một tài liệu” “Trả lời câu hỏi của khách hàng bằng cách sử dụng tài liệu nội bộ” “Monitor logs và cảnh báo về sự bất thường” Các nhân viên không chỉ trả lời - họ . work towards a goal 3. công cụ Công cụ là Nhân viên có thể gọi. external capabilities Các ví dụ: API (thời tiết, thanh toán, tìm kiếm) Cơ sở dữ liệu Hệ thống file Các chức năng bạn viết trong Python/JS Nhân viên quyết định và để sử dụng chúng. Khi Làm sao 4. ký ức Các đại lý thường cần bối cảnh vượt ra ngoài một lời nhắc. Bộ nhớ có thể là: Short Term (Lịch sử cuộc trò chuyện) Dài hạn (dữ liệu lưu trữ, nhúng, vector DBs) Đối với một đại lý cơ bản, bộ nhớ ngắn hạn là đủ. Chương 5: Lập kế hoạch / Reasoning Loop Đây là cốt lõi của hành vi đại lý. Loop điển hình: Xem trạng thái hiện tại Suy nghĩ về bước tiếp theo Chọn một hành động Thực hiện hành động Xem kết quả Lặp lại hoặc dừng lại Bạn sẽ thường thấy cái gọi là hoặc . ReAct Plan-Act-Observe Hệ thống Multi-agent a là Đây là một thiết lập nơi Mỗi người có vai trò và trách nhiệm riêng, để giải quyết một vấn đề một cách hợp tác như một nhóm. multi-agent system multiple AI agents work together Môi trường Một môi trường là nơi tác nhân hoạt động, chẳng hạn như: Browser Hệ thống file Lịch Công cụ kinh doanh Apps Cấu trúc Agent Đây là những công cụ được sử dụng để xây dựng các đại lý. Một số frameworks được sử dụng phổ biến nhất là như dưới đây LongChain xe gpt phi hành đoàn Đánh giáIndex Đã đến lúc chúng ta bắt tay bẩn thỉu... Đủ lý thuyết, hãy tiếp tục xây dựng một đại lý AI cơ bản sẽ giúp làm sáng tỏ bất kỳ nghi ngờ nào mà bạn vẫn có thể có. Chúng tôi sẽ xây dựng một cái này: Task Agent Lấy một nhiệm vụ từ người dùng Quyết định xem nó cần một công cụ Sử dụng công cụ Trả về câu trả lời cuối cùng Người đại diện này sẽ làm gì Ví dụ nhiệm vụ: “Thời gian hiện tại là gì và tôi nên uống cà phê?” “Thời gian hiện tại là gì và tôi nên uống cà phê?” Nhân viên sẽ: Quyết định nó cần thời gian hiện tại Gọi một công cụ thời gian Lý do cà phê Trả lời Bước 1: Thiết lập cơ bản Chúng tôi sẽ sử dụng Python và một API tương thích OpenAI. Chạy lệnh sau trong Terminal hoặc Command Prompt: pip install openai Bước 2: Xác định một công cụ Chúng tôi sẽ định nghĩa công cụ là một hàm Python đơn giản trong một tệp duy nhất, hãy nói agent_hello_world.py. Đối với một dự án thực tế, bạn có thể sẽ tổ chức các công cụ thành các mô-đun riêng biệt, nhưng giữ mọi thứ cùng nhau làm cho nó dễ dàng hơn để xem cách chuỗi đại lý hoạt động. from datetime import datetime def get_current_time(): return datetime.now().strftime("%H:%M") Bước 3: Xác định Agent Prompt Đây là nơi hành vi của đại lý là Thêm điều này vào file python của bạn được tạo trong bước trước. Thiết kế SYSTEM_PROMPT = """ You are a simple AI agent. You can: - Think step by step - Decide when to call tools - Use the tool: get_current_time When the task is complete, respond with a final answer. """ Bước 4: Agent Reasoning Loop Tiếp theo, chúng ta sẽ thêm logic lý luận vào mã của chúng ta. Phân đoạn dưới đây bắt đầu bằng cách gửi nhiệm vụ của người dùng, cùng với một lời nhắc hệ thống, đến GPT-4 thông qua API ChatCompletion. Sau đó nó đi vào một vòng tròn nơi nó tiếp tục nhận được phản hồi của mô hình. , đại lý gọi một hàm trợ giúp để có được thời gian hiện tại. Thêm cả yêu cầu công cụ và kết quả công cụ trở lại lịch sử tin nhắn và tiếp tục cuộc trò chuyện. nếu câu trả lời không yêu cầu công cụ, đại lý giả định nhiệm vụ đã hoàn thành và trả về câu trả lời cuối cùng. USE_TOOL:get_current_time import os import openai from openai import openai.api_key = "YOUR_API_KEY" def run_agent(task): messages = [ {"role": "system", "content": SYSTEM_PROMPT}, {"role": "user", "content": task} ] while True: response = openai.ChatCompletion.create( model="gpt-4", messages=messages ) reply = response["choices"][0]["message"]["content"] if "USE_TOOL:get_current_time" in reply: time = get_current_time() messages.append({"role": "assistant", "content": reply}) messages.append({"role": "tool", "content": time}) else: return reply Bước 5: Kiểm tra Cuối cùng, thêm bên dưới dòng mã trong kịch bản của bạn và chạy để kiểm tra nó. task = "What time is it right now, and should I grab a coffee?" result = run_agent(task) print(result) Chúc mừng bạn đã xây dựng một . basic agent Không phải là tưởng tượng, mà là một thực tại của chính mình. Chúng tôi vừa triển khai một đại lý AI địa phương cơ bản với: Hành vi hướng mục tiêu Công cụ sử dụng Lời bài hát: Rationing loop Quyết định nhà nước Đây là những ngoài kia. core of every agent framework LangChain, AutoGen, CrewAI - tất cả trong số họ trừu tượng . Mô hình chính xác này Suy nghĩ cuối cùng Đối với tôi, AI đại lý không phải là một cuộc cách mạng qua đêm nhưng nó giống như một sự thay đổi chậm và ổn định theo cùng một hướng mà chúng tôi đã di chuyển trong nhiều năm, đó là để tự động hóa và làm cho các hệ thống thông minh hơn.Khi bạn xóa bỏ các từ vựng, nó vẫn chỉ là một hệ thống chạy trong một vòng tròn, giữ bối cảnh, đưa ra quyết định và gọi các công cụ khi cần thiết. "Phần bây giờ có thể được thực hiện bởi một LLM. thinking Tôi đã phát hiện ra rằng các đại lý có ý nghĩa hơn nhiều khi bạn đối xử với chúng như một thành phần kỹ thuật khác và không giống như một khái niệm khoa học viễn tưởng tương lai. , đôi khi dòng công việc đơn giản nhất vẫn là tốt nhất. not every problem needs an agent