Bằng cách sử dụng Pydantic cho xác nhận loại, JSON Schema cho định nghĩa cấu trúc, và xử lý lỗi thích hợp, các nhà phát triển có thể tạo ra các ứng dụng mạnh mẽ phụ thuộc vào đầu ra AI nhất quán, được định dạng tốt, làm giảm đáng kể sự thất vọng thường gặp khi phân tích dữ liệu được tạo ra bởi AI.





Vấn đề với chức năng Calling Output là gì?

Tôi vẫn còn nhớ lần đầu tiên tôi cố gắng xây dựng một hệ thống đặt phòng sử dụng mô hình AI để phân tích yêu cầu của khách hàng. người dùng sẽ gõ một cái gì đó như "Đặt phòng cho tôi lúc bốn giờ sáng thứ Sáu này," và AI được cho là sẽ trích xuất các chi tiết và truyền chúng đến hệ thống đặt phòng của chúng tôi.





Đó là một thảm họa!





Đôi khi AI sẽ quên các trường. những lần khác nó sẽ thêm các trường hợp bổ sung. Đôi khi nó sẽ trả lại các chuỗi khi chúng ta cần số nguyên, hoặc nó sẽ định dạng ngày không nhất quán. Mỗi sự không nhất quán có nghĩa là một trường hợp cạnh khác để xử lý, một nếu-tuyên bố khác để thêm, một báo cáo lỗi khác từ người dùng.





Những gì tôi cần là một cách để đảm bảo AI luôn luôn trả về chính xác cấu trúc hệ thống của tôi mong đợi.





️ Thách thức cốt lõi của AI Function Outputs

Khi chúng ta sử dụng chức năng gọi với AI, chúng ta về cơ bản yêu cầu mô hình hoạt động như một phiên dịch giữa ngôn ngữ con người hỗn loạn và dữ liệu có cấu trúc mà hệ thống của chúng ta có thể xử lý.





Điều này tạo ra một căng thẳng cơ bản:





Chúng tôi muốn sự linh hoạt của đầu vào ngôn ngữ tự nhiên Nhưng chúng ta cần sự cứng nhắc của sản lượng dữ liệu nhất quán





Giải pháp nằm ở việc tạo ra một lớp xác nhận đảm bảo bất cứ điều gì AI sản xuất được chuyển đổi thành chính xác những gì hệ thống của chúng tôi mong đợi.





Tên sản phẩm: Enter Pydantic: The Python Data Validation Hero

Pydantic là một thư viện xác thực dữ liệu đã trở thành tiêu chuẩn để thực thi cấu trúc dữ liệu trong các ứng dụng Python. Điều gì làm cho nó hoàn hảo cho các cuộc gọi chức năng là cách nó thu hẹp khoảng cách giữa dữ liệu năng động, có khả năng lộn xộn và các loại nghiêm ngặt mà các chức năng của chúng tôi yêu cầu.





Tại cốt lõi của nó, Pydantic cung cấp một cách đơn giản để xác định mô hình dữ liệu với ghi chú kiểu. Khi dữ liệu được truyền đến các mô hình này, Pydantic tự động xác nhận rằng dữ liệu khớp với các loại và định dạng mong đợi.





Ví dụ, khi một AI trả về "4" như một chuỗi cho một trường nên là một số nguyên, Pydantic tự động chuyển đổi nó. Khi nó trả về "2023-06-15" cho một trường datetime, Pydantic xử lý phân tích.





Làm thế nào Pydantic giải quyết vấn đề gọi chức năng

Khái niệm quan trọng là chúng ta có thể sử dụng Pydantic ở hai vị trí quan trọng trong quy trình làm việc gọi chức năng của chúng tôi:





Definition: We can convert our Pydantic models to JSON Schema that the AI model understands, ensuring the AI knows exactly what format we expect. Validation: We can use the same Pydantic models to validate and transform the AI's output, catching any inconsistencies before they reach our business logic.



Điều này tạo ra một đường ống dẫn liền mạch, nơi ngôn ngữ tự nhiên đi vào một đầu, và dữ liệu được gõ đúng, xác nhận xuất hiện vào cuối khác. AI có thể sáng tạo trong việc hiểu ý định của người dùng, nhưng Pydantic đảm bảo rằng sự sáng tạo được kênh vào một cấu trúc nhất quán mà hệ thống của chúng ta có thể làm việc với.





Tôi đã thấy các nhóm giảm tỷ lệ lỗi của họ hơn 90% sau khi thực hiện xác nhận Pydantic trên các kết quả gọi chức năng của họ.Thêm vào đó, thời gian phát triển tăng tốc đáng kể bởi vì các kỹ sư không còn cần phải viết mã phòng thủ ở mỗi bước - họ có thể tin tưởng rằng dữ liệu đến các chức năng của họ phù hợp với kỳ vọng của họ.





️ Xây dựng một khuôn khổ đáng tin cậy cho kết quả chức năng

Hãy tạo một ví dụ hoàn chỉnh bằng cách sử dụng chức năng gọi OpenAI với xác nhận Pydantic để đảm bảo đầu ra cứng rắn:





from openai import AzureOpenAI import json from pydantic import BaseModel, Field, ValidationError from typing import Optional, List from datetime import datetime from enum import Enum # Initialize the client # Initialize the Azure OpenAI client client = AzureOpenAI( api_key="Your key", api_version="2024-10-21", # Make sure to use a version that supports function calling azure_endpoint="Your endpoint" ) # Define our data structures using Pydantic class ReservationType(str, Enum): DINNER = "dinner" LUNCH = "lunch" BREAKFAST = "breakfast" class RestaurantReservation(BaseModel): party_size: int = Field(..., gt=0, description="Number of people in the party") date: datetime = Field(..., description="Date and time of the reservation") special_requests: Optional[str] = Field(None, description="Any special requests") reservation_type: ReservationType = Field(..., description="Type of meal") customer_name: str = Field(..., min_length=1, description="Name for the reservation") phone_number: Optional[str] = Field(None, description="Contact phone number") # Convert Pydantic model to a JSON schema for the function definition reservation_schema = RestaurantReservation.model_json_schema() # Define the function for the AI functions = [ { "type": "function", "function": { "name": "make_restaurant_reservation", "description": "Make a reservation at a restaurant", "parameters": reservation_schema } } ] # Function to parse and validate AI output def parse_reservation_response(response_message): # Check if the model wants to call a function if not response_message.tool_calls: return {"error": "No function call found in response"} try: # Extract the function call arguments function_call = response_message.tool_calls[0] function_args = json.loads(function_call.function.arguments) # Validate using Pydantic reservation = RestaurantReservation(**function_args) # If we get here, validation passed return reservation.model_dump() except ValidationError as e: # Detailed validation errors from Pydantic return {"error": f"Validation error: {str(e)}"} except json.JSONDecodeError: return {"error": "Invalid JSON in function arguments"} except Exception as e: return {"error": f"Unexpected error: {str(e)}"} # Process user request def process_reservation_request(user_query): try: # Get response from the model response = client.chat.completions.create( model="gpt-4o-mini", # The name you gave your deployment messages=[{"role": "user", "content": user_query}], tools=functions, tool_choice="auto" ) response_message = response.choices[0].message # Parse and validate the response result = parse_reservation_response(response_message) # Handle errors if "error" in result: # You might want to retry with a more explicit prompt here return {"status": "error", "message": result["error"]} # Success! We have a valid reservation return { "status": "success", "reservation": result, "confirmation_message": f"Confirmed reservation for {result['party_size']} on {result['date']} under {result['customer_name']}" } except Exception as e: return {"status": "error", "message": f"Failed to process request: {str(e)}"} # Example usage result = process_reservation_request("I'd like to book a table for 4 people this Friday at 7 PM for dinner. My name is John Smith.") print(json.dumps(result, indent=2, default=str))









The Output: Chức năng mạnh mẽ kêu gọi hành động





Khi chúng tôi chạy mã của chúng tôi với truy vấn người dùng "Tôi muốn đặt bàn cho 4 người vào thứ Sáu này lúc 7 giờ chiều để ăn tối dưới tên John Smith," đây là những gì xảy ra phía sau hậu trường.





Lớp xác nhận Pydantic của chúng tôi xác nhận tất cả các trường cần thiết đang hiện diện và được nhập đúng cách, chuyển đổi chuỗi ngày thành đối tượng datetime và đảm bảo party_size là số nguyên tích cực. Kết quả cuối cùng cho người dùng là một thông điệp xác nhận: "Xác nhận đặt phòng cho 4 vào ngày 2025-05-09 19:00:00 dưới John Smith." Nếu người dùng thay vào đó đã nói một cái gì đó mơ hồ như "Đặt phòng cho chúng tôi một bảng sớm," xác nhận sẽ nắm bắt ngày thiếu và tên khách hàng, cho phép chúng tôi yêu cầu các mảnh thiếu cụ thể thay vì thất bại hoàn toàn.





Tại sao phương pháp này hoạt động

Có một số yếu tố chính làm cho phương pháp này mạnh mẽ:





Định nghĩa kiểu mạnh mẽ: Các mô hình pydanic xác định rõ các trường nào được yêu cầu, các loại của chúng và các hạn chế như giá trị tối thiểu. Tự động Xác minh: Khi chúng tôi tạo một đối tượng RestaurantReservation, Pydantic tự động xác nhận tất cả các trường và cung cấp thông báo lỗi chi tiết. Xử lý lỗi tử tế: Chúng tôi nắm bắt các lỗi xác thực và trả về thông tin lỗi có cấu trúc thay vì tai nạn. Schema Generation: Các mô hình Pydantic có thể tạo ra JSON Schema mà chúng tôi cung cấp trực tiếp cho định nghĩa hàm, đảm bảo tính nhất quán. Chuyển đổi dữ liệu: Pydantic xử lý chuyển đổi các chuỗi thành ngày, viết tắt cho các loại chính xác của chúng, và nhiều hơn nữa.





Bạn muốn sử dụng Azure OpenAI thay thế?

Nếu bạn đang sử dụng Azure OpenAI, mô hình gần như giống hệt nhau - chỉ cần thay đổi cách bạn khởi tạo client:





from openai import AzureOpenAI # Initialize the Azure OpenAI client client = AzureOpenAI( api_key="your-azure-openai-api-key", api_version="2023-07-01-preview", azure_endpoint="https://your-resource-name.openai.azure.com" ) # The rest of the code remains the same





Các ứng dụng thế giới thực

Mô hình này không chỉ dành cho đặt phòng nhà hàng. Nó hoạt động bất cứ nơi nào bạn cần dữ liệu có cấu trúc từ ngôn ngữ tự nhiên:





Hỗ trợ khách hàng: Thể loại hóa vé và trích xuất chi tiết chính

Quản lý lịch: Tạo cuộc họp với người dự và thời gian chính xác

Thương mại điện tử: Xử lý tìm kiếm sản phẩm với các bộ lọc và sắp xếp

Chăm sóc sức khỏe: Trích xuất các triệu chứng và lịch sử y tế từ mô tả bệnh nhân

Tài chính: Xử lý mô tả giao dịch thành dữ liệu phân loại

Suy nghĩ cuối cùng: Cây cầu giữa hỗn loạn và trật tự

Gọi chức năng AI với xác nhận đầu ra nghiêm ngặt là nhiều hơn một mô hình kỹ thuật - đó là cầu nối giữa thế giới hỗn loạn của giao tiếp của con người và lĩnh vực có trật tự của các hệ thống máy tính.Bằng cách cho phép con người thể hiện bản thân một cách tự nhiên trong khi đảm bảo các hệ thống nhận được dữ liệu có cấu trúc chính xác, chúng tôi đang tạo ra các giao diện cảm thấy con người nhưng hoạt động đáng tin cậy.





Tương lai thuộc về các ứng dụng có thể xử lý sự lộn xộn của ý định của con người và chuyển đổi nó, không thất bại, thành các hành động một máy tính có thể thực hiện.