Используя Pydantic для валидации типа, JSON Schema для структурного определения и правильное управление ошибками, разработчики могут создавать надежные приложения, которые зависят от последовательных, хорошо форматированных выходов ИИ, резко уменьшая разочарование, обычно испытываемое при анализе генерируемых ИИ данных.





В чем проблема с выходом функции Calling Output?

Я по-прежнему помню первый раз, когда я попытался построить систему бронирования, которая использовала модель ИИ для анализа запросов клиентов. пользователь ввел что-то вроде "Забронируйте мне стол на четыре в 7 вечера в эту пятницу", и ИИ должен был извлечь детали и передать их нашей системе бронирования.





Это была катастрофа!





Иногда ИИ забывал бы поля. В других случаях он добавлял бы дополнительные. Иногда он возвращал бы строки, когда нам нужны целые числа, или он форматировал бы даты несовместимо. Каждая несовместимость означала, что нужно было обращаться с другим случаем границы, еще одним if-сказом, чтобы добавить, еще одним сообщением о ошибках от пользователей.





То, что мне нужно было, это способ убедиться, что ИИ всегда возвращает именно ту структуру, которую ожидала моя система.





️ Ключевые вызовы AI Function Outputs

Когда мы используем функцию вызова с ИИ, мы в основном просим модель действовать как переводчик между беспорядочным человеческим языком и структурированными данными, которые наши системы могут обрабатывать.





Это создает фундаментальное напряжение:





Мы хотим гибкости ввода естественного языка Но нам нужна жесткость последовательного вывода данных





Решение заключается в создании слоя валидации, который гарантирует, что все, что производит ИИ, трансформируется именно в то, что ожидают наши системы.





Название: Enter Pydantic: The Python Data Validation Hero

Pydantic - это библиотека проверки данных, которая стала стандартом для применения структур данных в приложениях Python.Что делает ее идеальной для вызова функций, так это то, как она преодолевает разрыв между динамическими, потенциально беспорядочными данными и строгими типами, необходимыми для наших функций.





В основе Pydantic лежит простой способ определения моделей данных с аннотациями типа. Когда данные передаются этим моделям, Pydantic автоматически подтверждает, что данные соответствуют ожидаемым типам и форматам.





Например, когда ИИ возвращает «4» в качестве строки для поля, которое должно быть целым числом, Pydantic автоматически преобразует его. Когда он возвращает «2023-06-15» для поля datetime, Pydantic обрабатывает анализирование.





Как пидантика решает проблему вызова функций

Ключевое понимание заключается в том, что мы можем использовать пидантику в двух критических местах в нашей функции вызова рабочего процесса:





Definition: We can convert our Pydantic models to JSON Schema that the AI model understands, ensuring the AI knows exactly what format we expect. Validation: We can use the same Pydantic models to validate and transform the AI's output, catching any inconsistencies before they reach our business logic.



Это создает бесперебойный трубопровод, где естественный язык идет в один конец, а правильно напечатанные, проверенные данные выходят в другой конец.ИИ может быть творческим в понимании намерений пользователей, но Pydantic гарантирует, что творчество канализируется в последовательную структуру, с которой наши системы могут работать.





Я видел, что команды снижают уровень ошибок более чем на 90% после внедрения пидантической валидации на выходах их функций.Кроме того, время разработки резко ускоряется, потому что инженерам больше не нужно писать оборонительный код на каждом шагу - они могут доверять, что данные, поступающие в их функции, соответствуют их ожиданиям.





️ Создание надежной структуры для вывода функций

Давайте создадим полный пример, используя функцию OpenAI для вызова с валидацией Pydantic для обеспечения роскошных выходов:





from openai import AzureOpenAI import json from pydantic import BaseModel, Field, ValidationError from typing import Optional, List from datetime import datetime from enum import Enum # Initialize the client # Initialize the Azure OpenAI client client = AzureOpenAI( api_key="Your key", api_version="2024-10-21", # Make sure to use a version that supports function calling azure_endpoint="Your endpoint" ) # Define our data structures using Pydantic class ReservationType(str, Enum): DINNER = "dinner" LUNCH = "lunch" BREAKFAST = "breakfast" class RestaurantReservation(BaseModel): party_size: int = Field(..., gt=0, description="Number of people in the party") date: datetime = Field(..., description="Date and time of the reservation") special_requests: Optional[str] = Field(None, description="Any special requests") reservation_type: ReservationType = Field(..., description="Type of meal") customer_name: str = Field(..., min_length=1, description="Name for the reservation") phone_number: Optional[str] = Field(None, description="Contact phone number") # Convert Pydantic model to a JSON schema for the function definition reservation_schema = RestaurantReservation.model_json_schema() # Define the function for the AI functions = [ { "type": "function", "function": { "name": "make_restaurant_reservation", "description": "Make a reservation at a restaurant", "parameters": reservation_schema } } ] # Function to parse and validate AI output def parse_reservation_response(response_message): # Check if the model wants to call a function if not response_message.tool_calls: return {"error": "No function call found in response"} try: # Extract the function call arguments function_call = response_message.tool_calls[0] function_args = json.loads(function_call.function.arguments) # Validate using Pydantic reservation = RestaurantReservation(**function_args) # If we get here, validation passed return reservation.model_dump() except ValidationError as e: # Detailed validation errors from Pydantic return {"error": f"Validation error: {str(e)}"} except json.JSONDecodeError: return {"error": "Invalid JSON in function arguments"} except Exception as e: return {"error": f"Unexpected error: {str(e)}"} # Process user request def process_reservation_request(user_query): try: # Get response from the model response = client.chat.completions.create( model="gpt-4o-mini", # The name you gave your deployment messages=[{"role": "user", "content": user_query}], tools=functions, tool_choice="auto" ) response_message = response.choices[0].message # Parse and validate the response result = parse_reservation_response(response_message) # Handle errors if "error" in result: # You might want to retry with a more explicit prompt here return {"status": "error", "message": result["error"]} # Success! We have a valid reservation return { "status": "success", "reservation": result, "confirmation_message": f"Confirmed reservation for {result['party_size']} on {result['date']} under {result['customer_name']}" } except Exception as e: return {"status": "error", "message": f"Failed to process request: {str(e)}"} # Example usage result = process_reservation_request("I'd like to book a table for 4 people this Friday at 7 PM for dinner. My name is John Smith.") print(json.dumps(result, indent=2, default=str))









Выход: надежная функция, призывающая к действию





Когда мы запускаем наш код с пользовательским запросом «Я хотел бы забронировать стол для 4 человек в эту пятницу в 7 часов вечера на ужин под именем Джон Смит», вот что происходит за кулисами.





Наш слой подтверждения Pydantic подтверждает, что все необходимые поля присутствуют и правильно введены, конвертируя строку даты в объект datetime и гарантируя, что party_size является положительным целым числом. Окончательный выход для пользователя - это сообщение подтверждения: "Подтвержденная резервация на 4 на 2025-05-09 19:00:00 под Джоном Смитом". Если пользователь вместо этого сказал что-то неоднозначное, как "Забронируйте нам таблицу в ближайшее время", валидация поймает отсутствующую дату и имя клиента, позволяя нам просить об этих конкретных недостающих частях, а не полностью.





Почему этот подход работает

Существует несколько ключевых элементов, которые делают этот подход надежным:





Сильные определения типа: пидантические модели четко определяют, какие поля требуются, их типы и ограничения, такие как минимальные значения. Автоматическая валидация: Когда мы создаем объект RestaurantReservation, Pydantic автоматически проверяет все поля и предоставляет подробные сообщения об ошибках. Грациозное управление ошибками: мы улавливаем ошибки подтверждения и возвращаем структурированную информацию об ошибках, а не аварии. Пидантические модели могут генерировать JSON Schema, которые мы подаем непосредственно в определение функции, обеспечивая последовательность. Трансформация данных: Pydantic обрабатывает конвертирование строк в даты, обозначения их правильных типов и многое другое.





Хотите вместо этого использовать Azure OpenAI?

Если вы используете Azure OpenAI, шаблон практически идентичен — просто измените способ инициализации клиента:





from openai import AzureOpenAI # Initialize the Azure OpenAI client client = AzureOpenAI( api_key="your-azure-openai-api-key", api_version="2023-07-01-preview", azure_endpoint="https://your-resource-name.openai.azure.com" ) # The rest of the code remains the same





Реальные приложения мира

Этот шаблон предназначен не только для бронирования ресторанов, он работает везде, где вам нужны структурированные данные из естественного языка:





Поддержка клиентов: категоризация билетов и извлечение ключевых деталей

Управление календарем: создание встреч с правильными участниками и часами

Электронная коммерция: обработка поисков продуктов с помощью фильтров и сортировки

Медицинская помощь: извлечение симптомов и медицинской истории из описаний пациентов

Финансы: обработка описаний транзакций в категоризированные данные

Окончательная мысль: мост между хаосом и порядком

ИИ-функциональное вызова с строгой валидацией вывода - это больше, чем техническая модель - это мост между хаотичным миром человеческой коммуникации и упорядоченной сферой компьютерных систем.Позволяя людям выражать себя естественным образом, обеспечивая при этом системы получают точно структурированные данные, мы создаем интерфейсы, которые чувствуют себя человеческими, но функционируют надежно.





Будущее принадлежит приложениям, которые могут справиться с беспорядочностью человеческого намерения и превратить его, безуспешно, в действия, которые компьютер может выполнить.