Arize AI , một nền tảng đánh giá mô hình ngôn ngữ lớn (LLM) có khả năng quan sát AI, đã ra mắt tính năng giám sát và phân tích biến số kịp thời trên sân khấu tại Google Cloud Next '24 vào tuần này.
Sự ra mắt đến vào thời điểm rất cần thiết. Mặc dù các doanh nghiệp đang chạy đua triển khai các mô hình nền tảng để duy trì tính cạnh tranh trong một thế giới ngày càng được thúc đẩy bởi AI, ảo giác và độ chính xác của phản hồi vẫn là rào cản đối với việc triển khai sản xuất.
Tính năng giám sát biến nhắc nhở mới của Arize giúp các kỹ sư AI và nhóm học máy tự động phát hiện lỗi trong các biến nhắc nhở và xác định chính xác các tập dữ liệu có vấn đề. Thông qua việc xem xét nội tâm và sàng lọc các lời nhắc được sử dụng trong các ứng dụng do LLM cung cấp, các nhóm có thể đảm bảo rằng kết quả đầu ra được tạo ra phù hợp với kỳ vọng về các số liệu như độ chính xác, mức độ liên quan và độ chính xác. Các công cụ quản lý cửa sổ ngữ cảnh bổ sung cũng ra mắt ngày hôm nay cho phép kiểm tra thêm.
Jason Lopatecki, Giám đốc điều hành và Đồng sáng lập của Arize AI cho biết: “Việc gỡ lỗi hệ thống LLM ngày nay quá khó khăn. “Bằng cách phân tích cách các hệ thống AI phản ứng với vô số lời nhắc và cung cấp thông tin chi tiết sâu hơn về hành vi của mô hình, các công cụ phân tích biến tức thời mới của Arize hứa hẹn sẽ giúp các kỹ sư AI đạt được kết quả thành công hơn trong sản xuất - với các vòng đào tạo và phản hồi để thông báo sàng lọc liên tục.”
Arize AI là nền tảng đánh giá LLM và khả năng quan sát AI giúp các nhóm phân phối và duy trì AI thành công hơn trong sản xuất. Nền tảng giám sát và quan sát tự động của Arize cho phép các nhóm nhanh chóng phát hiện sự cố khi chúng xuất hiện, khắc phục lý do chúng xảy ra và cải thiện hiệu suất tổng thể trên cả trường hợp sử dụng ML truyền thống và tổng quát như RAG LLM . Arize có trụ sở tại Berkeley, CA.