Nếu bạn là người thường xuyên sử dụng ChatGPT, bạn sẽ biết xu hướng mà nó phải đi lang thang vào thứ được gọi là ảo giác. Một bộ sưu tập tuyệt vời các từ chính xác được thống kê không có cơ sở trong thực tế. Một vài tháng trước, lời nhắc về việc sử dụng Apache Cassandra cho các mô hình ngôn ngữ lớn (LLM) và LangChain đã dẫn đến một phản hồi gây tò mò. ChatGPT đã báo cáo rằng Cassandra không chỉ là một lựa chọn công cụ tốt khi tạo LLM, OpenAI còn sử dụng Cassandra với thư viện Python được MIT cấp phép mà họ gọi là CassIO.
Chúng tôi đã đi vào lỗ thỏ và thông qua nhiều lời nhắc hơn, ChatGPT đã mô tả nhiều chi tiết về cách CassIO được sử dụng. Nó thậm chí còn bao gồm một số mã mẫu và một trang web. Nghiên cứu sau đó không tìm thấy bằng chứng nào về CassIO ngoài các phản hồi ChatGPT, nhưng hạt giống đã được gieo. Nếu thư viện này không tồn tại thì nó cần phải có và chúng tôi đã bắt đầu làm việc với nó ngay sau đó.
Ảo giác tốt nhất bao giờ hết.
Ý tưởng tuyệt vời mà ChatGPT (và theo hiệp hội, OpenAI) đã truyền cảm hứng là gì? Một thư viện Python tuyệt vời cho phép các nhà phát triển làm được nhiều việc hơn với chi phí ít hơn. DataStax và Anant kết hợp lực lượng trong việc phát triển
Sức mạnh của CassIO nằm ở tính bất khả tri của nó đối với các khung AI cụ thể. Nó không liên quan đến các chi tiết triển khai cụ thể của các giao diện như
Mô-đun bộ nhớ dành cho LLM sử dụng Cassandra để lưu trữ, có thể ghi nhớ các trao đổi gần đây trong tương tác trò chuyện hoặc thậm chí giữ bản tóm tắt toàn bộ cuộc trò chuyện trước đây.
Một tính năng để lưu trữ các phản hồi LLM trên Cassandra, do đó tiết kiệm độ trễ và mã thông báo nếu có thể. Tự động đưa dữ liệu từ Cassandra vào lời nhắc hoặc trong cuộc hội thoại LLM dài hơn.
Hỗ trợ "chia nhỏ" lời nhắc, để lại một số đầu vào không xác định cho nguồn cung cấp trong tương lai.
Tự động tiêm dữ liệu từ một
Các thành phần này hoạt động cùng nhau để hợp lý hóa quy trình kết hợp dữ liệu vào lời nhắc và đảm bảo tương tác suôn sẻ giữa LLM và cơ sở dữ liệu.
sự bao gồm của
Sự kết hợp giữa CassIO và LangChain tiếp tục mở rộng và tinh chỉnh các khả năng này theo thời gian để đáp ứng nhu cầu không ngừng phát triển của quản lý LLM. Công nghệ tiên tiến nhất hiện nay là xâu chuỗi các lời nhắc để nhận được phản hồi chính xác hơn từ các LLM. Trong một bài báo gần đây mô tả một kỹ thuật gọi là
Là một công cụ đang phát triển, CassIO đang phát triển nhanh chóng với các phát triển và cập nhật mới thường xuyên được bổ sung. Tại thời điểm viết bài, CassIO hỗ trợ LangChain, với LlamaIndex sắp ra mắt. Mục tiêu dài hạn của dự án này là hỗ trợ bộ nhớ quy mô lớn cho các tác nhân AI tự trị như
Một trại huấn luyện sắp tới, “
Biết đâu giờ phút này lịch sử sẽ phán xét? Đó có phải là sự rò rỉ thông tin nội bộ từ OpenAI không? Hoặc, suy nghĩ đen tối hơn một chút, đây có phải là bước đầu tiên của AI để khiến con người thực hiện mệnh lệnh của mình không? Dù bằng cách nào, các nhà phát triển hiện có một thư viện dễ sử dụng để khai thác quy mô gần như vô hạn của Cassandra khi bước vào thế giới AI tổng quát.
ChatGPT đã tặng chúng tôi một món quà, vậy bạn sẽ xây dựng cái gì với món quà này? Tôi sẽ đi sâu vào tìm kiếm vectơ trong một hội thảo trực tuyến sắp tới (đăng ký
Bởi Patrick McFadin, DataStax
Patrick McFadin là đồng tác giả của cuốn sách O'Reilly 'Quản lý dữ liệu gốc trên đám mây trên Kubernetes'. Anh ấy hiện đang làm việc tại DataStax trong lĩnh vực quan hệ với nhà phát triển và là người đóng góp cho dự án Apache Cassandra. Patrick đã từng làm việc với tư cách là người truyền bá chính cho Apache Cassandra (anh ấy cũng là một người mới thành lập Cassandra!) và là cố vấn cho DataStax, nơi anh ấy đã có thời gian tuyệt vời để xây dựng một số triển khai lớn nhất trong sản xuất.