ChatGPT를 자주 사용하는 분이라면 환각이라는 현상에 빠지는 경향이 있다는 것을 아실 것입니다. 현실에 근거가 없는 통계적으로 정확한 단어들의 방대한 모음입니다. 몇 달 전, LLM(대형 언어 모델) 및 LangChain에 Apache Cassandra를 사용하라는 메시지가 표시되자 흥미로운 반응이 나왔습니다. ChatGPT는 LLM을 생성할 때 Cassandra가 좋은 도구 선택일 뿐만 아니라 OpenAI가 CassIO라고 하는 MIT 라이선스 Python 라이브러리와 함께 Cassandra를 사용했다고 보고했습니다.
우리는 토끼 굴로 들어가 더 많은 메시지를 통해 ChatGPT가 CassIO 사용 방법에 대한 많은 세부 정보를 설명했습니다. 여기에는 일부 샘플 코드와 웹사이트도 포함되어 있습니다. 후속 연구에서는 ChatGPT 응답 외부에서 CassIO에 대한 증거를 발견하지 못했지만 씨앗이 뿌려졌습니다. 이 라이브러리가 없었다면 그래야 했고 우리는 곧 이에 대한 작업을 시작했습니다.
최고의 환각.
ChatGPT(및 OpenAI 협회)가 영감을 준 이 훌륭한 아이디어는 무엇이었나요? 훌륭한 Python 라이브러리를 사용하면 개발자는 더 적은 자원으로 더 많은 작업을 수행할 수 있습니다. DataStax 와 Anant가 힘을 합쳐 개발 중
CassIO의 강점은 특정 AI 프레임워크에 대한 불가지론에 있습니다. 다음과 같은 인터페이스의 특정 구현 세부 사항에는 관심이 없습니다.
Cassandra를 저장용으로 사용하는 LLM용 메모리 모듈로, 채팅 상호 작용에서 최근 교환 내용을 기억하거나 전체 과거 대화 요약을 유지할 수도 있습니다.
Cassandra에서 LLM 응답을 캐시하여 가능한 경우 대기 시간과 토큰을 절약하는 기능입니다. Cassandra의 데이터를 프롬프트 또는 더 긴 LLM 대화 내에 자동으로 삽입합니다.
프롬프트의 "부분화"를 지원하여 향후 제공을 위해 일부 입력을 지정하지 않은 상태로 둡니다.
다음에서 데이터 자동 주입
이러한 구성 요소는 함께 작동하여 데이터를 프롬프트에 통합하는 프로세스를 간소화하고 LLM과 데이터베이스 간의 원활한 상호 작용을 보장합니다.
포함
CassIO와 LangChain의 결합은 LLM 관리의 끊임없이 진화하는 요구 사항을 충족하기 위해 시간이 지남에 따라 이러한 기능을 지속적으로 확장하고 개선합니다. 현재 최첨단 기술은 LLM으로부터 보다 정확한 응답을 얻기 위해 프롬프트를 연결하는 것입니다. 라는 기술을 설명하는 최근 논문에서
진화하는 도구로서 CassIO는 새로운 개발과 업데이트가 자주 추가되면서 빠르게 성장하고 있습니다. 이 글을 쓰는 시점에서 CassIO는 LangChain을 지원하며 LlamaIndex는 곧 출시될 예정입니다. 이 프로젝트의 장기 목표는 자율 AI 에이전트를 위한 대용량 메모리를 지원하는 것입니다.
다가오는 부트 캠프, “
역사가 이 순간을 어떻게 판단할지 누가 알겠습니까? OpenAI 내부 정보 유출이었나? 아니면 좀 더 어둡게 생각해보면 이것이 인간이 명령을 따르도록 하는 AI의 첫 번째 단계일까요? 어느 쪽이든 이제 개발자는 생성 AI 세계에 뛰어들 때 거의 무한한 규모의 Cassandra를 활용할 수 있는 사용하기 쉬운 라이브러리를 갖게 되었습니다.
ChatGPT가 우리에게 선물을 줬는데, 이걸로 무엇을 만들 예정인가요? 다가오는 웹세미나(등록)에서 벡터 검색에 대해 자세히 알아볼 예정입니다.
작성자: Patrick McFadin, DataStax
Patrick McFadin은 O'Reilly 저서 'Managing Cloud Native Data on Kubernetes'의 공동 저자입니다. 그는 현재 DataStax에서 개발자 관계로 일하고 있으며 Apache Cassandra 프로젝트의 기여자로 일하고 있습니다. Patrick은 Apache Cassandra의 수석 전도사(그는 또한 새로 임명된 Cassandra 커미터이기도 합니다!)와 DataStax의 컨설턴트로 일하면서 프로덕션에서 가장 큰 규모의 배포를 구축하는 데 즐거운 시간을 보냈습니다.