如果您是 ChatGPT 的常客,您就会知道它有一种迷失方向的倾向,即所谓的幻觉。大量统计上正确的单词,但没有现实依据。几个月前,有关将 Apache Cassandra 用于大型语言模型 (LLM) 和 LangChain 的提示引起了好奇的回应。 ChatGPT 报告说,在创建 LLM 时,Cassandra 不仅是一个很好的工具选择,OpenAI 还使用 Cassandra 和一个他们称为 CassIO 的 MIT 许可的 Python 库。
我们进入了兔子洞,通过更多的提示,ChatGPT 描述了有关如何使用 CassIO 的许多细节。它甚至包括一些示例代码和一个网站。随后的研究发现,除了 ChatGPT 响应之外,没有发现 CassIO 的证据,但种子已经播下。如果这个库不存在,它就需要存在,我们很快就开始研究它。
有史以来最好的幻觉。
ChatGPT(以及与之相关的 OpenAI)启发的这个好主意是什么?出色的 Python 库使开发人员能够事半功倍。 DataStax和Anant联手开发
CassIO 的优势在于它对特定 AI 框架的不可知论。它不关心接口的具体实现细节,比如
LLM的记忆模块,使用Cassandra进行存储,可以记住聊天交互中最近的交流,甚至可以保留过去整个对话的摘要。
在 Cassandra 上缓存 LLM 响应的功能,从而在可能的情况下节省延迟和令牌。自动将来自 Cassandra 的数据注入提示或更长的 LLM 对话中。
支持“partialing”提示,留下一些未指定的输入以备将来使用。
自动注入数据
这些组件协同工作以简化将数据合并到提示中的过程,并确保 LLM 与数据库之间的交互顺畅。
列入
随着时间的推移,CassIO 和 LangChain 的结合不断扩展和完善这些功能,以满足 LLM 管理不断变化的需求。当前最先进的技术是链接提示,以获得 LLM 更准确的响应。在最近的一篇论文中描述了一种称为
作为一个不断发展的工具,CassIO 正在迅速发展,并经常添加新的开发和更新。在撰写本文时,CassIO 支持 LangChain,LlamaIndex 即将推出。该项目的长期目标是支持自主 AI 代理的大规模内存,例如
即将到来的新兵训练营,“
谁知道历史会如何评判这一刻呢?是 OpenAI 的内部信息泄露吗?或者,更阴暗地思考一下,这是人工智能让人类听命的第一步吗?无论哪种方式,开发人员现在都有一个简单易用的库,可以在进入生成 AI 世界时利用 Cassandra 近乎无限的规模。
ChatGPT 给了我们一份礼物,那么您打算用它来构建什么?我将在即将举行的网络研讨会(注册
作者:Patrick McFadin,DataStax
Patrick McFadin 是 O'Reilly 图书“在 Kubernetes 上管理云原生数据”的合著者。他目前在 DataStax 从事开发人员关系工作,并且是 Apache Cassandra 项目的贡献者。 Patrick 曾担任 Apache Cassandra 的首席布道师(他也是新成立的 Cassandra 提交者!),并担任 DataStax 的顾问,在那里他在生产中构建了一些最大的部署。