1,227 讀數

检索增强一代：人工智能幻觉消失！

经过 DataStax5m2023/08/14

太長; 讀書

检索增强生成（RAG）有望有效增加法学硕士的知识并减少人工智能幻觉的影响。

在快速发展的人工智能世界中，大型语言模型已经取得了长足的进步，对我们周围的世界拥有令人印象深刻的知识。然而法学硕士尽管他们很聪明，但常常很难认识到自己知识的界限，这种缺陷常常导致他们产生“幻觉”来填补空白。一种新设计的技术，称为检索增强生成（RAG），通过使用专有数据增强提示，有望有效增加这些法学硕士的知识并减少幻觉的影响。

弥补法学硕士的知识差距

法学硕士是能够理解和生成类人文本的计算机模型。它们是数字助理、自动更正功能甚至某些电子邮件背后的人工智能。他们对世界的了解往往是巨大的，但并不完美。就像人类一样，法学硕士可以达到他们知识的极限，但他们不会停下来，而是倾向于做出有根据的猜测或“幻觉”来完成任务。这可能会导致结果包含不准确或误导性信息。

在一个简单的世界中，答案是在需要的确切时间（即进行查询时）向模型提供相关的专有信息。但确定哪些信息是“相关的”并不总是那么简单，需要了解法学硕士被要求完成的任务。这就是 RAG 发挥作用的地方。

嵌入模型和向量相似性搜索的强大功能

在人工智能的世界中，嵌入模型的作用就像翻译器。他们通过称为“文档编码”的过程将文本文档转换为大量数字。该列表代表了法学硕士对文档含义的内部“理解”。这串数字称为向量：一段数据属性的数字表示。每个数据点都表示为具有许多数值的向量，其中每个值对应于数据的特定特征或属性。

虽然一串数字对于普通人来说似乎毫无意义，但这些数字充当高维空间中的坐标。就像纬度和经度可以描述物理空间中的位置一样，这串数字描述了原文在语义空间（所有可能含义的空间）中的位置。

将这些数字视为坐标使我们能够衡量两个文档之间含义的相似性。该测量被视为语义空间中它们各自点之间的距离。较小的距离表明含义更大的相似性，而较大的距离表明内容的差异。因此，可以通过在语义空间中搜索“接近”查询的文档来发现与查询相关的信息。这就是向量相似度搜索的魔力。

检索增强生成背后的想法

RAG 是一种生成式 AI架构，它应用语义相似性来自动发现与查询相关的信息。

在 RAG 系统中，您的文档存储在矢量数据库 (DB) 中。每个文档都根据嵌入模型生成的语义向量进行索引，以便可以快速找到接近给定查询向量的文档。这本质上意味着每个文档都被分配了一个数字表示（向量），该表示表示其含义。

当查询到来时，相同的嵌入模型用于生成查询的语义向量。

然后，该模型使用向量搜索从数据库中检索相似文档，查找向量与查询向量接近的文档。

检索到相关文档后，查询以及这些文档将用于从模型生成响应。这样，模型不必仅仅依赖其内部知识，而是可以在正确的时间访问您提供的任何数据。因此，通过合并存储在提供矢量搜索功能的数据库中的专有数据，该模型能够更好地提供更准确、更适合上下文的响应。

有一些所谓的“矢量数据库”可用，包括DataStax Astra 数据库，对于其中矢量搜索现在已经普遍可用。支持矢量搜索的数据库的主要优点是速度。传统数据库必须将查询与数据库中的每个项目进行比较。相比之下，集成矢量搜索支持某种形式的索引，并包含大大加快流程的搜索算法，从而可以在标准数据库所需时间的一小部分内搜索大量数据。

可以对查询编码器和结果生成器进行微调，以优化性能。微调是稍微调整模型参数以更好地适应手头的特定任务的过程。

RAG 与微调

微调为优化法学硕士提供了许多好处。但它也有一些限制。其一，它不允许动态集成新的或专有的数据。该模型的知识在训练后保持静态，导致当被问及训练集之外的数据时会产生幻觉。另一方面，RAG 动态检索并合并来自外部数据库的最新专有数据，从而减轻幻觉问题并提供更符合上下文的准确响应。 RAG 使您能够在查询时控制向模型提供的确切信息，从而允许在进行查询时针对特定用户定制提示。

RAG 比微调在计算上也更加高效和灵活。微调需要针对每次数据集更新重新训练整个模型，这是一项耗时且资源密集型的任务。相反，RAG只需要更新文档向量，从而实现更简单、更高效的信息管理。 RAG 的模块化方法还允许单独微调检索机制，从而在不改变基本语言模型的情况下适应不同的任务或领域。

RAG 增强了大型语言模型的功能和准确性，使其成为微调的有力替代方案。在实践中，企业更倾向于使用RAG而不是微调。