在快速发展的人工智能世界中，大型语言模型已经取得了长足的进步，对我们周围的世界拥有令人印象深刻的知识。然而 尽管他们很聪明，但常常很难认识到自己知识的界限，这种缺陷常常导致他们产生“幻觉”来填补空白。一种新设计的技术，称为 （RAG），通过使用专有数据增强提示，有望有效增加这些法学硕士的知识并减少幻觉的影响。 法学硕士 检索增强生成 弥补法学硕士的知识差距 法学硕士是能够理解和生成类人文本的计算机模型。它们是数字助理、自动更正功能甚至某些电子邮件背后的人工智能。他们对世界的了解往往是巨大的，但并不完美。就像人类一样，法学硕士可以达到他们知识的极限，但他们不会停下来，而是倾向于做出有根据的猜测或“幻觉”来完成任务。这可能会导致结果包含不准确或误导性信息。 在一个简单的世界中，答案是在需要的确切时间（即进行查询时）向模型提供相关的专有信息。但确定哪些信息是“相关的”并不总是那么简单，需要了解法学硕士被要求完成的任务。这就是 RAG 发挥作用的地方。 嵌入模型和向量相似性搜索的强大功能 在人工智能的世界中，嵌入模型的作用就像翻译器。他们通过称为“文档编码”的过程将文本文档转换为大量数字。该列表代表了法学硕士对文档含义的内部“理解”。这串数字称为向量：一段数据属性的数字表示。每个数据点都表示为具有许多数值的向量，其中每个值对应于数据的特定特征或属性。 虽然一串数字对于普通人来说似乎毫无意义，但这些数字充当高维空间中的坐标。就像纬度和经度可以描述物理空间中的位置一样，这串数字描述了原文在语义空间（所有可能含义的空间）中的位置。 将这些数字视为坐标使我们能够衡量两个文档之间含义的相似性。该测量被视为语义空间中它们各自点之间的距离。较小的距离表明含义更大的相似性，而较大的距离表明内容的差异。因此，可以通过在语义空间中搜索“接近”查询的文档来发现与查询相关的信息。这就是向量相似度搜索的魔力。  检索增强生成背后的想法 RAG 是一种 架构，它应用语义相似性来自动发现与查询相关的信息。 生成式 AI 在 RAG 系统中，您的文档存储在矢量数据库 (DB) 中。每个文档都根据嵌入模型生成的语义向量进行索引，以便可以快速找到接近给定查询向量的文档。这本质上意味着每个文档都被分配了一个数字表示（向量），该表示表示其含义。  当查询到来时，相同的嵌入模型用于生成 的语义向量。  查询 然后，该模型使用向量搜索从数据库中检索相似文档，查找向量与查询向量接近的文档。  检索到相关文档后，查询以及这些文档将用于从模型生成响应。这样，模型不必仅仅依赖其内部知识，而是可以在正确的时间访问您提供的任何数据。因此，通过合并存储在提供矢量搜索功能的数据库中的专有数据，该模型能够更好地提供更准确、更适合上下文的响应。 有一些所谓的“矢量数据库”可用，包括 ，对于其中 现在已经普遍可用。支持矢量搜索的数据库的主要优点是速度。传统数据库必须将查询与数据库中的每个项目进行比较。相比之下，集成矢量搜索支持某种形式的索引，并包含大大加快流程的搜索算法，从而可以在标准数据库所需时间的一小部分内搜索大量数据。  DataStax Astra 数据库 矢量搜索 可以对查询编码器和结果生成器进行微调，以优化性能。微调是稍微调整模型参数以更好地适应手头的特定任务的过程。  RAG 与微调 微调为优化法学硕士提供了许多好处。但它也有一些限制。其一，它不允许动态集成新的或专有的数据。该模型的知识在训练后保持静态，导致当被问及训练集之外的数据时会产生幻觉。另一方面，RAG 动态检索并合并来自外部数据库的最新专有数据，从而减轻幻觉问题并提供更符合上下文的准确响应。 RAG 使您能够在查询时控制向模型提供的确切信息，从而允许在进行查询时针对特定用户定制提示。  RAG 比微调在计算上也更加高效和灵活。微调需要针对每次数据集更新重新训练整个模型，这是一项耗时且资源密集型的任务。相反，RAG只需要更新文档向量，从而实现更简单、更高效的信息管理。 RAG 的模块化方法还允许单独微调检索机制，从而在不改变基本语言模型的情况下适应不同的任务或领域。  RAG 增强了大型语言模型的功能和准确性，使其成为微调的有力替代方案。在实践中，企业更倾向于使用RAG而不是微调。 通过 RAG 改变法学硕士的角色 将 RAG 融入法学硕士不仅可以提高他们回答的准确性，还可以最大限度地发挥他们的潜力。该过程使法学硕士能够专注于他们擅长的领域，即根据提示智能生成内容。模型不再是唯一的信息来源，因为 RAG 在需要时为其提供相关专有知识，并且模型可访问的知识库可以扩展和更新，而无需昂贵的模型训练工作。 从本质上讲，RAG 充当了一座桥梁，将法学硕士与超出其内部能力的知识库连接起来。因此，它大大减少了LLM“产生幻觉”的倾向，并为用户提供了更准确、更高效的模型。  DataStax 最近宣布在 Astra DB 中全面提供矢量搜索功能。了解一下 。 这里 作者：Ryan Michael，DataStax

The is an opinion piece based on the author’s POV and does not necessarily reflect the views of HackerNoon.

This writer has a vested interest be it monetary, business, or otherwise, with 1 or more of the products or companies mentioned within.

DataStax Astra DB is the vector database for getting GenAI apps into production, fast. Try it for free today!

DataStax

該音頻是用故事的原始語言製作的！

检索增强一代：人工智能幻觉消失！

About Author

註釋

標籤

这篇文章刊登在

Related Stories

架构师指南：构建 AI/ML 数据湖参考架构

数字游民请注意：您需要了解泰国新推出的 DTV 签证

使用这 18 种开发工具来提高你的工作效率 🚀🔥

Telegram：加密岛通往大陆的桥梁

架构师指南：构建 AI/ML 数据湖参考架构

数字游民请注意：您需要了解泰国新推出的 DTV 签证

使用这 18 种开发工具来提高你的工作效率 🚀🔥

Telegram：加密岛通往大陆的桥梁

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps