目前,人们对生成式人工智能的现状有很多疑问。各家公司在定制 GenAI 方面的努力进展如何?各家公司是否真的在使用自己的专有数据构建人工智能应用程序,并以此推动发展?需要什么样的架构?
这些问题并不令人惊讶——人们对人工智能有很多种看法,从毫无掩饰的乐观到厌倦的愤世嫉俗,还夹杂着大量的炒作。
我发现它有助于澄清 GenAI 市场在三个领域的状况:市场希望看到什么、对可能发生的事情的担忧以及 2024 年将会发生什么(以及如何发生)。
2022 年底,OpenAI 发布 ChatGPT,展示了这种技术的强大和易用性,GenAI 一炮走红。人们对人工智能的潜在优势感到兴奋不已。很快,GenAI 就会融入到每个企业的每个应用程序中。投资者预计,为 GenAI 提供支持基础设施的公司将呈现曲棍球棒式的增长曲线。
另一方面,反对者设想了一个反乌托邦的人工智能未来,是《西部世界》和《黑镜》的结合体。其他人则警告人工智能泡沫。从投资角度来看,有人说这就像加密货币的翻版——充满兴奋和炒作,然后是一个冒烟的火山口。
我认为这两种担忧都是没有根据的。当然,随着每次新技术浪潮的到来,都会有坏人出于错误的原因使用 GenAI。GenAI 的可能性无处不在;它确实给人一种“泡沫”的感觉,甚至可能比加密货币的喧嚣更为刺耳。
但 GenAI 与加密技术之间的巨大差异在于,GenAI 在许多组织和行业中都拥有大量实际用例。在加密技术中,有一个强大的用例:不受信任的各方之间的金融交易(又称洗钱)。这是主流不太感兴趣的事情。
目前, GenAI 应用的现状让我想起了 20 世纪 90 年代末的电子商务,当时各家公司都在努力研究如何确保在互联网上使用信用卡的安全。各家公司花了一段时间才弄清楚如何安全地做到这一点,但一旦他们搞清楚了,突然间每个人都有了一个电子商务网站。
我现在在 GenAI 中看到的相似之处是:如何确保语言模型不会通过幻觉返回不准确的响应。好消息?这个问题已经解决了(感谢检索增强生成,简称 RAG;更多信息见下文)。
去年我们看到的很多项目都是概念验证型 GenAI 项目:向公司领导层展示可能性的应用程序。但很少有公司能超越这一阶段,开发出全面投入生产的应用程序。所谓“投入生产”,是指一家组织拥有一款 AI 应用程序,客户或员工正在以非原型方式使用这款应用程序。
换句话说,它是某些业务运营环节中常规活动的一部分。它可能是前台,可能是客户服务电话背后的工作,但它接近业务的主流部分。
沃尔玛就是这方面的一个很好的早期例子。这家零售商于 1 月宣布已在其购物应用中添加了 GenAI 支持的搜索功能。据报道,苹果正在测试一款 GenAI 工具,以帮助其员工提供更快捷的技术支持。在我们开始看到更多这样的例子之前,GenAI 将在 Gartner 所称的“炒作周期”的早期阶段停留一段时间。
大众汽车刚刚宣布成立内部实验室,开发用于其汽车导航和信息娱乐应用的 GenAI 应用程序。
尽管如此,我们距离“生产力高峰”并不像有些人想象的那么远。正如我之前提到的,信任模型的输出一直是组织面临的一个障碍,这些组织仍在努力解决如何通过减少幻觉来产生相关且准确的大型语言模型(LLM) 响应。
RAG 可从其他来源(通常是可以存储向量的数据库)实时为模型提供额外的数据或背景信息,现在正被用于解决这一问题。这项技术进步是开发特定领域、定制的 GenAI 应用程序的关键,这些应用程序基于组织最宝贵的资产:他们自己的数据。
虽然 RAG 已成为将企业背景引入 GenAI 应用程序的事实方法,但微调(即在数据子集上进一步训练预训练模型)也经常被提及。有时这种方法很有用,但如果对隐私、安全或速度有任何顾虑,RAG 是正确的选择。
无论如何将上下文添加到应用程序,我经常从与我交谈的投资者那里听到的一个大问题是,公司何时会开始从 GenAI 应用程序中赚钱?
我的回答是:你跟踪的大多数企业都是消费型企业。许多企业现在都在支持客户开发的实验、概念验证 (POC) 和小众应用;这些在消费方面没有多大作用。
但随着主要的人工智能应用开始从 POC 进入真正的生产阶段,这种情况开始发生变化。我预测到 2024 年底,这种情况将以显著的方式发生。它将在 2024 年下半年从两个地方开始实现。
首先,它在零售业中占据一席之地(参见前面提到的沃尔玛示例)。你还会看到人工智能在我所说的“人工智能内联网”领域得到广泛采用:与 PDF 聊天、知识库和内部呼叫中心。
随着这类应用推动的消费,微软、谷歌甚至甲骨文等公司都开始报告人工智能带来的成果。除了超大规模企业之外,其他人工智能基础设施公司可能会在明年 1 月、2 月和 3 月发布的收益报告中强调增长。
基于消费的 AI 基础设施公司的基础已经奠定。我们已经看到了强有力的商业证据,这些证据显示了大量特定领域的定制应用程序的潜力。从创意 AI 应用程序(例如 Midjourney、Adobe Firefly 和其他图像生成器)到知识应用程序(例如 GitHub Copilot( 超过 100 万开发人员使用它)、Glean 等),这些应用程序得到了广泛的采用,并显著提高了生产力。
在需要将知识传递到交互点的行业和用例中,定制应用的进展最为迅速。这些知识将来自他们自己的数据,使用现成的模型(开源或专有)、RAG 和他们选择的云提供商。
企业构建定制的 GenAI 应用程序需要三个要素,以适应生产规模的严格运行:智能环境、相关性和可扩展性。
让我们快速了解一下如何在 GenAI 应用程序中使用专有数据来生成有用、相关且准确的响应。
应用程序以各种数据的形式接收用户输入,并将其全部输入到嵌入引擎中,该引擎从数据中获取含义,使用 RAG 从矢量数据库中检索信息,并构建 LLM 可以使用的“智能上下文”,生成情境化的、无幻觉的响应并实时呈现给用户。
在运营数据库公司,你很少会听到这个话题。但在人工智能和矢量数据库领域,相关性是召回率和精确度的结合,对于产生有用、准确、非幻觉的反应至关重要。
与传统数据库操作不同,向量数据库支持语义或相似性搜索,其本质上是非确定性的。因此,同一查询返回的结果可能会因上下文和搜索过程的执行方式而不同。准确性和相关性在向量数据库在实际应用中的运行中起着关键作用。自然交互要求相似性搜索返回的结果准确且与请求的查询相关。
超越 POC 并投入生产的 GenAI 应用需要高吞吐量。吞吐量本质上是在给定时间内可以存储、访问或检索的数据量。高吞吐量对于大规模提供实时、交互式、数据密集型功能至关重要;写入通常涉及来自多个来源的数十亿个向量,而 GenAI 应用程序每秒可以生成大量请求。
与早期的技术创新浪潮一样,GenAI 遵循既定模式,所有迹象都表明它的发展速度甚至比以往的技术革命还要快。如果你抛开所有关于它的正面和负面炒作,就会发现很多公司正在努力将其 POC GenAI 应用投入生产,并取得了令人鼓舞的进展。
而像我的雇主 DataStax 这样的公司为这些应用程序提供了可扩展且易于构建的基础,他们将比一些人想象的更快地看到其客户消费带来的好处。
作者:Ed Anuff,DataStax
了解有关DataStax 如何帮助客户将其 GenAI 应用投入生产的更多信息。