大型语言模型(LLMs)已经以暴风雨夺走了AI世界,但并非所有建立在其基础上的东西都准备好生产。 他们在现实世界的表现是......好吧,压倒性。 作为应用人工智能的更务实和可扩展的方式正在获得基础,让我们探索为什么。 AI Agents Agentic Workflows AI代理人:仍然很酷,但还没有准备好 1、无法信任的准确性 AI代理人在演示视频中看起来滑稽,但在实践中?他们短缺。 带 它仅仅实现 你所期望的人类执行相同任务的准确性。 有更好的结果,但仍然在 与人体性能相比,超过70%。 Claude's ACI (AI Agent Computer Interface) 14% Operator 30–50% Agent Success Rate Human Benchmark Claude ACI 14% >70% OpenAI Operator 30-50% >70% 克劳德·阿西 十四% > 七成 开放操作员 30 至 50 % > 七成 无论是点击错误的按钮还是误解用户命令,AI代理都还没有。 低适应性 = 高失败率 大多数AI代理人无法动态地适应像弹出广告或稍微更新的用户界面这样的变化,他们缺乏实时监控和错误恢复,在混乱或不可预测的环境中变得脆弱。 3、高成本、低回报 定制 API. 任务特定的逻辑. 无尽的调试. 所有这些都使构建和扩展人工智能代理成为一项昂贵的赌博。 这是一个巨大的Dev投资之后。 agent success rates below 20% 那么,这把我们留在哪里呢? 代理工作流程:更智能,更简单的替代方案 而不是建立一个AI 代理工作流将任务分解为 并让专门的组件处理每一个。 做一切 well-defined steps 想想它作为 小、目的驱动的任务,连接成一个有意义的整体。 "microservices" version of AI 1、什么是代理工作流? 这是一个结构化的方法,LLM或工具被编排为: 恢复信息 转换或分析它 饲料输出到下一步 交付最终结果 与端到端的人工智能代理不同,代理工作流是透明的,更容易调试,并且 . 更可靠 在一项研究中,知识工作者花费高达30%的时间只是搜索和组织信息。 在一项研究中,知识工作者花费高达30%的时间只是搜索和组织信息。 代理RAG:在规模上个性化 一个冷酷的进化 (获取扩展世代)而不是仅仅用公共数据回答问题,它: Agentic RAG 提取您的数据(PDF、数据库、会议笔记) 创建一个习惯的背景 然后使用LLM生成智能,个性化的答案 工具如 这是朝着这个方向迈出的早期步骤 - 想象通过几个提示来运行复杂的多步研究项目,并获得详细的总结。 ChatGPT’s Deep Research 代理工作流会是下一个大问题吗? 老实说,它已经发生了。 与脆弱代理相比,代理工作流程: 解决实际业务问题,如跨文档搜索或自动报告 模块化 - 易于集成,而不破坏您的堆栈 适应当今企业需求,如数据争夺、内容合成和工作流自动化 无论是电子商务订单管道,医疗诊断研究,还是个性化教育路径,这些工作流程都在跨行业寻找吸引力。 最重要的是:他们 . work 最后的想法 人工智能特工的梦想不是死的 - 它只是比预期要长。 它正在悄悄地改变我们工作的方式,一次任务。 Agentic Workflow 在一个奖励实用性的世界中,也许下一个大问题不是数字超级助理,而是一组小型智能工具。 解决今天真正的问题。 一起 因为在技术上,坚持的想法不是最闪闪发光的 - 他们是完成工作的人。