当我第一次被委托将生成型人工智能集成到Viamo的IVR平台中时,服务于非洲和亚洲新兴市场的数百万人时,我没有花费很长时间来认识到,我们不能只把聊天界面贴在它上,一天打电话给它,因为这将简化我们的一些技术和开发挑战。 该项目教会了我关于设计人工智能的教训,我认为所有设计师都应该学习:为代理人工智能设计不是关于让它变得聊天友好,而是关于设计智能系统,可以在人们已经信任的工作中可靠,透明和可预测地工作。 聊天第一思考的致命缺陷 有一个危险的范式已经植根于这个行业,因为它对AI产品聊天界面的痴迷,那就是每个人都在试图建立一个“ChatGPT for Y”。没有人停下来说,“其实,只是因为我们可以建立这个,聊天是其中的一部分,这实际上与聊天交互无关,这实际上是我们需要的。 这并不一定是真的. 聊天是完美的开端探索和创造性任务,涉及旅行,因为它们涉及目的地。 但大多数业务任务需要准确性,可审计性和可重复性。 设计Waypoint Commodities的供应商界面时,一个处理数百万美元肥料和化学品贸易交易的系统,用户不需要一个用户友好的聊天界面,可以促进有关他们的交易的探索性对话。 以聊天为中心的AI的主要问题是,它允许在对话的面貌下做出决策。用户无法轻松检查使用了哪些信息,应用了什么,以及作为替代选项探索了什么。当然,这对于低赌注的询问是可以接受的,但对后果的选择是灾难性的。 多代理系统需要多模式接口 但是后来,在我的思维中发生了范式转变,因为我停止了只为一个AI模型设计,并专注于为由多个专门AI实体组成的环境设计,作为一个系统一起运作。 这意味着我们必须完全放弃一个单窗口聊天系统的范式。相反,我们建立了一个多窗口接口,通过该接口可以同时使用多个交互方法。快速事实将通过AI语音输出获得即时响应。 故障排除将涉及导向交互,通过它AI将回答初步问题,然后将用户重定向到专家系统。 这些结果证明了这种策略是有效的,我们经历了超过30%的响应准确度和用户参与水平的提高,更显著的是,用户放弃率下降了20%,因为用户因为对预期不一致感到沮丧而停止谈话。 设计用于验证,而不仅仅是自动化 我所坚持的代理 UX 设计的最重要的原则之一是“无验证自动化”仅仅是“技术债务伪装为人工智能” 应该有一个“逃离线” 与系统中使用的每个人工智能“代理人”一起提供,允许“用户验证其推理”并“在必要时推翻其决定”,不是因为人们缺乏对人工智能“能力”的信心,而是因为人们“尊重”在“在受监管环境或高价值交易中”时“用户有最终责任。 当我负责设计Waypoint上新用户登录的管理仪表板时,我们有一个典型的自动化项目案例,这种情况将允许人工智能处理嵌入文档,抽象必要的信息,并自动填充用户配置文件,从而将用户登录时间从几个小时减少到几分钟。当然,我们理解不准确性可能会导致一家公司不遵守或更糟糕的是,创建欺诈性的用户配置文件。 在我们的界面中,我们实施了以下系统,用于为提取的每个领域表示AI的信心水平: 具有高精度的字段具有黑色文本颜色和绿色标记; 中等精度有橙色,并使用了中立符号; 具有低精度或缺少信息的字段有红色和警告符号。 为了识别人工智能系统错过的任何错误,每个配置文件30秒就足够了管理员的时间,因为他们通过这个系统获得了足够的背景。 但是结果很清楚:我们在完全手动方法和比人类或人工智能方法更准确地实现了40%的启动时间减少,但更重要的是,管理人员信任这个系统,因为他们实际上可以遵循它的逻辑。 代理能力的渐进披露 另一个细微但必不可少的代理 UX 领域,大多数设计师都在努力为用户提供有关他们的代理人可以和不能实现的事情的信息,而不会压倒他们这些能力的可能性和潜在应用。这尤其适用于应用生成人工智能的系统,而当我们在FlexiSAF Edusoft工作时,我开发了这些系统时,他们有广泛但无法预测的应用程序,在不同的任务或活动中。 我们的实施提供了基于互动的能力提示,这意味着当人们使用系统时,他们将提供 AI 强于回答的问题的示例,而不是机构的人力资源人员可以更适当地回答的问题,这意味着当用户键入有关申请截止日期的问题时,他们将看到 AI 强于回答的问题的示例,例如“工程应用程序截止日期是什么时候?”而不是他们可以更有效地回答的问题,例如“我可以免除支付申请费?” 此外,我们启用了反馈周期,用户可以表达他们是否已通过AI响应完全回答了问题,这不仅是为了改进模型,但它还启用了UX功能,通过该功能,用户可以表达他们需要升级他们的问题,他们被人工智能系统困扰了。 透明度及其作为信任建设因素的效用 当然,信任不是通过改进人工智能算法建立的,而是通过透明的系统设计,允许用户看到系统知道什么,为什么它得出结论,以及其局限性在哪里。eHealth Africa,我们的项目涉及医疗部门供应链的物流和数据存储,使这成为其不可谈判的项目之一:“如果人工智能计算机代理人预测疫苗发货时间或指示最佳的交付路线,这些理由必须可以解释,因为人类决策者将决定农村诊所是否及时接收挽救生命的商品。 为了解决这一问题,我们建立了我称之为“推理面板”,这些推理面板没有显示其计算的模型细节,只是关于为什么它达到其建议的信息,包括道路状况,此路线的以前交付时间,天气和可用的运输能力。 透明度是必要的,这既适用于失败,也适用于成功。为此,我们建立了有用的失败状态,描述了为什么人工智能无法提供其建议,而不是回落到某些通用错误消息。 设计代理人和人类之间的交往 但是,也许代理 UX 最未开发的主题之一是转让,或者确切地说,AI 代理人应该如何将系统或交互的控制权转移给人类,无论是人类是同事还是自己是该系统或交互的用户。 我们的背景传输协议是这样设计的,以便在操作员的屏幕上显示一个结构化总结,然后他们可以问候用户,而这个总结包含了用户所要求的内容,人工智能的意图是什么,为什么人工智能升级了这个呼叫,没有必要要求用户重复他们所要求的内容,所有交互背景都可供操作员使用,而这种微小的交互设计细节大大提高了平均处理时间和用户满意度,因为人们觉得他们受到尊重,他们的时间没有浪费。 在呼吁运营商将用户重返自动化系统的情况下,用户界面功能被运营商有效地使用,以基于某些任务传达AI自主性的足够期望,这将使用户能够被重定向到自动化系统,而不是以预期的挫折。 代理 UX 的务实设计原则 作为一个多年来设计人工智能系统的从业者,今天我制定了一些务实的指导方针,帮助我有效地设计代理 UX: 首先,为工作流而设计,而不是为技术。用户不关心他们是否通过人工智能、规则或人类智能得到帮助。他们只关心他们是否能有效且方便地完成任务。 用户需要知道他们何时离开一个智能领域,进入其他领域,如检索智能,模型智能和人类智能,并根据此建立一致的视觉和交互指南,以便他们不怀疑他们将得到什么样的答案,以及他们将获得什么时候。 第三,将验证构建在您的工作流程设计中,尊重用户的专业知识。人工智能系统理想情况下应该通过提出相关信息和建议行动路径来帮助加快决策,但这些最终应该由具有AI系统本身无法访问的背景的人类用户完成。 由于成功获得资金的项目,通过明确的增量增加了参与度,并在数千个用户中处理了用户数字,我们没有成功,因为我们拥有或试图创建复杂的AI系统,这是因为我们通过我们的界面为这些用户提供了理解他们在这个AI系统的尽头发生了什么的能力,通过这帮助他们信任它足以完成随着时间的推移而变得越来越复杂的任务,这确实使他们成为代理 UX 的成功例子。