WTF 是一个自主代理吗?
如果您没有直接在人工智能领域工作,那么您很可能是通过一些有影响力的人开始介绍自主代理概念的:
“🤯 移开 ChatGPT...”
“这个你从未听说过的工具正在让我们更接近 AGI 🤖“
“你不会相信人工智能现在正在做什么!! 💪”
撇开参与话题不谈,自主代理在 2023 年 3 月推出后开始吸引主流主流关注
AutoGPT 代表了我们可以描述的通用自治代理的第一个实例。为了避免复杂化,本文的其余部分假设“自主代理”的定义为任何非人类实体:
有能力分配自己的任务
一旦提供了目标函数,就可以独立于用户输入进行操作(例如,今年我的时事通讯订阅者增加了 10k)
有能力搜索超出训练范围的新信息
具有长期和短期记忆能力
这些功能在某种程度上都存在于 AutoGPT 中。然而,未来还有多种其他附加功能可以将代理与 ChatGPT 风格的聊天机器人区分开来。将这些包括以下内容:
为了实际了解代理如何初始化、确定优先级和执行这些任务的一些示例,我建议
作为“雇员”的代理:理解自主代理的简单启发式
媒体话语中已经有很多关于“人工智能抢走了人类工作”的言论。
相对而言,很少有人讨论人类在涉及人工智能的经济活动中的作用提升。
当狭义人工智能(即专用代理)开始占据法律、会计、辅导等日常决策工作时,将发生的关键范式转变不会是人类失业。最大的变化将是所有人类都有机会成为管理者。
假设我今天要创办一家公司。例如,我将为清醒好奇的人创建一个社交媒体平台。在过去,如果这个平台的 alpha 版本获得了足够的吸引力,我将被迫雇用许多角色来帮助平台扩展:产品经理与用户交谈并定义他们想要什么,工程师编写代码以满足用户需求,营销人员将产品交到更多用户手中,法律顾问确保整个操作合规等等。
在一个拥有通过“员工测试”的有效代理的世界中(即,在外部观察者看来,特定角色的代理的输出与人类的输出相同),我可以单独运行整个操作。
那么,如果我们都想成为这些复杂组织的管理者,我们需要使用哪些工具才能有效、安全和盈利地做到这一点?
常见问题
过去几个月,人工智能取得了很大进展。但还有很长的路要走。
如果您现在使用这些工具,您会注意到许多缺点,这些缺点会阻止它们满足“员工测试”。
个性化
首先,这些代理人产生的许多书面输出往往缺乏“声音”的创造力或独创性。如果代理的目的是准备法律文件或为新产品进行市场分析,那么这一点就无关紧要了。然而,如果它们用于品牌建设任务或提升其人类“经理”的声誉,则意义重大。
为了克服这种个性化障碍,座席需要了解经理的预期声音。实现这一目标的最佳方法是根据经理的公开(例如博客文章)和私人(例如电子邮件)输出来培训代理。这里的一大障碍就变成了对代理根据这些数据负责任地采取行动的信任。需要建立哪些机制来确保这种信任?
可靠性
第一代自主智能体最常被提及的缺点可能是容易产生幻觉。
对于外行来说,人工智能背景下的幻觉是指机器自信地断言错误答案的倾向。就当前一代智能体而言,这形成了令人失望的匹配,因为它倾向于陷入循环,继续返回到先前的任务而不是朝着输出前进。
为了使代理在主流受众中达到合理的普及程度(更不用说在工作环境中使用自己的设备),他们需要达到一定程度的可靠性,以匹配并最终超越人类代理的能力完成工作并对他们的工作进行事实核查。有关幻觉在实践中的副作用的例子,只需看看
就这一领域的机会而言,第一个是显而易见的。创建不会产生幻觉的代理。然而,其次,将存在以下方面的临时市场:i) 代理的可靠性测试;ii) 对能够对这些代理协议进行对抗性攻击进行严格压力测试的产品的市场和需求。这些概念将帮助设计代理达到广泛采用所需的可靠性和安全性水平。
个性化
就目前情况而言,如果你和我同时在 ChatGPT 中输入相同的提示,我们将得到相同的输出。由于多种原因,这对于人工智能实用程序来说是一个极其限制的功能。首先,对任何给定提示的通用答案将使人工智能领域的中心化领导者变成人类知识和输出的庞然大物。如果每个人都开始依赖日益先进的工具来工作和娱乐,那么一切都将趋向于统一标准,该标准由获胜模型所接受的训练决定。如果这听起来令人担忧,那是因为事实确实如此。
更重要的是,它让事情变得无聊。对于非客观问题或需要以某种风格执行的任务,只有代理利用对用户的一些理解来调整他们的论点和输出才有意义。这对于我们愿意让他们代表我们采取行动的未来至关重要。
需要进行一些验证,以确保我们的代理能够忠实地代表我们在代理存在之前的身份。
安全
让机器代替你操作,处理你的敏感数据,甚至可能作为你的会说话、打字的复制品,即使对最先进的技术专家来说,这听起来也是一种威胁。让代理访问企业级数据仍然是另一回事。
那么,如何才能将安全和隐私风险降低到以下程度:i) 个人可以信任代理代表他们行事,ii) 企业可以无懈可击地保证其信息和活动免受攻击、盗用或利用?
一些隐私机制现在已经到位,并且可能比您想象的更基础。双因素身份验证将成为私人代理使用的筹码。
至于特定于代理的风险,下面的 RFS 概述了更多防止不当行为或操纵的机会。
互操作性
进一步扩展上述“代理人作为雇员”的类比——为了形成一个有效的组织,这些代理人需要能够有效地相互协调。除了组织层面之外,为了彻底重塑商业生态系统和更广泛的经济体,代理组织还必须学习如何与其他代理组织进行协调。从这里开始,协调问题开始变得复杂(就像人类社会中的情况一样)。
在正在完成的工作的带领下,已经出现了一些有前景的代理间通信协议的早期迹象。
代理之间的通信很棒,但仅代表协调活动代理方面的第一步。
一些需要考虑的协调问题的例子:
我相信,一旦这些大杂烩问题得到解决,人类就将顺利走向“没有雇员”的社会。一旦我们完全排名第二,那么做基本的、重复性的任务还有什么意义呢?
当人工智能变得无处不在时,员工主义的丧失常常与意义的丧失混为一谈。我相信情况几乎完全相反。当人工智能“取代我们的工作”时,这将是一种范式转变,让每个人从农奴变成管理者。每个人都会有一套能力出众、可靠的伙伴,可以走出去,把他们想要看到的东西带入世界。人类在这个世界上的关键“工作”就是管理这些同伴来执行你想要看到的愿景。
因此,这篇文章的标题。自主代理的渗透将导致所有个人从任务猴子到管理者的巨大晋升。
用户友好的代理部署工具。代理以及最终整个人工智能的首要原则是任务自动化。
使用该定义,
Alex Lieberman 的上述想法为思考个人和企业层面的自动化未来提供了一个起点。 Zapier 的问题是需要用户对其工作流程进行逆向工程。那些经过直观训练或通过训练用户工作流程的工具怎么样?
为了有效管理个人座席范围,最基本的利用机会是针对个人座席的 CRM 。这样的 CRM 将充当每个代理的指示/提示/意图的单一事实来源,供个人使用。这可以与单独的仪表板集成以进行代理绩效管理。
对于希望更少参与代理部署或定制的用户,可以使用开箱即用的通用代理包。随着代理生产力得到证明,市场很有可能发展为人们购买预先训练的代理集,这些代理集可以根据角色描述执行预定义的任务集。
个人代理部署的设计空间可以追随现有开发人员部署工具(如 Log10 或 Superagent)的脚步。尽管这些工具非常适合管理代理部署,但它们并不是为对代理或自动化工作原理知之甚少的最终用户而设计的。
代理人资源配置的激励机制。无论超级智能体变得如何,他们将始终依赖资源来维持运作。机器大脑就像人类大脑一样需要营养。正如整个人类经济的发展都是围绕着将食物放在我们盘子里的需要一样,整个代理经济也将致力于将稀缺资源分配到最需要的地方。
在代理经济中,需要市场来分配以下内容:
传感器和执行器是这个难题中另外两个可扩展的部分,它们并不通用,但将受到代理的需求。因此,它们将在下面的另一部分中介绍。
我长期以来一直认为加密货币将成为这些经济体的交换手段。程序化数字代理将需要程序化数字货币。
在这个假设的支持下,如何设计加密网络来最好地分配和激励代理之间共享这些稀缺的、支持 API 的资源,以便始终充分发挥它们的最大潜力?可以理解的是,这种代币的市场规模是巨大的,它可以使自己成为人类经济数字复制品的交换手段。正如我们在加密货币领域所看到的那样,在帮助这些网络扩展方面将会有衍生机会——捆绑代理请求需要什么?我们是否需要新的非人类交易结算方式?
这里容易实现的另一个事实是,代理商可能会需要代理商特定的钱包。正如世界币等协议竞相开发人性证明一样,我们甚至可能会看到反向机器证明,以便运行某些特定于代理的协议(如数字钱包)。
重塑非人类经济需要提出许多问题。
功能性代理的市场。我们现在正处于自主代理生命周期的一个阶段,其中的工作主要集中在开发人员身上。最终,市场将转向提供现成的解决方案,这些解决方案几乎不提供定制功能,但易于部署和管理。
这为任何希望为自主代理建立交易所或市场的先行者创造了巨大的机会。人们不仅能够购买通用形式的代理来快速、廉价地部署,而且开发人员还可以通过开发更先进、更具体的代理来满足不同的用户需求,从而获得收入。就像过去任何类别的商品或服务一样,我们将看到不同级别的声望具有不同的价格点。
开发商(或开发商代理商)会想方设法对高接触性、白手套代理商解决方案收取高价,以提供给想要一流产品的人们。同样,企业将愿意为具有安全和隐私黄金标准保证的代理商支付更多费用。
代理租赁市场也将蓬勃发展——承担临时任务的人们可能不想以市场价格购买新代理。人们愿意租用代理人,因为他们在使用时可以得到培训和改进。我们可能会看到金融市场的出现,人们将其代理人作为抵押品,供其他方出租以换取预付现金,并且代理人有可能通过在租赁期内的使用来接受培训。
就像当前的网络一样,市场空间不会仅限于一个主导者。对于不同的用户、不同的价格点和不同的规格,将会有一个丰富的不同市场的生态系统。这使得代理市场成为一个极其丰富的设计空间。
通用任务协调员。这几乎是上面“新扎皮尔”点的延伸。拥有一支可供调遣的特工大军,我们如何确保他们都达成共识?
需要使用工具来确保每个代理的初始目标和任务优先级输出与总体“组织”或整体目标相匹配。
从这个意义上讲,任务协调员的愿景在短期内可能是一个人机交互系统,可以监控座席活动(可能通过如上所述的 CRM)以确保这一点并使他们走上正确的轨道。最终,基于这种人类反馈,可以设计出足够准确的协议来映射代理优先级,以适应更广泛的组织或个人目标。
物联网代理。我不会是第一个或最后一个提出这个问题的人:人工智能和空间计算在哪里互连?
我在上一篇文章中已经简要谈到了这一点。随着我们向完全个性化的用户代理迈进,他们不可避免地会参与我们的自然生活环境(除了我们的增强/虚拟/扩展环境)。
最明显的应用将是在物联网中。烹饪牛排并需要按照您的伴侣喜欢的方式进行烹饪?您的代理人可以在厨房里照顾。把鸡肉放在冰箱里太久了?过去的问题,您的代理已在 3 小时前告诉您并已派人执行该任务。这些物联网代理不仅仅是像今天的电话那样的通知“推动”系统,它们将了解您的个人情况,以便以方便且正确的时间间隔采取行动。
人类代理复制品。
尽管这就像一个玩具一样简洁,但它只是触及了人工智能使人们能够做的事情的表面,比如设身处地为别人着想,与任何你想要或要求的人交谈,或者在代理人的帮助下,生活几乎正如他们所做的那样。
随着自主代理开始学习如何复制人类行为并根据生活经验进行训练,它们将开始成为它们所代表的人类的代表。这为我们提供了一个了解能够生活在别人的身体和思想中的可能性的窗口。
例如,假设格莱姆斯想要更进一步
根据这些代理对某人的生物标记等的访问情况的详细程度,这种复制也可以应用于彼此分享生活经历和感受(即感受性)。确实是美丽的新世界。
顺便说一句,随着自主代理开始受到重视,一些人将不可避免地学会比其他人更好地利用这个工具。这将使那些投入时间教导和指导其代理人按照自己的最佳利益行事的人能够为其代理人的复制创造市场以供其他人使用,从而避免培训自己的代理人的学习曲线和技术细节。
用于传感器和其他执行器的特定于代理的网络。为了充分发挥其执行潜力,大多数智能体将需要使用某种形式的物理执行器来将其智能变为现实。
需要为不同代理创建市场以在给定时间访问不同执行器的网络来满足将这种智能带入现实世界的不可避免的需求。一旦自主代理从信息工作领域过渡到重工业领域,这一点将变得尤为重要。
在不久的将来,自主代理将会比机器人更多,因为构建软件的限制比构建硬件的限制要少。因此,缺乏物理“身体”来执行这些代理想要进行的体力工作。这为代理经济创造了事实上的劳动力市场。
一旦出现这种情况,人类劳动力市场的哪种经济机制将适用?机器人所有者可以向代理收取多少物理时间的租金费用?机器人(或其他执行器)是否需要根据代理的规格进行标准化或专业化?随着由人工智能控制的机器执行器开始占据生活环境,许多悬而未决的问题已经成熟。
就像在 web2 中一样,数据是一种重要的商品,人们愿意为访问提供数据的渠道(例如 Google Ads)付费。在自主时代,传感器将成为重要的数据“供应商”。摄像头、GPS、LiDaR 和一整套其他传感器将被用来为代理提供实时决策数据。因此,我们将需要 i) 网络来促进代理之间的数据交换,以及 ii) 允许代理实时传送这些数据的预言机。
代理标准化和互操作性协议。为了使自主代理能够有效地相互协调,需要通用标准来克服数字“语言障碍”。要实现这一目标需要采取什么措施?
中间件系统是一种解决方案,它们充当中介,将消息从一个代理“翻译”到另一个代理。或者,人们可以构建互操作性 API 或 SDK 来简化集成或翻译过程。第三,对于新型模式的自下而上的标准开发新型市场有很大的空间,这些模式可能刚刚开始遇到,或者过去已经证明对代理协调来说很麻烦。
高级应用程序的代理测试网。为了完全信任拥有个人工具或信息的代理,个人将创建安全的沙箱环境来了解他们的工作方式。
测试网很可能会成为人工智能安全的公共产品,但这仍然是一个雄心勃勃且有影响力的项目。
机器道德的公共投票机制。我在上一篇文章中讨论了对人机交互市场的持续需求,以确保人们能够参与与负责任的人工智能开发相关的经济增长和投票程序。
更多想法:
如果没有以下资源的启发,这篇文章是不可能写成的:
玩具
时事通讯和播客
推特消息
也发布在这里。