在过去六个月左右的时间里,我们见证了大型语言模型在公共和商业上的突破。不可否认,像 ChatGPT 和 GPT-4 这样的 AI 模型令人印象深刻且有用,但我们看到的只是经过精心打磨的最终结果。在用户友好的表面之下,我们看不到用于培训 GPT-4 的1 亿美元投资、它留下的沉重碳足迹,或者发展中国家长时间工作以过滤有毒内容的低薪工人对于 ChatGPT。
此外,大型语言模型已经针对几代用户生成的内容、集体的、无偿的努力进行了训练,我们现在可以付费访问这些内容。从这个角度来看,现代大型语言模型令人难以置信的能力可能有点具有欺骗性,这是技术垄断企业与公众之间知识和权力差距的自然结果。我们正在享用美食风格的美味、昂贵的牛排,却没有意识到屠宰牛和准备肉的无偿劳动。
现在是立法者介入并规范人工智能的开发和使用的时候了。这项工作要求立法者具有非凡的预见性。到欧盟人工智能法案等新法规最终生效时,情况可能与今天大不相同。
据称, ChatGPT 已经打破了欧盟委员会对 AI 的监管计划。而现在,随着 ChatGPT 和其他大型语言模型受到欧盟委员会的关注,包括 OpenAI 首席执行官 Sam Altman 在内的许多专家都表示, 大型 AI 模型的时代已经结束。
大型科技公司竞相以越来越诱人的措施吸引人们的注意力,而立法者则落后了几圈。乌龟能够在这场特殊的比赛中击败兔子的唯一方法是,如果监管机构能够预见未来数年和数十年的发展。
从最近的发展来看,人工智能的下一件大事很可能是自主代理。
我将自主代理视为下一代高级聊天机器人。虽然 ChatGPT 对于执行简单的、基于文本的任务很有用,但下一代高级聊天机器人具有更多的代理能力。换句话说,他们将能够在没有太多或任何人为影响的情况下自行行动。
截至今天,广泛使用自治代理的技术还没有准备好。然而,这并不意味着我们不应该这样做。以下是对近期发展的简要概述。
一个月前, OpenAI 宣布他们已经在 ChatGPT 中实现了对插件的初步支持。
新的网络浏览器插件使 ChatGPT 可以访问互联网并检索其训练数据之外的最新信息。自 ChatGPT 面世以来,用户一直要求的一项功能。 OpenAI 的另一个新插件是一个实验性代码解释器,它可以在沙箱环境中使用 Python,处理上传和下载,让程序员和没有该领域技能的对编程感兴趣的人的生活更轻松。
借助 Klarna、Expedia、OpenTable Shopify、Zapier 和 Slack Chat 等第三方服务的附加插件,GPT 可以帮助您挑选最优惠的价格和折扣、提供旅行提示、编写购物清单和购买杂货、预订晚餐,撰写商务电子邮件并在 Gmail 中发送或通过 Slack 中的聊天消息发送。
本月早些时候,Hugging Face 发表了一篇论文: HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face 。
作者展示了 ChatGPT 如何作为控制器使用语言来管理现有的 AI 模型。通过连接 ChatGPT 和其他 AI 模型,您可以提示 ChatGPT 不仅可以生成文本、图像、视频和音频,还可以跨不同格式的内容识别和描述对象。
例如,您可以将 document.jpg 上传到 ChatGPT,要求它检索您正在寻找的一些信息,并让它为您大声朗读文本。或者你可以提示ChatGPT统计一张图片中某些物体的数量,然后对图片进行详细的描述,并根据描述制作视频。
通过这种方式,ChatGPT 可以利用其他 AI 模型来解决复杂的 AI 任务。
上周,#AutoGPT 成为 Twitter 上最热门的话题标签。 AutoGPT 已成为开源开发人员极受欢迎的研究和实验领域。
本质上, AutoGPT和BabyAGI或微软的 Jarvis等开源模型旨在为 GPT 3.5 或 GPT-4 等大型语言模型的“大脑”提供手臂和双手,以根据定义的目标或目的执行任务。例如,您可以要求 AutoGPT 找到附近最好和最便宜的餐厅并预订餐桌。或者你可以要求它摧毁人类,建立全球统治地位,并获得永生。通过访问大型语言模型、互联网并配备长期和短期记忆,AutoGPT 此后将提示自己执行任务以实现既定目标。
虽然 AutoGPTs 需要一些编码技巧才能设置和使用,但您可以试用基于网络的版本AgentGPT来体验一下。
在斯坦福大学和谷歌研究院最近进行的一项实验中,所谓的“生成代理”模拟人类行为,并在让人联想到《模拟人生》的模拟世界中自行行动。根据论文:
通过将我们的架构连接到 ChatGPT 大型语言模型,我们在游戏环境中展示了一个由 25 个代理组成的小型社会。最终用户可以观察这些代理并与之交互。例如,如果最终用户或开发人员希望城镇举办游戏中的情人节派对,传统的游戏环境将需要手动编写数十个角色的行为脚本。我们证明,对于生成代理,简单地告诉一个代理她想举办一个派对就足够了(..)他们传播关于派对的信息然后出现,一个代理甚至要求另一个代理约会聚会,全部来自这个单一的用户生成的种子建议。
您可以在此处关注模拟模拟人生环境中的生成代理。
在我看来,将自主代理视为个人数字助理的最简单方式。他们就像无处不在的管家,可以照顾我们在数字世界中的需求。并帮助完成没人喜欢做的繁琐任务。随着人工智能在机构中的发展,不难想象我们最终会看到在没有员工或管理层的情况下蓬勃发展的自治公司。
自治代理将放大我们今天已经面临的人工智能和社交媒体严重问题的深度和规模。隐私、智能手机成瘾、AI 黑盒问题、对齐问题等问题将具有全新的含义。
如果您有兴趣关注我关于这些问题的文章但还没有这样做,您可以在此处订阅 The Gap。