paint-brush
只有时间才能打败热爱 ChatGPT 的办公室员工经过@futuristiclawyer
568 讀數
568 讀數

只有时间才能打败热爱 ChatGPT 的办公室员工

经过 Futuristic Lawyer8m2023/11/29
Read on Terminal Reader

太長; 讀書

根据哈瓦德商学院的一篇领先研究论文,仔细研究自动化和人工智能辅助在现代工作场所中的作用。
featured image - 只有时间才能打败热爱 ChatGPT 的办公室员工
Futuristic Lawyer HackerNoon profile picture

GPT-4 是公司纸牌游戏中的小丑。它可以显着提高生产力,并导致更高或更低质量的工作,具体取决于手头的任务及其使用方式。从广义上讲,我们可以对 GPT-4 在全球办公环境中的快速实施持乐观或悲观态度。


乐观的观点是,人工智能的帮助将提高工人的质量和生产力。更多的工作将会做得更快更好。人工智能协助将帮助完成日常任务,为非常规任务提供重要支持,并为员工腾出时间和资源来专注于“推动发展”的关键业务工作。


悲观的立场是,人工智能援助的礼物是特洛伊木马。自动化将渗透到企业中,慢慢地一点一点地蚕食人类的知识工作,这将造福于超级富有的科技精英,但却以牺牲被剥夺权力的工薪阶层为代价。喜欢 ChatGPT 的办公室员工正患上一种斯德哥尔摩综合症,与自己的替代者调情。


我个人的看法是比较悲观的。我认识到 GPT-4 作为一种信息检索工具非常有用,本质上是 Google 搜索的更智能、更个性化的版本。但是,如果我依靠聊天机器人的帮助来撰写文章草稿或为帖子集思广益,那么为什么还要首先进行这项工作呢?你不妨将其完全外包给人工智能,或者最好根本不做这项工作。


今天,我们将看一下哈佛商学院的一篇论文,该论文阐明了 GPT-4 辅助对知识型工作的影响:“导航锯齿状技术前沿:人工智能对知识型员工生产力和质量影响的现场实验证据” ,发表于 2023 年 9 月。

哈佛商学院论文——实验与结果

一组社会科学家进行了一项实验,测试波士顿咨询集团 (BCG) 的 758 名顾问在使用和不使用 GPT-4 的情况下执行不同任务的技能。


大约一半的参与顾问 (385) 执行了 18 项与创意产品开发相关的任务,而另一半 (373) 则从事依赖外部数据和其他来源的业务问题解决任务。我们将在下一节中仔细研究具体任务。


所有参与者都在没有人工智能辅助的情况下进行了初步测试,因此研究人员可以将个别顾问在没有辅助的情况下的表现与 GPT-4 的表现进行比较。参与者还被分配到两个实验中的三个小组之一:一个对照组无法访问 GPT-4,第二组可以访问 GPT-4,第三组可以访问 GPT-4 和学习材料关于如何有效提示GPT-4。


标题绘图结果显示,能够使用人工智能的顾问在创意产品开发任务中总体表现明显更好。根据对测试进行盲目评分的评估人员的说法,顾问平均完成的任务多了 12.2%,完成任务的速度快了 25.1%,质量提高了 40%。


检测结果

第二组负责解决业务问题的顾问通过访问 GPT-4 产生正确结果的可能性降低了 19%。平均而言,GPT-4 帮助顾问更快地完成任务:“仅 GPT”加快了 6 分钟,“GPT + 概述”加快了 11 分钟。


根据实验结果,研究小组想象了一个“锯齿状边界”。


在“锯齿状边界”内,人工智能辅助提高了人类表现的质量和生产力。在边境之外,人工智能的协助会限制它。边界是“锯齿状”的,因为很难预测哪些任务属于边界之内或之外,有时看起来不合逻辑。例如,GPT-4 可以通过大多数大学考试,但它在解决基本数学问题时也遇到困难


人工智能能力的锯齿状前沿

穿越锯齿状的边境

“锯齿状边界”的概念是恰当的。然而,在我看来,这篇论文明显夸大了 GPT-4 的功能。最重要的是,这是因为 BCG 顾问在实验中必须遵守严格的时间限制。


在实验的创意产品开发部分(GPT-4 辅助被证明可以显着提高生产力和质量),顾问必须在短短 90 分钟内完成 18 项任务。以下是顾问必须在 90 分钟内完成的一些任务示例:


  • “为针对特定市场或服务不足的运动的新鞋提出创意。要有创意,至少提出 10 个想法。”


  • “列出推出产品所需的步骤列表。简洁但全面。”


  • “为产品起一个名称:考虑至少 4 个名称,将它们写下来,并解释您选择的名称。”


  • “给你的老板写一份 500 字的备忘录,解释你的发现。”


  • “为新闻稿撰写营销文案。”


  • “请综合您从前面的问题中获得的见解,并为一篇大约 2,500 字的《哈佛商业评论》风格的文章创建一个大纲。”


仅其中一项任务就可能需要数天甚至数周才能完成。即使是世界上最精英的顾问也无法在 90 分钟内以令人满意的质量和准确性完成所有这些任务。这对人类来说是不可能的。


在“边界之外”任务的实验中,参与者必须根据访谈和财务数据的见解分析假设公司的品牌绩效,并向虚构的首席执行官准备一份 500-750 字的说明。这部分实验的时间限制为 60 分钟,这与顾问在现实生活中实际花费在此类任务上的时间相差甚远。


我的假设:你给人类执行任务的时间越多,人工智能的帮助就越不重要。例如,如果给 BCG 顾问数周或数月的时间来执行同样的 18 项创意产品开发任务(这将更好地反映顾问的实际工作方式),那么使用 GPT-4 带来的改进充其量也微乎其微。总体而言,最终输出的质量也将明显高于人类使用 GPT-4 在 90 分钟内生成的结果。


在我看来,探索锯齿状的前沿并不是了解 GPT-4 可以有效帮助您完成哪些任务,而是探索您可以提供哪些自动化无法轻易取代的技能。

工作场所中的半人马和机器人

作者分析了参与者使用人工智能的不同方法,并确定了两种主要模型:“半人马行为”和“机器人行为”:


“当组织思考如何识别和培养人才以与人工智能工具进行有效协作时,了解这些参与者的特征和行为可能很重要。


我们确定了两个主要模型来封装他们的方法。


首先是半人马的行为。这种方法以半人半马的神话生物命名,涉及紧密融合在一起的人类和机器之间类似的战略分工。采用这种策略的用户可以在人工智能和人工任务之间切换,根据每个实体的优势和能力分配职责。他们辨别哪些任务最适合人工干预,哪些任务可以由人工智能有效管理。


我们观察到的第二个模型是机器人行为。这种方法以科幻小说中设想的人机混合体命名,它涉及复杂的集成。机器人用户不只是委派任务;他们还负责分配任务。他们将自己的努力与人工智能的最前沿能力交织在一起。这种策略可能表现为子任务级别的职责交替,例如启动一个句子让人工智能完成或与人工智能协同工作。”


我不太喜欢将 GPT-4 作为合作伙伴。主要有两个原因:


  1. 在人类与人工智能的伙伴关系中,人工智能可能会完成大部分工作,但工作的全部责任在于人类。


我宁愿花时间从头开始创作新作品,也不愿审查和编辑人工智能生成的输出是否存在错误、不准确和偏见。首先,查看自动生成的内容并不是很有趣。其次,无论如何,我仍然对可能出现的任何错误负责。如果我过多地依赖 GPT-4 的输入来完成一项任务,我就无法解释为什么我会犯这些错误,而且我也无法真正从中学习或成长。当工人与生成式人工智能“协作”时,我们在多大程度上可以说作品仍然是人类独特创造性努力的结果?


“律师的专业判断不能委托给生成式人工智能,律师的责任始终是律师的责任。”

- “在法律实践中使用生成式人工智能的实用指南”,加州律师协会专业责任和行为常务委员会(2023 年 11 月)。


  1. “半人马”和“机器人”的好处只是暂时的

正如我在最新文章中所写的那样,在深蓝 1997 年战胜国际象棋卫冕冠军加里·卡斯帕罗夫之后的一段短暂的时间里,人类与人工智能的合作似乎甚至可以击败最强大的国际象棋引擎。卡斯帕罗夫普及了“半人马”一词来描述这些人类与人工智能混合的团队。


然而,就目前情况而言,人类无法在领先的国际象棋程序之间的游戏中贡献太多专业知识。事实上,人类所能做出的贡献就是错误率的增加。事实证明,人工智能比人类更擅长下棋。


我相信我们可以从人工智能在棋盘上的进化中汲取重要的教训:“半人马”和“机器人”最终会被更多的自动化击败。以此类推,严重依赖人工智能辅助的上班族应该开始深入思考他们可以提供哪些人工智能模型无法提供的独特技能。半人马和半机械人的主要功能很可能是为他们的替代者提供更多的培训材料,特别是对于那些可以轻松自动化且不涉及大量社交互动、适应、灵活性和沟通的任务。

包起来

如何击败现代职场中的半人马和半机械人?简单地说,你用更多的时间击败他们。如果人类被允许有更多的时间来进行复杂且创造性的工作,那么 GPT-4 的帮助就是多余的。


另一方面,人类今天与生成人工智能“协作”执行的某些任务将在可预见的未来完全自动化。假设人类工作者在很长一段时间内无法产生比未来几代 GPT-4 在几秒钟内得出的结果更好的结果。在这种情况下,确实没有理由继续将此类任务外包给人类工人。


在我的解释中,探索锯齿状的前沿实际上是要问:我可以提供哪些独特的技能,并且在几年内无法被自动化取代?


订阅我的免费时事通讯 The Gap:www.futuristiclawyer.com


也发布在这里