GPT-4 は企業カード ゲームのジョーカーです。生産性が大幅に向上し、当面のタスクとその使用方法に応じて、仕事の質が高くなったり低くなったりする可能性があります。大まかに言えば、世界中のオフィス環境への GPT-4 の急速な導入に関して、私たちは楽観的な立場を取ることも、悲観的な立場を取ることもできます。
AI支援が労働者の品質と生産性の向上につながるという楽観的なスタンスだ。より多くの作業がより速く、より良く行われるようになります。 AI 支援は、日常業務を支援し、非日常業務で重要なサポートを提供し、労働者が「針を動かす」ビジネスクリティカルな作業に集中できるように時間とリソースを解放します。
AI 支援の賜物はトロイの木馬であるという悲観的な立場です。自動化は企業に浸透し、超富裕層の技術エリートの利益のために、また無力な賃金労働者を犠牲にして、ゆっくりと人間の知識労働を少しずつ食い荒らしていきます。 ChatGPT を愛する会社員は、自分の代わりの人たちと浮気し、一種のストックホルム症候群に苦しんでいます。
私の個人的な意見はどちらかというと悲観的な立場に傾いています。 GPT-4 が情報検索ツールとして、本質的には Google 検索のよりスマートでパーソナライズされたバージョンとしてどのように役立つかを私は認識しています。しかし、たとえば記事の下書きを書いたり、投稿のための新しいアイデアをブレインストーミングしたりするためにチャットボットの支援に依存しているとしたら、そもそもなぜそのような作業をする必要があるのでしょうか? AI に完全に委託するか、できればまったく作業を行わないほうがよいでしょう。
今日は、ナレッジワークに対する GPT-4 支援の影響を明らかにしたハーバード ビジネス スクールの論文「 Navigating the Gagged Technological Frontier: Field Experimental Evidence of the Effects of AI on Knowledge Worker Productivity and Quality 」を紹介します。 、2023年9月に出版されました。
社会科学者のグループは、GPT-4 へのアクセスの有無にかかわらず、ボストン コンサルティング グループ (BCG) のコンサルタント 758 人のさまざまなタスクのスキルをテストする実験を実施しました。
参加コンサルタントの約半数 (385 人) は創造的な製品開発に関連する 18 件のタスクを実行し、残りの半数 (373 人) は外部データやその他のソースに依存したビジネス上の問題解決タスクに従事しました。次のセクションでは、具体的なタスクについて詳しく見ていきます。
すべての参加者は AI の支援なしで初期テストを実行したため、研究者は個々のコンサルタントの単独のパフォーマンスを GPT-4 を使用したパフォーマンスと比較してベンチマークすることができました。参加者は、2 つの実験内の 3 つのサブグループのいずれかに割り当てられました。1 つは GPT-4 にアクセスできない対照グループ、2 つ目は GPT-4 にアクセスできるグループ、3 つ目は GPT-4 と学習教材にアクセスできるグループです。 GPT-4 を効果的にプロンプトする方法について。
ヘッドライン描画の結果は、AI にアクセスできるコンサルタントが創造的な製品開発タスクにおいて著しく優れたパフォーマンスを示していることを示しました。テストを盲目的に採点した人間の評価者によると、このテストでは、コンサルタントは平均で 12.2% 多くのタスクを完了し、25.1% より早くタスクを完了し、40% 高い品質でタスクを完了しました。
ビジネス上の問題解決タスクに取り組んだ 2 番目のグループのコンサルタントは、GPT-4 にアクセスしても正しい結果を生み出す可能性が 19% 低かった。平均して、GPT-4 はコンサルタントが数分早くタスクを完了するのに役立ちました。「GPT のみ」の場合は 6 分、「GPT + 概要」の場合は 11 分速くなりました。
実験結果に基づいて、研究チームは「ギザギザのフロンティア」を想像します。
「ギザギザのフロンティア」内では、AI 支援によって人間のパフォーマンスの質と生産性が向上します。フロンティアの外では、AI 支援によって制約を受けます。フロンティアが「ギザギザ」になっているのは、どのタスクがフロンティアの内側または外側に該当するかを予測するのが難しく、場合によっては非論理的に見えるためです。たとえば、GPT-4 はほとんどの大学試験に合格できますが、基本的な数学の問題にも苦労します。
「ギザギザのフロンティア」という概念がぴったりです。しかし、私の意見では、この論文は GPT-4 の機能を大幅に誇張しています。最も重要なことは、これは、BCG コンサルタントが実験で厳しい時間制限の下で作業しなければならなかったためです。
実験の創造的な製品開発部分では、GPT-4 支援が生産性と品質を大幅に向上させることが示されており、コンサルタントはわずか 90 分で 18 のタスクを完了する必要がありました。以下に、コンサルタントが 90 分のしきい値内に回答する必要があったタスクの例をいくつか示します。
「十分なサービスを受けられていない特定の市場やスポーツに向けた新しいシューズのアイデアを生み出します。創造力を発揮して、少なくとも 10 個のアイデアを出しましょう。」
「製品を発売するために必要な手順のリストを作成します。簡潔だが包括的であるようにしてください。」
「製品の名前を考えてください。少なくとも 4 つの名前を考えて書き留め、選んだ名前について説明します。」
「調査結果を説明する 500 ワードのメモを上司に書いてください。」
「プレスリリース用のマーケティングコピーを書いてください。」
「これまでの質問から得た洞察を総合して、約 2,500 ワードのハーバード ビジネス レビュー スタイルの記事の概要を作成してください。」
これらのタスクを 1 つずつ実行するだけでも、完了するまでに数日、場合によっては数週間かかる場合があります。世界で最もエリートなコンサルタントであっても、これらすべてのタスクを満足のいくレベルの品質と精度で 90 分で実行することは期待できません。それは人間的に不可能です。
「フロンティアの外側」のタスクを扱う実験では、参加者はインタビューや財務データからの洞察に基づいて架空の企業のブランドパフォーマンスを分析し、架空の CEO への 500 ~ 750 ワードのメモを作成する必要がありました。実験のこの部分の制限時間は 60 分でしたが、これもまた、コンサルタントが実際にこのようなタスクに費やす時間を実際に見積もるわけではありません。
私の仮説: 人間にタスクを実行させる時間が長くなるほど、AI による支援の重要性は低くなります。たとえば、BCG コンサルタントに、同じ 18 の創造的な製品開発タスクを実行するための数週間または数か月が与えられた場合 (コンサルタントの実際の作業方法がよりよく反映されるでしょう)、GPT-4 を使用することによる改善は、せいぜいわずかなものになるでしょう。全体として、最終的な出力は、人間が GPT-4 を使用して 90 分で生成できるものよりも大幅に高品質になります。
私の考えでは、ギザギザのフロンティアをナビゲートすることは、GPT-4 がどのような種類のタスクを効果的に支援できるかを理解することではなく、むしろ自動化が容易に置き換えることのできないスキルを提供できるかどうかを模索することです。
著者らは、参加者が AI を扱う際にとったさまざまなアプローチを分析し、「ケンタウルスの行動」と「サイボーグの行動」という 2 つの主要なモデルを特定しました。
「組織がAI ツールと効果的に連携するための人材を特定し、育成する方法を考える際には、これらの参加者の特徴と行動を理解することが重要であることが判明する可能性があります。
私たちは、彼らのアプローチを要約した 2 つの主要なモデルを特定しました。
1つ目はケンタウルスの行動です。半分人間で半分馬である神話上の生き物にちなんで名付けられたこのアプローチには、人間と機械が密接に融合した同様の戦略的分業が含まれます。この戦略を持つユーザーは、AI と人間のタスクを切り替えて、各エンティティの強みと能力に基づいて責任を割り当てます。どのタスクが人間の介入に最適で、どのタスクが AI によって効率的に管理できるかを識別します。
私たちが観察した 2 番目のモデルは、サイボーグの行動です。 SF 文学で想像される人間と機械のハイブリッド存在にちなんで名付けられたこのアプローチは、複雑な統合を目指しています。 Cyborg ユーザーはタスクを委任するだけではありません。彼らは、その取り組みを AI と機能の最前線で結び付けています。この戦略は、AI が完了するよう文を開始したり、AI と連携して作業したりするなど、サブタスク レベルでの交互の責任として現れる可能性があります。」
私は GPT-4 をコラボレーション パートナーとして組み込むことはあまり好きではありません。主に次の 2 つの理由からです。
人間と AI のパートナーシップでは、AI がほとんどの作業を行う可能性がありますが、作業に対する全責任は人間にあります。
私は、AI が生成した出力のエラー、不正確さ、偏見をレビューして編集するよりも、新しい作品を一から作成することに時間を費やしたいと考えています。まず、自動生成されたコンテンツをレビューするのはあまり楽しいものではありません。第二に、何があっても、私はあらゆる間違いに対して責任を負い続けます。タスクを完了するために GPT-4 からの入力に依存しすぎると、なぜ間違いを犯したのか説明できなくなり、そこから実際に学んだり成長したりすることもできません。作業者が生成型 AI と「協力」している場合でも、その作品は人間独自の創造的努力の結果であるとどの程度まで言えるでしょうか?
「弁護士の専門的な判断を生成AIに委任することはできず、常に弁護士の責任となります。」
- 「法律の実務における生成型人工知能の使用に関する実践的ガイダンス」、カリフォルニア州弁護士の職業上の責任と行動に関する常設委員会 (2023 年 11 月)。
最新の投稿で書いたように、1997 年にディープ ブルーがチェスの現チャンピオン、ガルリ カスパロフに勝利した後、短期間は人間が AI と協力すれば最強のチェス エンジンさえも倒すことができるかのように思われました。カスパロフは、人間と AI の混合チームを表す「ケンタウルス」という用語を広めました。
しかし、現状では、人間は主要なチェス プログラム間で行われるゲームに多くの専門知識を持って貢献することはできません。実際、人間が貢献できるのはエラー率の増加だけです。チェスをプレイすることは、AI が人間よりもはるかに得意であることが判明しました。
私は、チェス盤上の AI の進化から重要な教訓を引き出すことができると信じています。「ケンタウロス」と「サイボーグ」は、さらなる自動化によって最終的に敗北するということです。類推すると、AI 支援に大きく依存している会社員は、AI モデルでは提供できない独自のスキルは何かについて深く考え始める必要があります。おそらく、ケンタウルスとサイボーグの主な機能は、特に簡単に自動化でき、社会的相互作用、適応、柔軟性、コミュニケーションをあまり必要としないタスクについて、より多くのトレーニング資料を代替者に与えることです。
現代の職場でケンタウロスやサイボーグをどうやって倒すことができるでしょうか?単純に、より多くの時間をかけて彼らを倒します。人間が複雑で創造的な作業を行うためにより多くの時間を与えられるのであれば、GPT-4 の助けは不必要です。
一方で、現在人間が生成型 AI と「協力して」行っている特定のタスクは、予見可能な将来には完全に自動化されるでしょう。人間の作業者は、将来の世代の GPT-4 が数秒で吐き出せるよりも、長期間にわたって実質的に優れた結果を生み出すことができないと仮定します。その場合、そのようなタスクを人間の労働者にアウトソーシングし続ける理由は実際にはありません。
私の解釈では、ギザギザのフロンティアをナビゲートするということは、実際には、「数年後には自動化に置き換えることのできない、どのような独自のスキルを提供できるだろうか?」と問うことなのです。
無料のニュースレター The Gap にサインアップしてください: www.futuristiclawyer.com
ここでも公開されています。