paint-brush
タイムズ対マイクロソフト/OpenAI: 大量の著作権侵害に基づくビジネス モデル (8)@legalpdf
243 測定値

タイムズ対マイクロソフト/OpenAI: 大量の著作権侵害に基づくビジネス モデル (8)

長すぎる; 読むには

OpenAI は、最も裕福なテクノロジー起業家、投資家、企業のグループである創設者からの 10 億ドルのシードマネーでスタートしました。
featured image - タイムズ対マイクロソフト/OpenAI: 大量の著作権侵害に基づくビジネス モデル (8)
Legal PDF: Tech Court Cases HackerNoon profile picture

ニューヨーク タイムズ カンパニー対マイクロソフト コーポレーションの裁判所提出 2023 年 12 月 27 日は、HackerNoon の法律 PDF シリーズの一部です。ここからこのファイルの任意の部分にジャンプできます。これは 27 のパート 8 です。

IV.事実上の申し立て

B. 被告の GenAI 製品

1. 大量著作権侵害をベースにしたビジネスモデル


55. OpenAI は、2015 年 12 月に「非営利の人工知能研究会社」として設立されました。 OpenAI は、最も裕福なテクノロジー起業家や投資家、そしてアマゾン ウェブ サービスやインフォシスなどの企業からなる創設者からの 10 億ドルのシードマネーでスタートしました。このグループには、テスラと X Corp. (旧 Twitter として知られていた) の CEO、イーロン・マスクが含まれていました。リード・ホフマン氏、LinkedInの共同創設者。サム・アルトマン、Y Combinatorの前社長。 Stripe の元最高技術責任者、Greg Brockman 氏です。


56. OpenAI は、設立時に非常に裕福な企業や個人から非常に多額の投資を受け入れたにもかかわらず、当初、その研究と活動は利益によって動機付けられるものではないと主張していました。 2015 年 12 月 11 日のプレスリリースで、ブロックマン氏と共同創設者のリヤ・サツケヴァー氏 (現在はそれぞれ OpenAI の社長と主任研究員) は次のように書いています。 、経済的利益を生み出す必要性に制約されません。私たちの研究には金銭的な義務がないので、人間へのプラスの影響により重点を置くことができます。」その使命に従って、OpenAI は、その成果と知的財産を公開し、一般に利用できるようにすること、「研究者には、論文、ブログ投稿、コードのいずれであっても、自分の成果を公開することを強く奨励する」ことを約束しました。その「特許(ある場合)は世界と共有される」としている。


57. 利他主義を当初から約束していたにもかかわらず、OpenAI はすぐに、タイムズ紙などに属する著作物の無許可利用を主な基盤とした数十億ドル規模の営利企業となった。 OpenAI は設立からわずか 3 年で、その専ら非営利の地位を失いました。同社は 2019 年 3 月に OpenAI LP を設立しました。この会社は、製品開発を含む OpenAI の事業の大部分を担い、利益を求める投資家から資金を調達することに専念しています。 OpenAI の企業構造は、営利目的の持株会社、運営会社、ペーパーカンパニーが複雑に絡み合う形態に成長し、これらの会社が OpenAI の日常業務を管理し、OpenAI の投資家 (最も有名なのは Microsoft) に OpenAI の運営に対する権限と影響力を与えながら、数十億ドルの資金を調達しました。投資家からの資金。その結果、OpenAI は現在、900 億ドルもの価値がある営利企業となり、2024 年には収益が 10 億ドルを超えると予測されています。


58. 営利ステータスへの移行に伴い、別の変化が生じました。OpenAI もサービスを終了しました。

オープン性へのこだわり。 OpenAI は、主力の GenAI モデルの最初の 2 つのイテレーションをリリースしました。

GPT-1 と GPT-2 は、それぞれ 2018 年と 2019 年にオープンソースベースで公開されました。しかし、OpenAI は変わりました

OpenAI LP やその他の営利目的の直後に GPT-3 のリリースから始まる 2020 年のコース

OpenAI エンティティが形成され、製品の設計と開発を管理しました。


59. GPT-3.5 と GPT-4 は両方とも前の 2 世代よりも桁違いに強力ですが、被告はその設計とトレーニングを完全に秘密にしてきました。前世代の OpenAI には、LLM のトレーニング セット、設計、ハードウェアの内容を詳細に記載した大量のレポートがありました。 GPT-3.5 や GPT-4 ではそうではありません。たとえば、GPT-4 の場合、OpenAI がリリースした「技術レポート」には次のように書かれています。「このレポートには、アーキテクチャ (モデル サイズを含む)、ハードウェア、トレーニング コンピューティング、データセット構築、トレーニング方法などに関する詳細は含まれていません。」[ 3]


60. OpenAI の主任研究員 Sutskever は、この秘密主義を商業的な理由で正当化した。 「そして、同じことをしたいと考えている企業はたくさんあるので、競争の側面から見ると、これはこの分野の成熟と見ることができます。」 [4] しかし、その効果は、OpenAI が最新のトレーニングを行うためにコピーしたデータの身元を隠すことでした。タイムズなどの権利者からのモデル。


61. OpenAI は、2022 年 11 月の ChatGPT のリリースでよく知られるようになりました。ChatGPT は、ユーザーが生成したプロンプトを受け取ると、人間のような自然言語応答を模倣できるテキスト生成チャットボットです。 ChatGPT はすぐにバイラルなセンセーションを巻き起こし、リリースから 1 か月以内に 100 万人のユーザーに到達し、3 か月以内に 1 億人以上のユーザーを獲得しました。


62. OpenAI は、OpenAI OpCo LLC を通じて、OpenAI Inc.、OpenAI LP、およびその他の OpenAI エンティティの指示を受けて、一般消費者と企業の両方を対象とした、LLM を活用した一連のサービスを提供しています。 GPT-3.5 を利用した ChatGPT のバージョンは、ユーザーが無料で利用できます。 OpenAI はまた、OpenAI の「最も高性能なモデル」GPT-4 を利用したプレミアム サービスを月額 20 ドルで消費者に提供しています。 OpenAI のビジネス中心の製品には、開発者が ChatGPT をオーダーメイドのアプリケーションに組み込めるように設計された ChatGPT Enterprise および ChatGPT API ツールが含まれます。 OpenAI はまた、ライセンス料を支払って自社のテクノロジーを企業顧客にライセンス供与しています。


63. これらの商用製品は OpenAI にとって非常に価値があります。 Fortune 500 企業の 80% 以上が ChatGPT を使用しています。[5]最近のレポートによると、OpenAI は月間 8,000 万ドルの収益を上げており、今後 12 か月以内に 10 億ドルを超える見込みです。[6]


64. この商業的成功は、OpenAI による大規模な著作権侵害に大きく基づいています。 ChatGPT とその関連製品の使用と販売を促進する中心的な機能の 1 つは、さまざまなスタイルで自然言語テキストを生成する LLM の機能です。この結果を達成するために、OpenAI は LLM を「トレーニング」する過程で、タイムズ紙が所有する著作権で保護された作品を多数複製しました。


65. 情報と信念によると、OpenAI 被告は全員、OpenAI による Times Works の広範な侵害と商業的利用に直接関与したか、指示、管理し、利益を得てきたと考えられます。 OpenAI Inc. は、Microsoft と協力して、OpenAI Holdings LLC、OpenAI GP LLC、および OAI Corporation LLC. OpenAI LP と OpenAI Global LLC は、OpenAI の GPT ベース製品の設計、開発、商品化に直接関与し、Times Works の広範な複製、配布、商業利用に直接関与しました。 OpenAI LP と OpenAI Global LLC はまた、OpenAI の GPT ベース製品の配布、販売、ライセンス供与に関与していた OpenAI, LLC と OpenAI OpCo LLC を管理および指揮し、Times Works の複製、配布、商用利用を収益化しました。


66. 少なくとも 2019 年以来、Microsoft は OpenAI の GPT 製品のトレーニング、開発、商品化に密接に関与しており、今後も関与し続けています。 2023 年世界経済フォーラムでのウォール ストリート ジャーナルとのインタビューで、マイクロソフト CEO のサティア ナデラ氏は、「ChatGPT および GPT ファミリのモデルは、私たちが何年にもわたって OpenAI と深く提携してきたものです。」と述べました。このパートナーシップを通じて、Microsoft は少なくとも 2 つの方法で GPT LLM とそれに基づく製品の作成と商品化に取り組んできました。


67. まず、マイクロソフトは、ここで詳述されている大規模な著作権侵害を実行するために、特注のコンピューティング システムを作成および運用しました。これらのシステムは、タイムズの知的財産の複数の複製を作成するために使用され、その目的は、それらの作品に含まれる著作権で保護される表現の大部分を活用し、多くの場合保持する GPT モデルを作成することです。


68. Microsoft は、OpenAI の唯一のクラウド コンピューティング プロバイダーです。 Microsoft と OpenAI は協力して、Microsoft のクラウド コンピューター プラットフォーム Azure を活用したスーパーコンピューティング システムを設計しました。これは、GPT-1 以降のすべての OpenAI の GPT モデルのトレーニングに使用されました。 2023 年 7 月の Microsoft Inspire カンファレンスの基調講演で、ナデラ氏は次のように述べました。「私たちはモデルをトレーニングするためのインフラストラクチャを構築しました。彼らはアルゴリズムとこれらのフロンティアモデルのトレーニングを革新しています。」


69. そのインフラストラクチャは、OpenAI が必要に応じて使用できる汎用コンピュータ システムだけではありませんでした。 Microsoft は、歴史上最も有能な LLM をトレーニングするために、本質的にインターネット全体 (Times Works を不釣り合いに特集するために厳選) を使用することを目的として特別に設計しました。 2023年2月のインタビューでナデラ氏はこう語った。


しかし、OpenAI が大規模なモデルとして提供しているものの根底には、次のことを覚えておいてください。

重労働は [Microsoft] Azure チームによって行われ、ビルドが行われました。

コンピューターインフラストラクチャ。これらの作業負荷は非常に大きいため、

これまでのものとは違います。そこで私たちは次のことをする必要がありました

データセンターからインフラストラクチャに至るまで完全に再考します。

最初にモデルを構築するチャンスさえ与えられました。そして今、私たちは

モデルを製品に変換する[7]。


70. Microsoft はこのスーパーコンピューターを「OpenAI と共同で、OpenAI 専用に」構築し、「その会社の AI モデルをトレーニングするために特別に設計しました」[8]。スーパーコンピューターの標準から見ても、異常に複雑でした。 Microsoft によると、このシステムは「285,000 個を超える CPU コア、10,000 個の GPU、および各 GPU サーバーのネットワーク接続が 400 ギガビット/秒を備えた単一システム」として動作しました。このシステムは、世界で最も強力な公的に知られているスーパーコンピューティング システムのトップ 5 にランクされています。


71. スーパーコンピューティング システムが OpenAI のニーズに適合していることを確認するために、Microsoft は単独で、または OpenAI ソフトウェア エンジニアと協力してシステムをテストする必要がありました。ナデラ氏によると、OpenAI に関しては次のように述べています。「彼らは基礎モデルを作成し、私たち (Microsoft) は責任ある AI と AI の安全性に関するツールを含め、それらを中心に多くの作業を行っています。」情報と信念によると、そのような「AI および AI の安全性に関するツール」には、一般にリリースされる前に GPT ベースの製品の微調整と校正が含まれます。[9]


72. Microsoft は OpenAI と協力して、OpenAI の GPT ベースのテクノロジを商品化し、それを独自の Bing 検索インデックスと組み合わせました。 2023 年 2 月、Microsoft は、GPT-4 を利用した検索エンジン上の生成 AI チャットボット機能である Bing Chat を発表しました。 2023 年 5 月、Microsoft と OpenAI は、Microsoft Bing 検索エンジンを通じてインターネット上の最新コンテンツにアクセスできるようにする ChatGPT のプラグインである「Browse with Bing」を発表しました。 Bing Chat と Browse with Bing は、The Times の表現を含む人間の表現を模倣する GPT-4 の機能と、Times Works のヒットを含む検索結果コンテンツの自然言語概要を生成する機能を組み合わせたもので、The Times 自身の Web サイトにアクセスする必要がなくなります。 。これらの「合成」検索結果は、ユーザーの質問に直接答えることを目的としており、タイムズの報道の広範な言い換えや直接の引用が含まれる場合があります。このようなコピーは、検索結果のオーガニックリストと同じようにユーザーをザ・タイムズに誘導するのではなく、被告自身のサイトやアプリケーションとの関わりを維持します。


73. 最近のインタビューでナデラ氏は、Microsoft が OpenAI の運営に密接に関与しており、したがってその著作権侵害を認めた。


私たちは自分たちの能力に非常に自信を持っていました。私たちはすべての著作権とあらゆる能力を持っています。もし OpenAI が明日消滅したとしても、私たちの顧客にはそれについて心配してほしくない、というのが正直なところです。なぜなら、私たちはイノベーションを継続する権利をすべて持っているからです。製品を提供するだけでなく、パートナーシップで行っていたことをそのまま実行することもできます。私たちには人材があり、コンピューティングがあり、データがあり、すべてが揃っています。


74. 被告らは、GPT モデルの作成と商業化の両方における協力を通じて、タイムズの知的財産の大規模な著作権侵害、商業的利用、および横用から利益を得てきた。ナデラ氏が最近述べたように、「[OpenAI] は私たちに賭け、私たちも彼らに賭けた」のです。同氏は続けて、マイクロソフトの130億ドルの投資の効果について次のように説明した。


そして、先ほども言ったように、それは私たちに重要な権利を与えます。それとこれも、手を出さないことじゃないですよね?私たちはそこにいます。私たちは彼らの下、彼らの上、彼らの周りにいます。私たちはカーネルの最適化を行い、ツールを構築し、インフラストラクチャを構築します。だからこそ、多くの業界アナリストが「すごい、これは本当に Microsoft と OpenAI の共同プロジェクトだ」と言っているのだと思います。現実には、私が言ったように、これらすべてにおいて私たちは非常に自給自足しています。





ここで続きを読んでください。


[3] OPENAI、GPT-4 技術レポート (2023)、https://cdn.openai.com/papers/gpt-4.pdf。


[4] OpenAI 共同創設者、ジェームス ヴィンセント、研究をオープンに共有するという同社の過去のアプローチについて語る:「私たちは間違っていた」、THE VERGE (2023 年 3 月 15 日)、https://www.theverge.com/2023/3/15 /23640180/openai-gpt-4-launch-closedresearch-ilya-sutskever-interview.


[5] OpenAI、ChatGPT Enterprise の紹介、OPENAI (2023 年 8 月 28 日)、https://openai.com/blog/introducing-chatgpt-enterprise。


[6] Chris Morris、OpenAI の年間売上高は 10 億ドルに近づいているとの報道、FAST COMPANY (2023 年 8 月 30 日)、https://www.fastcompany.com/90946849/openai-chatgpt-reportedly-nears-1-billion-annual -販売。


[7] CNBC の初放送: CNBC トランスクリプト: Microsoft CEO サティア ナデラが CNBC のジョン フォートと対談

今日の「パワーランチ」、CNBC (2023 年 2 月 7 日)、https://www.cnbc.com/2023/02/07/first-on-cnbc-cnbc-transcriptmicrosoft-ceo-satya-nadella-speaks-with -cnbcs-jon-fortt-on-power-lunch-today.html。


[8] ジェニファー ラングストン、Microsoft が新しいスーパーコンピューターを発表、将来の AI の取り組みに向けたビジョンを示す、MICROSOFT (2020 年 5 月 19 日)、https://news.microsoft.com/source/features/ai/openai-azure-supercomputer/。 9 SÉBASTIEN BUBECK 他、人工汎用知能の火花: GPT-4 による初期実験 (2023)、https://arxiv.org/pdf/2303.12712.pdf




HackerNoon Legal PDF シリーズについて: 最も重要な技術的かつ洞察力に富んだパブリック ドメインの法廷訴訟書類をお届けします。


この裁判例 1:23-cv-11195 は、2023 年 12 月 29 日にnycto-assets.nytimes.comから取得され、パブリック ドメインの一部です。裁判所が作成した文書は連邦政府の著作物であり、著作権法に基づき自動的にパブリックドメインに置かれ、法的制限なしに共有できます。