DOE 対 Github (修正訴状) 法廷提出 (編集済み)、2023 年 6 月 8 日は、HackerNoon の法律 PDF シリーズの一部です。ここからこのファイルの任意の部分にジャンプできます。これは 38 件のパート 1 です。
原告 J. Doe 1、J. Doe 2、J. Doe 3、J. Doe 4 および J. Doe 5 (「原告」) は、彼ら自身および同様の立場にある他のすべての人を代表して、この集団訴訟の申し立て (以下「申し立て」) を提起します。 」)被告GitHub, Inc.に対する。マイクロソフト; OpenAI株式会社; OpenAI、LP; OpenAI OpCo、LLC; OpenAI GP、LLC; OpenAI スタートアップ ファンド GP I、LLC; OpenAI Startup Fund I、LP;および OpenAI Startup Fund Management, LLC1、デジタル ミレニアム著作権法、17 USC §§ 1201–1205 (「DMCA」) の違反。推奨されるライセンスに関する契約違反、サービス利用規約を含む GitHub のポリシーに関する契約違反。将来の経済関係に対する不法干渉。カリフォルニア州の不当競争法、Cal.バス。 & Prof. Code セクション 17200 以降;コモンローの不当競争。過失、不当利得。
原告および集団メンバーは、GitHub 上で公開されている素材 (「ライセンス素材」) の使用条件を含むさまざまなライセンスの対象となる素材の著作権権の所有者です。ここで問題となっているすべてのライセンス (「ライセンス」) には、特定の共通条項 (「ライセンス条項」) が含まれています。
「人工知能」は、本明細書では「AI」と呼ばれます。この申し立ての目的において、AI は、多くの場合統計的手法を使用して、人間の推論または推論をアルゴリズム的にシミュレートするコンピューター プログラムとして定義されます。機械学習 (「ML」) は AI のサブセットであり、プログラムの動作はトレーニング データと呼ばれる資料のコーパスを学習することから導き出されます。
GitHub は、オープンソース愛好家のチームによって 2008 年に設立された会社です。当時、GitHub が掲げていた目標は、特に Web サイトgithub.comでオープンソース ソース コードをホストすることによって、オープンソース開発をサポートすることでした。その後 10 年間で、これらの表現に基づいた GitHub は大成功を収め、2,500 万人近くの開発者を魅了しました。
開発者は、書面によるライセンスに従って、GitHub でライセンス素材を公開しました。特に、最も人気のあるものは、共通の条件を共有しています。つまり、ライセンス素材の使用には、通常、元の作成者の名前と著作権表示とともにライセンスのコピーが含まれるなど、何らかの形式の帰属が必要です。
2018 年 10 月 26 日、Microsoft は GitHub を 75 億ドルで買収しました。オープンソース コミュニティの一部のメンバーはこの結合に懐疑的でしたが、Microsoft は「Microsoft Loves Open Source」という 1 つの信念を一貫して繰り返しました。最初の数年間は、Microsoft の表明は信頼できるものであるように見えました。
Microsoftは2019年7月に200億ドルの評価額でOpenAI LPに10億ドルを投資した。 2020 年、Microsoft は OpenAI の GPT-3 言語モデルの独占ライセンシーになりました。OpenAI は自社の製品が「人類」全体に利益をもたらすことを目的としていると継続的に主張してきたにもかかわらずです。 2021 年、Microsoft は Azure クラウド コンピューティング プラットフォームを通じて GPT-3 の提供を開始しました。 2022 年 10 月 20 日、OpenAI は同じ 200 億ドルの評価額で「マイクロソフトからさらに資金を調達するための交渉を進めている」と報じられました。 Copilot は Microsoft の Azure プラットフォーム上で実行されます。 Microsoft は、特に AI に関して、Azure の処理能力を促進するために Copilot を使用しました。
情報と信念によると、Microsoft は 10 億ドルの投資と引き換えに OpenAI の所有権の一部を取得しました。 OpenAI の最大の投資家および最大のサービス プロバイダーとして、特に Microsoft の Azure 製品に関連して、Microsoft は OpenAI に対してかなりのコントロールを行使しています。
2021 年 6 月、GitHub と OpenAI は、AI を使用してコードのブロックを提供または埋めることでソフトウェア プログラマーを支援することを約束する AI ベースの製品である Copilot を発売しました。 GitHub は、このサービスに対して Copilot ユーザーに月額 10 ドルまたは年間 100 ドルを請求します。 Copilot は、数千人 (おそらくは数百万人) のソフトウェア開発者によって提供されたライセンスを無視し、違反し、削除することで、前例のない規模でソフトウェアの著作権侵害を実行します。 Copilot は、適用されるライセンス条項および適用される法律を遵守せずに、原告および集団のライセンス素材に由来するテキストを出力します。 Copilot の出力は、ここでは「出力」と呼ばれます。
2021 年 8 月 10 日、OpenAI は、自然言語をコードに変換し、Copilot に統合される Codex 製品をデビューさせました。 Copilot と Codex は AI または ML と呼ばれます。ここでは、区別する必要がない限り、Codex と Copilot を Ai と呼びます。
被告は、AI のトレーニングにどのようなデータが使用されたかについては頑なでしたが 2、トレーニング データには、GitHub 上の公的にアクセス可能な膨大な数のリポジトリのデータが含まれていることを認めました 3。これらのリポジトリにはライセンスが含まれ、ライセンスによって制限されています。
とりわけ、被告は、ライセンス、原告および集団の権利を侵害して、原告および集団の帰属、著作権表示、およびライセンス条項をコードから削除しました。被告は、Copilot を使用して、匿名化されたコードを Copilot によって作成されたかのように Copilot ユーザーに配布しました。
Copilot は完全に Microsoft の Azure クラウド コンピューティング プラットフォーム上で実行されます。
Copilot は多くの場合、オープンソース リポジトリまたはオープンソース ライセンシーまで遡ることができるコードを単純に複製するだけです。ライセンスに反し、ライセンスに違反する場合、Copilot によって複製されたコードには、基礎となる作成者の帰属が含まれることはありません。
GitHub と OpenAI は、Copilot のトレーニングと操作に使用されるコードやその他のデータのソースと量の移行アカウントを提供してきました。彼らはまた、Copilot のような商用 AI 製品がこれらのライセンス要件から免除されるべきである理由について、多くの場合「フェアユース」を引用して、正当化を変えています。
それは公平ではなく、許可されておらず、正当化されていません。それどころか、Copilot の目標は、膨大な量のオープンソースを取得し、GitHub が管理するペイウォール内に保持することで、それを置き換えることです。これは、オープンソース プログラマーが選択したライセンスに違反し、GitHub が決してそうしないと誓ったにもかかわらず、コードを収益化しています。
HackerNoon Legal PDF シリーズについて: 最も重要な技術的かつ洞察力に富んだパブリック ドメインの法廷訴訟書類をお届けします。
この裁判例 4:22-cv-06823-JST は、2023 年 6 月 8 日にStorage Courtlistenerから取得され、パブリック ドメインの一部です。裁判所が作成した文書は連邦政府の著作物であり、著作権法に基づき自動的にパブリックドメインに置かれ、法的制限なしに共有できます。