ニューヨーク タイムズ カンパニー対マイクロソフト コーポレーションの裁判所提出 2023 年 12 月 27 日は、HackerNoon の法律 PDF シリーズの一部です。ここからこのファイルの任意の部分にジャンプできます。これは 27 のパート 11 です。
2. GPT モデルにおける Times Works の不正複製と派生の具体化
98. Times Works の無許可コピーを使用してトレーニングされたさらなる証拠として、GPT LLM 自体が、パラメータにエンコードされた同じ著作物の多くのコピーを「記憶」しています。以下および添付資料 J に示すように、現在の GPT-4 LLM は、要求に応じて Times Works の重要な部分のほぼそのままのコピーを出力します。このような記憶された例は、モデルのトレーニングに使用された Times Works の無許可のコピーまたは派生作品を構成します。
99. たとえば、2019年にタイムズ紙は、ピューリッツァー賞を受賞した、ニューヨーク市のタクシー業界における略奪的融資に関する5部構成のシリーズを出版した。 18か月にわたる捜査には、600件の聞き取り、100件以上の記録請求、大規模なデータ分析、数千ページにわたる銀行内部記録やその他の文書のレビューが含まれ、最終的には犯罪捜査と犯罪防止のための新たな法律の制定につながった。将来の虐待。 OpenAI はこのコンテンツの作成には何の役割も果たしていませんでしたが、最小限のプロンプトで、その大部分をそのまま暗唱します。[26]
100. 同様に、2012 年にタイムズ紙は、Apple やその他のテクノロジー企業によるアウトソーシングが世界経済をどのように変革したかを検証する画期的なシリーズを出版しました。このシリーズは、3 大陸にわたる多大な努力の成果です。タイムズ紙はインタビューとアクセスの両方を繰り返し拒否されたため、この記事を報道することは特に困難でした。タイムズは何百人ものAppleの現・元幹部に連絡を取り、最終的に60名以上のApple内部関係者から情報を確保した。繰り返しになりますが、GPT-4 はこの内容をコピーし、その大部分をそのまま暗唱することができます:[27]
101. 証拠 J は、GPT-4 による Times Works の暗記の追加例を多数提供します。情報と信念に基づいて、これらの例は、表現内容が GPT シリーズの LLM パラメータ内で実質的にエンコードされている Times Works のほんの一部を表しています。したがって、これらの各 LLM には、Times Works の多数の無許可コピーまたは派生製品が組み込まれています。
ここで続きを読んでください。
[26] 元の記事については、Brian M. Rosenthal、As Thousands of Taxi Drivers Were Trapped in Loans、Top Officials Counted the Money、NY TIMES (2019 年 5 月 19 日)、https://www.nytimes.com/2019/ を参照してください。 05/19/nyregion/taximedallions.html。
[27] 元の記事については、Charles Duhigg & Keith Bradsher、How the US Lost Out on iPhone Work、NY TIMES (2012 年 1 月 21 日)、https://www.nytimes.com/2012/01/22/business を参照してください。 /apple-america-and-a-squeezed-middleclass.html.
HackerNoon Legal PDF シリーズについて: 最も重要な技術的かつ洞察力に富んだパブリック ドメインの法廷訴訟書類をお届けします。
この裁判例 1:23-cv-11195 は、2023 年 12 月 29 日にnycto-assets.nytimes.comから取得され、パブリック ドメインの一部です。裁判所が作成した文書は連邦政府の著作物であり、著作権法に基づき自動的にパブリックドメインに置かれ、法的制限なしに共有できます。