paint-brush
タイムズ対マイクロソフト/OpenAI: 最新ニュースの不正取得と配布 (13)@legalpdf
174 測定値

タイムズ対マイクロソフト/OpenAI: 最新ニュースの不正取得と配布 (13)

長すぎる; 読むには

Bing Chat や Browse with Bing for ChatGPT など、GPT LLM 上に構築された合成検索アプリケーションでは、広範な抜粋や言い換えが表示されます。
featured image - タイムズ対マイクロソフト/OpenAI: 最新ニュースの不正取得と配布 (13)
Legal PDF: Tech Court Cases HackerNoon profile picture

ニューヨーク タイムズ カンパニー対マイクロソフト コーポレーションの裁判所提出 2023 年 12 月 27 日は、HackerNoon の法律 PDF シリーズの一部です。ここからこのファイルの任意の部分にジャンプできます。これは 27 のパート 13 です。

IV.事実上の申し立て

C. 被告によるタイムズコンテンツの不正使用とコピー

4. 最新ニュースの不正な取得と配布


108. Bing Chat や Browse with Bing for ChatGPT など、GPT LLM 上に構築された合成検索アプリケーションは、モデルのトレーニング セットに含まれていない可能性のある、Times コンテンツを含む検索結果のコンテンツの広範な抜粋または言い換えを表示します。これらの製品で採用されている「グラウンディング」技術には、ユーザーからプロンプトを受信すること、そのプロンプトに関連する Times コンテンツをインターネットからコピーすること、LLM の追加コンテキストとしてコピーされた Times コンテンツとともにプロンプトを提供すること、LLM をつなぎ合わせることが含まれます。コピーされたタイムズのコンテンツから言い換えまたは引用して、オリジナルと同じ有益な目的を果たす自然言語の代替物を作成します。場合によっては、被告のモデルがタイムズの記事のいくつかの段落を単に吐き出すだけであることもあります。


109. このような合成応答の内容は、通常の検索結果で通常表示されるスニペットをはるかに超えていることがよくあります。合成検索応答にソース資料へのリンクが含まれている場合でも、表現力豊かなコンテンツが物語の結果ですでに引用または言い換えされているため、ユーザーはそれらのソースに移動する必要が少なくなります。実際、このような帰属表示により、ユーザーは概要だけを信頼し、クリックして確認を行わなくなる可能性が高くなります。


110. このように、合成検索結果は重要なトラフィックをタイムズのような著作権所有者からそらします。すでに最新のニュースを読んだり、適切な種類の製品を見つけたりしたユーザーは、たとえ (または特に) ニューヨーク タイムズへの帰属があった場合でも、元の情報源にアクセスする理由が少なくなります。


111. 以下は、Bing Chat および ChatGPT の Browse with Bing からの合成検索結果の、説明のための非網羅的な例です。


a) Bing Chat からの合成検索結果の例


112. 以下に示すように、Bing Chat は、OpenAI の最新の GPT-4 Turbo LLM のトレーニングに使用されるデータの 2023 年 4 月の終了後に初めて表示された Times Works から生成された合成検索結果の形式で、Times Works の無許可のコピーおよび派生物を作成します。 30 最初の文には、2023 年 10 月のニューヨーク・タイムズ記事「ハマスがイスラエル軍について知っていた秘密」からの長い引用が含まれています。[31]




113. Bing Chat からの上記の合成出力には、元の記事からの逐語的な抜粋が含まれています。コピーされた記事のテキストは、以下の赤色で強調表示されます。



114. 合成出力には、以下に示すように、同じ記事の Bing 検索結果に従来表示されていた内容よりも、元の記事のより表現力豊かなコンテンツが表示されます。従来の検索結果とは異なり、合成出力にはユーザーをタイムズの Web サイトに誘導する目立つハイパーリンクも含まれていません。



115. さらなる例では、Bing Chat が 2023 年 9 月のニューヨーク タイムズの記事「パリを間近で個人的に体験するには、公共プールに飛び込む」のテキストを広範囲に再現していることが示されています。[32]



116. Bing Chat からの上記の合成出力には、元の記事からの逐語的な抜粋が含まれています。コピーされた記事のテキストは、以下の赤色で強調表示されます。



117. 合成出力には、以下に示すように、同じ記事の Bing 検索結果に従来表示されていた内容よりも、元の記事のより表現力豊かなコンテンツが表示されます。従来の検索結果とは異なり、合成出力にはユーザーをタイムズの Web サイトに誘導する目立つハイパーリンクも含まれていません。



b) ChatGPT Browse with Bing からの合成検索結果


118. 以下の例は、ChatGPT の Browse with Bing プラグインが、トレーニングに使用されるデータの 2023 年 4 月の終了後に初めて表示された Times Works から生成された合成検索結果の形式で、The Times の著作権で保護された著作物の無許可のコピーと派生物も出力することを示しています。 OpenAI の最新 GPT-4 Turbo LLM。 1 つ目は、2023 年 5 月のニューヨーク・タイムズ記事「女性が電車に押し込まれた後の不安定で恐ろしい数時間」の最初の 2 段落を再現したものです。[33]




119. Browse with Bing プラグインを使用した ChatGPT からの上記の合成出力には、元の記事からの逐語的な抜粋が含まれています。コピーされた記事テキストは以下の赤色で強調表示されます



120. 合成出力には、以下に示すように、同じ記事の Bing 検索結果に従来表示されていた内容よりも、元の記事のより表現力豊かなコンテンツが表示されます。従来の検索結果とは異なり、合成出力にはユーザーをタイムズの Web サイトに誘導する目立つハイパーリンクも含まれていません。



121. この例は、同様に、ニューヨーク タイムズの記事「ハンプトンズはまだヒップですか?」の最初の 2 つの段落を再現する ChatGPT 用の Bing での参照を示しています。 2023年5月から。[34]



122. Browse with Bing プラグインを使用した ChatGPT からの上記の合成出力には、元の記事からの逐語的な抜粋が含まれています。コピーされた記事のテキストは、以下の赤色で強調表示されます。



123. ここでも、合成出力には、以下に示すように、同じ記事の Bing 検索結果に従来表示されていたものよりも、元の記事の表現力豊かなコンテンツが表示されます。従来の検索結果とは異なり、合成出力にはユーザーをタイムズの Web サイトに誘導する目立つハイパーリンクも含まれていません。





ここで続きを読んでください。


[31] 元の記事については、Patrick Kingsley & Ronen Bergman、The Secrets Hamas Knew About Israel's Military、NY TIMES (2023 年 10 月 13 日)、https://www.nytimes.com/2023/10/13/world/ を参照してください。中東/ハマス・イスラエル・アタックガザ.html。


[32] 元の記事については、Catherine Porter、To Experience Paris Up Close and Personal、Plunge Into a Public Pool、NY TIMES (2023 年 9 月 3 日)、https://www.nytimes.com/2023/09/03 を参照してください。 /world/europe/paris-franceswimming-pools.html。


[33] オリジナルのコンテンツについては、Hurubie Meko、女性が電車に押し込まれた後の不安定で恐ろしい時間、NY TIMES (2023 年 5 月 25 日)、https://www.nytimes.com/2023/05/25/ を参照してください。 nyregion/subway-attach-womenshoved-manhattan.html


[34] 元の記事については、Anna Kodé、Are the Hamptons Still Hip?、NY TIMES (2023 年 5 月 26 日) を参照してください。

https://www.nytimes.com/2023/05/26/realestate/hamptons-Summer-housing-costs.html。




HackerNoon Legal PDF シリーズについて: 最も重要な技術的かつ洞察力に富んだパブリック ドメインの法廷訴訟書類をお届けします。


この裁判例 1:23-cv-11195 は、2023 年 12 月 29 日にnycto-assets.nytimes.comから取得され、パブリック ドメインの一部です。裁判所が作成した文書は連邦政府の著作物であり、著作権法に基づき自動的にパブリックドメインに置かれ、法的制限なしに共有できます。