paint-brush
The Times vs. Microsoft/OpenAI: Unbefugter Abruf und Verbreitung aktueller Nachrichten (13)von@legalpdf
174 Lesungen

The Times vs. Microsoft/OpenAI: Unbefugter Abruf und Verbreitung aktueller Nachrichten (13)

Zu lang; Lesen

Synthetische Suchanwendungen, die auf den GPT-LLMs basieren, einschließlich Bing Chat und Browse with Bing for ChatGPT, zeigen umfangreiche Auszüge oder Paraphrasen an
featured image - The Times vs. Microsoft/OpenAI: Unbefugter Abruf und Verbreitung aktueller Nachrichten (13)
Legal PDF: Tech Court Cases HackerNoon profile picture

Der Gerichtsantrag „New York Times Company gegen Microsoft Corporation“ vom 27. Dezember 2023 ist Teil der Legal PDF Series von HackerNoon . Sie können hier zu jedem Teil dieser Akte springen. Dies ist Teil 13 von 27.

IV. FAKTISCHE BEHAUPTUNG

C. Unbefugte Nutzung und Vervielfältigung von Times-Inhalten durch die Beklagten

4. Unbefugtes Abrufen und Verbreiten aktueller Nachrichten


108. Synthetische Suchanwendungen, die auf den GPT-LLMs basieren, einschließlich Bing Chat und Browse with Bing for ChatGPT, zeigen umfangreiche Auszüge oder Paraphrasen des Inhalts von Suchergebnissen an, einschließlich Times-Inhalten, die möglicherweise nicht im Trainingssatz des Modells enthalten waren. Die von diesen Produkten verwendete „Erdungs“-Technik umfasst den Empfang einer Eingabeaufforderung von einem Benutzer, das Kopieren von Times-Inhalten, die sich auf die Eingabeaufforderung beziehen, aus dem Internet, die Bereitstellung der Eingabeaufforderung zusammen mit dem kopierten Times-Inhalt als zusätzlichen Kontext für das LLM und das Zusammenfügen des LLM Paraphrasen oder Zitate aus dem kopierten Times-Inhalt, um Ersatz in natürlicher Sprache zu schaffen, der denselben informativen Zweck wie das Original erfüllt. In einigen Fällen spuckten die Modelle der Beklagten einfach mehrere Absätze der Artikel der Times aus.


109. Der Inhalt solcher synthetischen Antworten geht oft weit über die Ausschnitte hinaus, die normalerweise in normalen Suchergebnissen angezeigt werden. Selbst wenn synthetische Suchantworten Links zu Quellmaterialien enthalten, müssen Benutzer weniger zu diesen Quellen navigieren, da deren ausdrucksstarke Inhalte bereits im narrativen Ergebnis zitiert oder paraphrasiert werden. Tatsächlich kann ein solcher Hinweis auf die Namensnennung dazu führen, dass Nutzer eher der Zusammenfassung allein vertrauen und sich nicht weiter zur Bestätigung durchklicken.


110. Auf diese Weise lenken synthetische Suchergebnisse wichtigen Traffic von Urheberrechtsinhabern wie The Times ab. Ein Benutzer, der bereits die neuesten Nachrichten gelesen oder das richtige Produkt gefunden hat, auch – oder gerade – mit Quellenangabe an die New York Times, hat weniger Grund, die Originalquelle aufzusuchen.


111. Nachfolgend finden Sie einige veranschaulichende und nicht erschöpfende Beispiele für synthetische Suchergebnisse aus Bing Chat und ChatGPTs Browse with Bing.


a) Beispiele für synthetische Suchergebnisse aus Bing Chat


112. Wie unten gezeigt, erstellt Bing Chat nicht autorisierte Kopien und Derivate von Times Works in Form von synthetischen Suchergebnissen, die aus Times Works generiert wurden und erstmals nach dem Cutoff im April 2023 für Daten erschienen, die zum Trainieren des neuesten GPT-4 Turbo LLM von OpenAI verwendet wurden. 30 Das erste enthält ein langes Zitat aus dem Artikel der New York Times vom Oktober 2023 „Die Geheimnisse, die Hamas über Israels Militär wusste“:[31]




113. Die obige synthetische Ausgabe von Bing Chat enthält wörtliche Auszüge aus dem Originalartikel. Der kopierte Artikeltext wird unten rot hervorgehoben.



114. Die synthetische Ausgabe zeigt deutlich aussagekräftigere Inhalte des Originalartikels an, als dies traditionell in einem Bing-Suchergebnis für denselben Artikel angezeigt würde, wie unten gezeigt. Im Gegensatz zu einem herkömmlichen Suchergebnis enthält die synthetische Ausgabe auch keinen prominenten Hyperlink, der Benutzer zur Website der Times weiterleitet.



115. Ein weiteres Beispiel zeigt, wie Bing Chat ausführlich Text aus dem Artikel der New York Times vom September 2023 „Um Paris aus nächster Nähe zu erleben, tauchen Sie in ein öffentliches Schwimmbad“ ein:[32]



116. Die obige synthetische Ausgabe von Bing Chat enthält wörtliche Auszüge aus dem Originalartikel. Der kopierte Artikeltext wird unten rot hervorgehoben.



117. Die synthetische Ausgabe zeigt deutlich aussagekräftigere Inhalte des Originalartikels an, als dies traditionell in einem Bing-Suchergebnis für denselben Artikel angezeigt würde, wie unten gezeigt. Im Gegensatz zu einem herkömmlichen Suchergebnis enthält die synthetische Ausgabe auch keinen prominenten Hyperlink, der Benutzer zur Website der Times weiterleitet.



b) Synthetische Suchergebnisse von ChatGPT Browse mit Bing


118. Die folgenden Beispiele zeigen, dass das Plug-in „Browse with Bing“ von ChatGPT auch nicht autorisierte Kopien und Derivate urheberrechtlich geschützter Werke von The Times in Form von synthetischen Suchergebnissen ausgibt, die aus Times Works generiert wurden und erstmals nach der Sperrung der für das Training verwendeten Daten im April 2023 erschienen OpenAIs neuestes GPT-4 Turbo LLM. Der erste gibt die ersten beiden Absätze des New York Times-Artikels „The Precarious, Terrifying Hours After a Woman Was Shoved Into a Train“ vom Mai 2023 wieder:[33]




119. Die obige synthetische Ausgabe von ChatGPT mit dem Browse with Bing-Plugin enthält wörtliche Auszüge aus dem Originalartikel. Der kopierte Artikeltext wird unten rot hervorgehoben



120. Die synthetische Ausgabe zeigt wesentlich aussagekräftigere Inhalte des Originalartikels an, als dies traditionell in einem Bing-Suchergebnis für denselben Artikel angezeigt würde, wie unten gezeigt. Im Gegensatz zu einem herkömmlichen Suchergebnis enthält die synthetische Ausgabe auch keinen prominenten Hyperlink, der Benutzer zur Website der Times weiterleitet.



121. Dieses Beispiel zeigt ebenfalls Browse with Bing for ChatGPT, das die ersten beiden Absätze des Artikels „Are the Hamptons Still Hip?“ der New York Times wiedergibt. ab Mai 2023.[34]



122. Die obige synthetische Ausgabe von ChatGPT mit dem Browse with Bing-Plugin enthält wörtliche Auszüge aus dem Originalartikel. Der kopierte Artikeltext wird unten rot hervorgehoben.



123. Auch hier zeigt die synthetische Ausgabe deutlich aussagekräftigere Inhalte des Originalartikels an, als dies traditionell in einem Bing-Suchergebnis für denselben Artikel angezeigt würde, wie unten gezeigt. Im Gegensatz zu einem herkömmlichen Suchergebnis enthält die synthetische Ausgabe auch keinen prominenten Hyperlink, der Benutzer zur Website der Times weiterleitet.





Lesen Sie hier weiter.


[31] Für den Originalartikel siehe Patrick Kingsley und Ronen Bergman, The Secrets Hamas Knew About Israel's Military, NY TIMES (13. Oktober 2023), https://www.nytimes.com/2023/10/13/world/ middleeast/hamas-israel-attackgaza.html.


[32] Den Originalartikel finden Sie unter Catherine Porter, To Experience Paris Up Close and Personal, Plunge Into a Public Pool, NY TIMES (3. September 2023), https://www.nytimes.com/2023/09/03 /world/europe/paris-franceswimming-pools.html.


[33] Zum Originalinhalt siehe Hurubie Meko, The Precarious, Terrifying Hours After a Woman Was Shoved Into a Train, NY TIMES (25. Mai 2023), https://www.nytimes.com/2023/05/25/ nyregion/subway-attack-womanshoved-manhattan.html.


[34] Für den Originalartikel siehe Anna Kodé, Are the Hamptons Still Hip?, NY TIMES (26. Mai 2023),

https://www.nytimes.com/2023/05/26/realestate/hamptons-summer-housing-costs.html.




Über HackerNoon Legal PDF Series: Wir stellen Ihnen die wichtigsten technischen und aufschlussreichen gemeinfreien Gerichtsakten vor.


Dieser Gerichtsfall 1:23-cv-11195, abgerufen am 29. Dezember 2023 von nycto-assets.nytimes.com , ist Teil der Public Domain. Die vom Gericht erstellten Dokumente sind Werke der Bundesregierung und werden gemäß dem Urheberrecht automatisch öffentlich zugänglich gemacht und können ohne rechtliche Beschränkungen weitergegeben werden.