paint-brush
The Times vs. Microsoft/OpenAI: Unautorisierte Reproduktionen von Times-Werken in GPT-Modellen (11)by@legalpdf
174

The Times vs. Microsoft/OpenAI: Unautorisierte Reproduktionen von Times-Werken in GPT-Modellen (11)

Legal PDF3m2024/01/02
Read on Terminal Reader

Als weiteren Beweis dafür, dass sie mit nicht autorisierten Kopien von Times Works trainiert wurden, haben die GPT LLMs selbst Kopien vieler dieser Werke „auswendig gelernt“.
featured image - The Times vs. Microsoft/OpenAI: Unautorisierte Reproduktionen von Times-Werken in GPT-Modellen (11)
Legal PDF HackerNoon profile picture

Der Gerichtsantrag „New York Times Company gegen Microsoft Corporation“ vom 27. Dezember 2023 ist Teil der Legal PDF Series von HackerNoon . Sie können hier zu jedem Teil dieser Akte springen. Dies ist Teil 11 von 27.

IV. FAKTISCHE BEHAUPTUNG

C. Unbefugte Nutzung und Vervielfältigung von Times-Inhalten durch die Beklagten

2. Verkörperung nicht autorisierter Reproduktionen und Ableitungen von Zeitwerken in GPT-Modellen


98. Als weiteren Beweis dafür, dass sie mit nicht autorisierten Kopien von Times Works trainiert wurden, haben die GPT LLMs selbst Kopien vieler dieser Werke „auswendig gelernt“, die in ihren Parametern kodiert sind. Wie unten und in Anlage J gezeigt, gibt das aktuelle GPT-4 LLM nahezu wörtliche Kopien wesentlicher Teile von Times Works aus, wenn es dazu aufgefordert wird. Solche auswendig gelernten Beispiele stellen unautorisierte Kopien oder abgeleitete Werke der Times Works dar, die zum Trainieren des Modells verwendet wurden.


99. Beispielsweise veröffentlichte The Times im Jahr 2019 eine mit dem Pulitzer-Preis ausgezeichnete fünfteilige Serie über räuberische Kreditvergabe in der New Yorker Taxibranche. Die 18-monatige Untersuchung umfasste 600 Befragungen, mehr als 100 Aktenanfragen, umfangreiche Datenanalysen und die Überprüfung von Tausenden Seiten interner Bankunterlagen und anderer Dokumente und führte schließlich zu strafrechtlichen Ermittlungen und der Verabschiedung neuer Gesetze zur Verhinderung zukünftigen Missbrauch. OpenAI war an der Erstellung dieses Inhalts nicht beteiligt, wird jedoch mit minimaler Aufforderung große Teile davon wörtlich wiedergeben:[26]



Anlage J, 5.


100. In ähnlicher Weise veröffentlichte The Times 2012 eine bahnbrechende Serie, in der untersucht wurde, wie Outsourcing durch Apple und andere Technologieunternehmen die Weltwirtschaft veränderte. Die Serie war das Ergebnis einer enormen Anstrengung auf drei Kontinenten. Die Berichterstattung über diese Geschichte war eine besondere Herausforderung, da der Times wiederholt Interviews und Zugang verweigert wurden. Die Times kontaktierte Hunderte aktuelle und ehemalige Apple-Führungskräfte und sicherte sich letztendlich Informationen von mehr als sechs Dutzend Apple-Insidern. Auch hier hat GPT-4 diesen Inhalt kopiert und kann große Teile davon wörtlich wiedergeben:[27]


Anlage J, 3.


101. Anlage J enthält zahlreiche weitere Beispiele für das Auswendiglernen von Times Works durch GPT-4. Nach bestem Wissen und Gewissen stellen diese Beispiele einen kleinen Teil der Times Works dar, deren ausdrucksstarke Inhalte im Wesentlichen innerhalb der Parameter der GPT-Reihe von LLMs kodiert wurden. Jedes dieser LLMs verkörpert somit viele nicht autorisierte Kopien oder Derivate von Times Works.



Lesen Sie hier weiter.


[26] Für den Originalartikel siehe Brian M. Rosenthal, As Thousands of Taxi Drivers Were Trapped in Loans, Top Officials Counted the Money, NY TIMES (19. Mai 2019), https://www.nytimes.com/2019/ 19.05.nyregion/taximedallions.html.


[27] Für den Originalartikel siehe Charles Duhigg und Keith Bradsher, How the US Lost Out on iPhone Work, NY TIMES (21. Januar 2012), https://www.nytimes.com/2012/01/22/business /apple-america-and-a-squeezed-middleclass.html.




Über HackerNoon Legal PDF Series: Wir stellen Ihnen die wichtigsten technischen und aufschlussreichen gemeinfreien Gerichtsakten vor.


Dieser Gerichtsfall 1:23-cv-11195, abgerufen am 29. Dezember 2023 von nycto-assets.nytimes.com , ist Teil der Public Domain. Die vom Gericht erstellten Dokumente sind Werke der Bundesregierung und werden gemäß dem Urheberrecht automatisch öffentlich zugänglich gemacht und können ohne gesetzliche Einschränkung weitergegeben werden.