paint-brush
The Times contre Microsoft/OpenAI : reproductions non autorisées des œuvres du Times dans des modèles GPT (11)par@legalpdf
152 lectures

The Times contre Microsoft/OpenAI : reproductions non autorisées des œuvres du Times dans des modèles GPT (11)

par Legal PDF3m2024/01/02
Read on Terminal Reader

Trop long; Pour lire

Comme preuve supplémentaire d'avoir été formés à l'aide de copies non autorisées de Times Works, les LLM GPT eux-mêmes ont « mémorisé » des copies de bon nombre de ces mêmes œuvres codées.
featured image - The Times contre Microsoft/OpenAI : reproductions non autorisées des œuvres du Times dans des modèles GPT (11)
Legal PDF HackerNoon profile picture

Le dossier judiciaire du New York Times Company c. Microsoft Corporation du 27 décembre 2023 fait partie de la série PDF juridique de HackerNoon . Vous pouvez accéder à n'importe quelle partie de ce dossier ici . Ceci est la partie 11 sur 27.

IV. ALLÉGATIONS FACTUELLES

C. Utilisation non autorisée et copie du contenu du Times par les défendeurs

2. Incorporation de reproductions non autorisées et de dérivés d'œuvres temporelles dans des modèles GPT


98. Comme preuve supplémentaire de leur formation à l’aide de copies non autorisées de Times Works, les LLM du GPT eux-mêmes ont « mémorisé » des copies de bon nombre de ces mêmes œuvres codées dans leurs paramètres. Comme indiqué ci-dessous et dans l'annexe J, le LLM GPT-4 actuel produira des copies quasi textuelles de parties importantes de Times Works lorsqu'il y sera invité. De tels exemples mémorisés constituent des copies non autorisées ou des œuvres dérivées des Times Works utilisés pour entraîner le modèle.


99. Par exemple, en 2019, le Times a publié une série en cinq parties, lauréate du prix Pulitzer, sur les prêts abusifs dans le secteur des taxis de la ville de New York. L'enquête, qui a duré 18 mois, comprenait 600 entretiens, plus de 100 demandes de dossiers, une analyse de données à grande échelle et l'examen de milliers de pages de relevés bancaires internes et d'autres documents, et a finalement conduit à des enquêtes criminelles et à la promulgation de nouvelles lois pour empêcher abus futurs. OpenAI n'a joué aucun rôle dans la création de ce contenu, mais avec un minimum d'incitations, il en récitera de grandes parties textuellement :[26]



Pièce J, p. 5.


100. De même, en 2012, le Times a publié une série révolutionnaire examinant comment l’externalisation par Apple et d’autres entreprises technologiques a transformé l’économie mondiale. La série est le fruit d’un énorme effort sur trois continents. Rendre compte de cette histoire était particulièrement difficile car le Times s'est vu refuser à plusieurs reprises les interviews et l'accès. Le Times a contacté des centaines de dirigeants actuels et anciens d'Apple et a finalement obtenu des informations auprès de plus de six douzaines d'initiés d'Apple. Encore une fois, GPT-4 a copié ce contenu et peut en réciter de grandes parties textuellement :[27]


Pièce J à la p. 3.


101. La pièce J fournit de nombreux exemples supplémentaires de mémorisation de Times Works par GPT-4. D'après information et croyance, ces exemples représentent une petite fraction de Times Works dont le contenu expressif a été substantiellement codé dans les paramètres de la série GPT de LLM. Chacun de ces LLM incarne ainsi de nombreuses copies ou dérivés non autorisés de Times Works.



Continuez la lecture ici .


[26] Pour l'article original, voir Brian M. Rosenthal, As Thousands of Taxi Drivers Were Trapped in Loans, Top Officials Counted the Money, NY TIMES (19 mai 2019), https://www.nytimes.com/2019/ 05/19/nyregion/taximedallions.html.


[27] Pour l'article original, voir Charles Duhigg et Keith Bradsher, How the US Lost Out on iPhone Work, NY TIMES (21 janvier 2012), https://www.nytimes.com/2012/01/22/business /apple-america-and-a-squeezed-middleclass.html.




À propos de la série PDF juridique de HackerNoon : Nous vous proposons les dossiers judiciaires techniques et perspicaces les plus importants du domaine public.


Cette affaire judiciaire 1:23-cv-11195 récupérée le 29 décembre 2023 sur nycto-assets.nytimes.com fait partie du domaine public. Les documents créés par le tribunal sont des œuvres du gouvernement fédéral et, en vertu de la loi sur le droit d'auteur, sont automatiquement placés dans le domaine public et peuvent être partagés sans restriction légale.