paint-brush
The Times contre Microsoft/OpenAI : Utilisation illégale des travaux du Times pour créer des produits d’IA (1)par@legalpdf
288 lectures

The Times contre Microsoft/OpenAI : Utilisation illégale des travaux du Times pour créer des produits d’IA (1)

Trop long; Pour lire

Le journalisme indépendant est vital pour notre démocratie. Il est également de plus en plus rare et précieux. Depuis plus de 170 ans, le Times a profondément apporté au monde...
featured image - The Times contre Microsoft/OpenAI : Utilisation illégale des travaux du Times pour créer des produits d’IA (1)
Legal PDF: Tech Court Cases HackerNoon profile picture

Le dossier judiciaire du New York Times Company c. Microsoft Corporation du 27 décembre 2023 fait partie de la série PDF juridique de HackerNoon . Vous pouvez accéder à n'importe quelle partie de ce dossier ici . Ceci est la partie 1 sur 27.

Demandeur The New York Times Company (« The Times »), par ses avocats Susman Godfrey LLP et Rothwell, Figg, Ernst & Manbeck, PC, pour sa plainte contre les défendeurs Microsoft Corporation (« Microsoft ») et OpenAI, Inc., OpenAI LP , OpenAI GP LLC, OpenAI LLC, OpenAI OpCo LLC, OpenAI Global LLC, OAI Corporation, LLC, OpenAI Holdings, LLC, (collectivement « OpenAI » et, avec Microsoft, les « Défendeurs »), allègue ce qui suit :

I. NATURE DE L'ACTION

1. Le journalisme indépendant est vital pour notre démocratie. Il est également de plus en plus rare et précieux. Depuis plus de 170 ans, le Times offre au monde un journalisme expert, indépendant et très médiatisé. Les journalistes du Times se rendent là où se déroule l’actualité, souvent au prix de risques et d’argent considérables, pour informer le public sur des questions importantes et urgentes. Ils témoignent de conflits et de catastrophes, rendent compte de l’usage du pouvoir et mettent en lumière des vérités qui autrement resteraient invisibles. Leur travail essentiel est rendu possible grâce aux efforts d’une organisation importante et coûteuse qui fournit un soutien juridique, sécuritaire et opérationnel, ainsi que des rédacteurs qui veillent à ce que leur journalisme réponde aux normes les plus élevées d’exactitude et d’équité. Ce travail a toujours été important. Mais au sein d'un écosystème d'informations endommagé et inondé de contenus peu fiables, le journalisme du Times fournit un service qui est devenu encore plus précieux pour le public en fournissant des informations, des analyses d'actualité et des commentaires fiables.


2. L'utilisation illégale par les accusés du travail du Times pour créer des produits d'intelligence artificielle qui lui font concurrence menace la capacité du Times à fournir ce service. Les outils d'intelligence artificielle générative (« GenAI ») des accusés s'appuient sur des modèles en grand langage (« LLM ») qui ont été construits en copiant et en utilisant des millions d'articles de presse protégés par le droit d'auteur du Times, des enquêtes approfondies, des articles d'opinion, des critiques, des guides pratiques. guides, et plus encore. Alors que les accusés se livraient à des copies à grande échelle à partir de nombreuses sources, ils ont accordé une importance particulière au contenu du Times lors de la création de leurs LLM, révélant une préférence qui reconnaît la valeur de ces œuvres. Grâce au Bing Chat de Microsoft (récemment rebaptisé « Copilot ») et au ChatGPT d'OpenAI, les accusés cherchent à profiter gratuitement de l'investissement massif du Times dans son journalisme en l'utilisant pour créer des produits de substitution sans autorisation ni paiement.


3. La Constitution et la loi sur le droit d'auteur reconnaissent l'importance cruciale d'accorder aux créateurs des droits exclusifs sur leurs œuvres. Depuis la fondation de notre pays, une solide protection du droit d'auteur a permis à ceux qui rassemblent et rapportent des informations d'obtenir les fruits de leur travail et de leurs investissements. La loi sur le droit d'auteur protège le journalisme expressif et original du Times, y compris, mais sans s'y limiter, ses millions d'articles pour lesquels des droits d'auteur sont enregistrés.


4. Les défendeurs ont refusé de reconnaître cette protection. Alimentés par des LLM contenant des copies du contenu du Times, les outils GenAI des accusés peuvent générer une sortie qui récite textuellement le contenu du Times, le résume fidèlement et imite son style expressif, comme le démontrent de nombreux exemples. Voir la pièce J. Ces outils attribuent également à tort de fausses informations au Times.


5. Les accusés utilisent également l'index de recherche Bing de Microsoft, qui copie et catégorise le contenu en ligne du Times, pour générer des réponses contenant des extraits textuels et des résumés détaillés des articles du Times qui sont nettement plus longs et détaillés que ceux renvoyés par les moteurs de recherche traditionnels. En fournissant du contenu au Times sans la permission ou l'autorisation du Times, les outils des défendeurs sapent et nuisent à la relation du Times avec ses lecteurs et privent le Times de revenus d'abonnement, de licence, de publicité et d'affiliation.


6. Utiliser de cette manière la précieuse propriété intellectuelle d’autrui sans payer pour cela s’est avéré extrêmement lucratif pour les défendeurs. Le déploiement par Microsoft de LLM formés par le Times dans l'ensemble de sa gamme de produits a contribué à augmenter sa capitalisation boursière d'un billion de dollars au cours de la seule année écoulée. Et la sortie de ChatGPT par OpenAI a porté sa valorisation à 90 milliards de dollars. Les intérêts commerciaux GenAI des accusés sont profondément liés, Microsoft soulignant récemment que son utilisation des « meilleurs modèles frontières » d'OpenAI a généré des clients, y compris des « startups d'IA de premier plan », pour le produit Azure AI de Microsoft.[1]


7. Le Times s'est opposé après avoir découvert que les accusés utilisaient le contenu du Times sans autorisation pour développer leurs modèles et outils. Pendant des mois, le Times a tenté de parvenir à un accord négocié avec les accusés, conformément à son historique de collaboration productive avec de grandes plateformes technologiques pour permettre l'utilisation de son contenu dans de nouveaux produits numériques (y compris les produits d'information développés par Google, Meta et Pomme). L'objectif du Times au cours de ces négociations était de garantir une juste valeur pour l'utilisation de son contenu, de faciliter la continuité d'un écosystème d'information sain et d'aider à développer la technologie GenAI d'une manière responsable qui profite à la société et soutient un public bien informé.


8. Ces négociations n’ont pas abouti à une résolution. Publiquement, les accusés insistent sur le fait que leur conduite est protégée en tant qu'« usage loyal » car leur utilisation sans licence de contenu protégé par le droit d'auteur pour former des modèles GenAI sert un nouvel objectif « transformateur ». Mais il n'y a rien de « transformateur » dans le fait d'utiliser le contenu du Times sans paiement pour créer des produits qui remplacent le Times et lui volent des audiences. Étant donné que les résultats des modèles GenAI des accusés entrent en concurrence et imitent fidèlement les entrées utilisées pour les former, copier les travaux du Times à cette fin ne constitue pas un usage équitable.


9. La loi n'autorise pas le type d'infraction systématique et concurrentielle commise par les défendeurs. Cette action vise à les tenir responsables des milliards de dollars de dommages-intérêts légaux et réels qu'ils doivent pour la copie et l'utilisation illégales des œuvres d'une valeur unique du Times.



Continuez la lecture ici .


[1] Conférence téléphonique sur les résultats du premier trimestre de l'exercice 2024 de Microsoft, MICROSOFT INVESTOR RELATIONS (24 octobre 2023), https://www.microsoft.com/en-us/Investor/events/FY-2024/earnings-fy- 2024-q1.aspx.




À propos de la série PDF juridique de HackerNoon : Nous vous proposons les dossiers judiciaires techniques et perspicaces les plus importants du domaine public.


Cette affaire judiciaire 1:23-cv-11195 récupérée le 29 décembre 2023 sur nycto-assets.nytimes.com fait partie du domaine public. Les documents créés par le tribunal sont des œuvres du gouvernement fédéral et, en vertu de la loi sur le droit d'auteur, sont automatiquement placés dans le domaine public et peuvent être partagés sans restriction légale.