paint-brush
The Times contre Microsoft/OpenAI : récupération et diffusion non autorisées de l'actualité (13)par@legalpdf
174 lectures

The Times contre Microsoft/OpenAI : récupération et diffusion non autorisées de l'actualité (13)

Trop long; Pour lire

Les applications de recherche synthétique construites sur les LLM GPT, notamment Bing Chat et Browse with Bing for ChatGPT, affichent de nombreux extraits ou paraphrases.
featured image - The Times contre Microsoft/OpenAI : récupération et diffusion non autorisées de l'actualité (13)
Legal PDF: Tech Court Cases HackerNoon profile picture

Le dossier judiciaire du New York Times Company c. Microsoft Corporation du 27 décembre 2023 fait partie de la série PDF juridique de HackerNoon . Vous pouvez accéder à n'importe quelle partie de ce dossier ici . Ceci est la partie 13 sur 27.

IV. ALLÉGATIONS FACTUELLES

C. Utilisation non autorisée et copie du contenu du Times par les défendeurs

4. Récupération et diffusion non autorisées de l'actualité


108. Les applications de recherche synthétique construites sur les LLM GPT, notamment Bing Chat et Browse with Bing for ChatGPT, affichent de nombreux extraits ou paraphrases du contenu des résultats de recherche, y compris le contenu du Times, qui peuvent ne pas avoir été inclus dans l'ensemble de formation du modèle. La technique de « mise à la terre » employée par ces produits consiste à recevoir une invite d'un utilisateur, à copier le contenu Times relatif à l'invite depuis Internet, à fournir l'invite avec le contenu Times copié comme contexte supplémentaire pour le LLM, et à assembler le LLM. paraphrase ou cite le contenu copié du Times pour créer des substituts en langage naturel qui servent le même objectif informatif que l'original. Dans certains cas, les modèles des accusés ont simplement craché plusieurs paragraphes d'articles du Times.


109. Le contenu de ces réponses synthétiques va souvent bien au-delà des extraits généralement présentés dans les résultats de recherche ordinaires. Même lorsque les réponses de recherche synthétique incluent des liens vers des sources, les utilisateurs ont moins besoin de naviguer vers ces sources car leur contenu expressif est déjà cité ou paraphrasé dans le résultat narratif. En effet, une telle indication d'attribution peut inciter les utilisateurs à se fier uniquement au résumé et à ne pas cliquer pour vérifier.


110. De cette manière, les résultats de recherche synthétiques détournent un trafic important des détenteurs de droits d’auteur comme le Times. Un utilisateur qui a déjà lu les dernières nouvelles ou trouvé le bon type de produit, même – ou surtout – avec une attribution au New York Times, a moins de raisons de visiter la source originale.


111. Vous trouverez ci-dessous quelques exemples illustratifs et non exhaustifs de résultats de recherche synthétiques issus de Bing Chat et de Browse with Bing de ChatGPT.


a) Exemples de résultats de recherche synthétiques de Bing Chat


112. Comme indiqué ci-dessous, Bing Chat crée des copies et des dérivés non autorisés de Times Works sous la forme de résultats de recherche synthétiques générés à partir de Times Works qui sont apparus pour la première fois après la date limite d'avril 2023 pour les données utilisées pour entraîner le dernier GPT-4 Turbo LLM d'OpenAI. 30 Le premier comprend une longue citation de l'article du New York Times d'octobre 2023 « Les secrets que le Hamas connaissait à propos de l'armée israélienne » :[31]




113. Le résultat synthétique ci-dessus de Bing Chat comprend des extraits textuels de l’article original. Le texte de l'article copié est surligné en rouge ci-dessous.



114. Le résultat synthétique affiche un contenu beaucoup plus expressif de l'article original que ce qui serait traditionnellement affiché dans un résultat de recherche Bing pour le même article, comme indiqué ci-dessous. Contrairement à un résultat de recherche traditionnel, le résultat synthétique n'inclut pas non plus de lien hypertexte visible renvoyant les utilisateurs vers le site Web du Times.



115. Un autre exemple montre Bing Chat reproduisant abondamment le texte de l’article du New York Times de septembre 2023 « Pour découvrir Paris de près et personnellement, plongez dans une piscine publique » :[32]



116. Le résultat synthétique ci-dessus de Bing Chat comprend des extraits textuels de l’article original. Le texte de l'article copié est surligné en rouge ci-dessous.



117. Le résultat synthétique affiche un contenu beaucoup plus expressif de l'article original que ce qui serait traditionnellement affiché dans un résultat de recherche Bing pour le même article, comme indiqué ci-dessous. Contrairement à un résultat de recherche traditionnel, le résultat synthétique n'inclut pas non plus de lien hypertexte visible renvoyant les utilisateurs vers le site Web du Times.



b) Résultats de recherche synthétiques de ChatGPT Parcourir avec Bing


118. Les exemples ci-dessous montrent que le plug-in Browse with Bing de ChatGPT génère également des copies non autorisées et des dérivés d'œuvres protégées par le droit d'auteur du Times sous la forme de résultats de recherche synthétiques générés par Times Works qui sont apparus pour la première fois après la date limite d'avril 2023 pour les données utilisées pour former. Le dernier GPT-4 Turbo LLM d'OpenAI. Le premier reproduit les deux premiers paragraphes de l’article du New York Times de mai 2023 « Les heures précaires et terrifiantes après qu’une femme ait été poussée dans un train » :[33]




119. Le résultat synthétique ci-dessus de ChatGPT avec le plugin Browse with Bing comprend des extraits textuels de l’article original. Le texte de l'article copié est surligné en rouge ci-dessous



120. Le résultat synthétique affiche un contenu beaucoup plus expressif de l'article original que ce qui serait traditionnellement affiché dans un résultat de recherche Bing pour le même article, comme indiqué ci-dessous. Contrairement à un résultat de recherche traditionnel, le résultat synthétique n'inclut pas non plus de lien hypertexte visible renvoyant les utilisateurs vers le site Web du Times.



121. Cet exemple montre également Browse with Bing for ChatGPT reproduisant les deux premiers paragraphes de l'article du New York Times « Are the Hamptons Still Hip ? à partir de mai 2023.[34]



122. Le résultat synthétique ci-dessus de ChatGPT avec le plugin Browse with Bing comprend des extraits textuels de l’article original. Le texte de l'article copié est surligné en rouge ci-dessous.



123. Là encore, le résultat synthétique affiche un contenu beaucoup plus expressif de l’article original que ce qui serait traditionnellement affiché dans un résultat de recherche Bing pour le même article, comme indiqué ci-dessous. Contrairement à un résultat de recherche traditionnel, le résultat synthétique n'inclut pas non plus de lien hypertexte visible renvoyant les utilisateurs vers le site Web du Times.





Continuez la lecture ici .


[31] Pour l'article original, voir Patrick Kingsley et Ronen Bergman, The Secrets Hamas Knew About Israel's Military, NY TIMES (13 octobre 2023), https://www.nytimes.com/2023/10/13/world/ moyen-Orient/hamas-israel-attackgaza.html.


[32] Pour l'article original, voir Catherine Porter, To Experience Paris Up Close and Personal, Plunge Into a Public Pool, NY TIMES (3 septembre 2023), https://www.nytimes.com/2023/09/03 /monde/europe/paris-franceswimming-pools.html.


[33] Pour le contenu original, voir Hurubie Meko, The Precarious, Terrifying Hours After a Woman Was Shoved Into a Train, NY TIMES (25 mai 2023), https://www.nytimes.com/2023/05/25/ nyregion/subway-attack-womanshoved-manhattan.html.


[34] Pour l’article original, voir Anna Kodé, Are the Hamptons Still Hip ?, NY TIMES (26 mai 2023),

https://www.nytimes.com/2023/05/26/realestate/hamptons-summer-housing-costs.html.




À propos de la série PDF juridique de HackerNoon : Nous vous proposons les dossiers judiciaires techniques et perspicaces les plus importants du domaine public.


Cette affaire judiciaire 1:23-cv-11195 récupérée le 29 décembre 2023 sur nycto-assets.nytimes.com fait partie du domaine public. Les documents créés par le tribunal sont des œuvres du gouvernement fédéral et, en vertu de la loi sur le droit d'auteur, sont automatiquement placés dans le domaine public et peuvent être partagés sans restriction légale.