paint-brush
The Times contra Microsoft/OpenAI: recuperación y difusión no autorizada de noticias actuales (13)por@legalpdf
170 lecturas

The Times contra Microsoft/OpenAI: recuperación y difusión no autorizada de noticias actuales (13)

Demasiado Largo; Para Leer

Las aplicaciones de búsqueda sintética creadas en los LLM de GPT, incluidos Bing Chat y Browse with Bing for ChatGPT, muestran extractos o paráfrasis extensos.
featured image - The Times contra Microsoft/OpenAI: recuperación y difusión no autorizada de noticias actuales (13)
Legal PDF: Tech Court Cases HackerNoon profile picture

La presentación judicial del New York Times Company contra Microsoft Corporation del 27 de diciembre de 2023 es parte de la serie PDF legal de HackerNoon . Puede saltar a cualquier parte de este archivo aquí . Esta es la parte 13 de 27.

IV. ALEGACIONES DE HECHO

C. Uso no autorizado y copia del contenido del Times por parte de los demandados

4. Recuperación y difusión no autorizadas de noticias de actualidad


108. Las aplicaciones de búsqueda sintética creadas sobre los LLM de GPT, incluidos Bing Chat y Browse with Bing for ChatGPT, muestran extractos extensos o paráfrasis del contenido de los resultados de búsqueda, incluido el contenido del Times, que pueden no haber sido incluidos en el conjunto de entrenamiento del modelo. La técnica de "conexión a tierra" empleada por estos productos incluye recibir un mensaje de un usuario, copiar el contenido del Times relacionado con el mensaje de Internet, proporcionar el mensaje junto con el contenido copiado del Times como contexto adicional para el LLM y hacer que el LLM se una. paráfrasis o citas del contenido copiado del Times para crear sustitutos en lenguaje natural que tengan el mismo propósito informativo que el original. En algunos casos, los modelos de los demandados simplemente escupen varios párrafos de los artículos del Times.


109. El contenido de esas respuestas sintéticas suele ir mucho más allá de los fragmentos que suelen mostrarse en los resultados de búsqueda habituales. Incluso cuando las respuestas de búsqueda sintética incluyen enlaces a materiales fuente, los usuarios tienen menos necesidad de navegar hasta esas fuentes porque su contenido expresivo ya está citado o parafraseado en el resultado narrativo. De hecho, dicha indicación de atribución puede hacer que sea más probable que los usuarios confíen únicamente en el resumen y no hagan clic para verificarlo.


110. De esta manera, los resultados de búsqueda sintéticos desvían tráfico importante de los titulares de derechos de autor como The Times. Un usuario que ya ha leído las últimas noticias o ha encontrado el tipo de producto adecuado, incluso (o especialmente) con atribución a The New York Times, tiene menos motivos para visitar la fuente original.


111. A continuación se muestran algunos ejemplos ilustrativos y no exhaustivos de resultados de búsqueda sintéticos de Bing Chat y Browse with Bing de ChatGPT.


a) Ejemplos de resultados de búsqueda sintéticos de Bing Chat


112. Como se muestra a continuación, Bing Chat crea copias no autorizadas y derivados de Times Works en forma de resultados de búsqueda sintéticos generados a partir de Times Works que aparecieron por primera vez después del límite de abril de 2023 para los datos utilizados para entrenar el último GPT-4 Turbo LLM de OpenAI. 30 El primero incluye una larga cita del artículo del New York Times de octubre de 2023 “Los secretos que Hamás sabía sobre el ejército de Israel”:[31]




113. El resultado sintético anterior de Bing Chat incluye extractos textuales del artículo original. El texto del artículo copiado está resaltado en rojo a continuación.



114. El resultado sintético muestra un contenido significativamente más expresivo del artículo original que el que tradicionalmente se mostraría en un resultado de búsqueda de Bing para el mismo artículo, como se muestra a continuación. A diferencia de un resultado de búsqueda tradicional, el resultado sintético tampoco incluye un hipervínculo destacado que envíe a los usuarios al sitio web del Times.



115. Otro ejemplo muestra que Bing Chat reproduce ampliamente el texto del artículo del New York Times de septiembre de 2023 “Para experimentar París de cerca y en persona, sumérjase en una piscina pública”:[32]



116. El resultado sintético anterior de Bing Chat incluye extractos textuales del artículo original. El texto del artículo copiado está resaltado en rojo a continuación.



117. El resultado sintético muestra un contenido significativamente más expresivo del artículo original que el que tradicionalmente se mostraría en un resultado de búsqueda de Bing para el mismo artículo, como se muestra a continuación. A diferencia de un resultado de búsqueda tradicional, el resultado sintético tampoco incluye un hipervínculo destacado que envíe a los usuarios al sitio web del Times.



b) Resultados de búsqueda sintéticos de ChatGPT Navegar con Bing


118. Los siguientes ejemplos muestran que el complemento Browse with Bing de ChatGPT también genera copias no autorizadas y derivados de obras protegidas por derechos de autor de The Times en forma de resultados de búsqueda sintéticos generados a partir de Times Works que aparecieron por primera vez después del límite de abril de 2023 para los datos utilizados para entrenar. El último LLM GPT-4 Turbo de OpenAI. El primero reproduce los dos primeros párrafos del artículo del New York Times de mayo de 2023 “Las horas precarias y aterradoras después de que una mujer fuera empujada a un tren”:[33]




119. El resultado sintético anterior de ChatGPT con el complemento Navegar con Bing incluye extractos textuales del artículo original. El texto del artículo copiado está resaltado en rojo a continuación.



120. El resultado sintético muestra contenido significativamente más expresivo del artículo original que lo que tradicionalmente se mostraría en un resultado de búsqueda de Bing para el mismo artículo, como se muestra a continuación. A diferencia de un resultado de búsqueda tradicional, el resultado sintético tampoco incluye un hipervínculo destacado que envíe a los usuarios al sitio web del Times.



121. Este ejemplo también muestra Navegar con Bing para ChatGPT reproduciendo los dos primeros párrafos del artículo del New York Times “¿Siguen los Hamptons de moda?” desde mayo de 2023.[34]



122. El resultado sintético anterior de ChatGPT con el complemento Navegar con Bing incluye extractos textuales del artículo original. El texto del artículo copiado está resaltado en rojo a continuación.



123. Nuevamente, el resultado sintético muestra contenido significativamente más expresivo del artículo original que lo que tradicionalmente se mostraría en un resultado de búsqueda de Bing para el mismo artículo, como se muestra a continuación. A diferencia de un resultado de búsqueda tradicional, el resultado sintético tampoco incluye un hipervínculo destacado que envíe a los usuarios al sitio web del Times.





Continuar leyendo aquí .


[31] Para consultar el artículo original, consulte Patrick Kingsley y Ronen Bergman, The Secrets Hamas Knew About Israel's Military, NY TIMES (13 de octubre de 2023), https://www.nytimes.com/2023/10/13/world/ medio oriente/hamas-israel-attackgaza.html.


[32] Para consultar el artículo original, consulte Catherine Porter, To Experience Paris Up Close and Personal, Plunge Into a Public Pool, NY TIMES (3 de septiembre de 2023), https://www.nytimes.com/2023/09/03 /world/europe/paris-franceswimming-pools.html.


[33] Para contenido original, consulte Hurubie Meko, The Precarious, Terrifying Hours After a Woman Was Pushed Into a Train, NY TIMES (25 de mayo de 2023), https://www.nytimes.com/2023/05/25/ nyregion/subway-attack-womanshoved-manhattan.html.


[34] Para consultar el artículo original, consulte Anna Kodé, Are the Hamptons Still Hip?, NY TIMES (26 de mayo de 2023),

https://www.nytimes.com/2023/05/26/realestate/hamptons-summer-housing-costs.html.




Acerca de la serie PDF Legal de HackerNoon: Le traemos los expedientes judiciales de dominio público más importantes, técnicos y reveladores.


Este caso judicial 1:23-cv-11195 recuperado el 29 de diciembre de 2023 de nycto-assets.nytimes.com es parte del dominio público. Los documentos creados por el tribunal son obras del gobierno federal y, según la ley de derechos de autor, se colocan automáticamente en el dominio público y se pueden compartir sin restricciones legales.