paint-brush
The Times v. Microsoft/OpenAI: recuperação e disseminação não autorizada de notícias atuais (13)por@legalpdf
174 leituras

The Times v. Microsoft/OpenAI: recuperação e disseminação não autorizada de notícias atuais (13)

Muito longo; Para ler

Aplicativos de pesquisa sintética criados nos LLMs da GPT, incluindo Bing Chat e Browse with Bing for ChatGPT, exibem extensos trechos ou paráfrases
featured image - The Times v. Microsoft/OpenAI: recuperação e disseminação não autorizada de notícias atuais (13)
Legal PDF: Tech Court Cases HackerNoon profile picture

O processo judicial The New York Times Company v. Microsoft Corporation em 27 de dezembro de 2023 faz parte da série Legal PDF da HackerNoon . Você pode pular para qualquer parte deste arquivo aqui . Esta é a parte 13 de 27.

4. ALEGAÇÕES FATUAIS

C. Uso não autorizado e cópia do conteúdo do Times pelos réus

4. Recuperação e divulgação não autorizada de notícias atuais


108. Os aplicativos de pesquisa sintética criados nos LLMs da GPT, incluindo o Bing Chat e o Browse with Bing for ChatGPT, exibem extensos trechos ou paráfrases do conteúdo dos resultados da pesquisa, incluindo o conteúdo do Times, que podem não ter sido incluídos no conjunto de treinamento do modelo. A técnica de “aterramento” empregada por esses produtos inclui receber uma solicitação de um usuário, copiar o conteúdo do Times relacionado à solicitação da Internet, fornecer a solicitação junto com o conteúdo copiado do Times como contexto adicional para o LLM e fazer com que o LLM seja costurado. paráfrases ou citações do conteúdo copiado do Times para criar substitutos em linguagem natural que sirvam ao mesmo propósito informativo do original. Em alguns casos, os modelos dos Réus simplesmente apresentam vários parágrafos dos artigos do The Times.


109. O conteúdo dessas respostas sintéticas muitas vezes vai muito além dos trechos normalmente mostrados nos resultados de pesquisas comuns. Mesmo quando as respostas de pesquisa sintética incluem links para materiais de origem, os utilizadores têm menos necessidade de navegar até essas fontes porque o seu conteúdo expressivo já está citado ou parafraseado no resultado narrativo. Na verdade, tal indicação de atribuição pode aumentar a probabilidade de os utilizadores confiarem apenas no resumo e não clicarem para verificar.


110. Desta forma, os resultados de pesquisa sintéticos desviam tráfego importante de detentores de direitos de autor como o The Times. Um usuário que já leu as últimas notícias ou encontrou o tipo certo de produto, mesmo – ou especialmente – com atribuição ao The New York Times, tem menos motivos para visitar a fonte original.


111. Abaixo estão alguns exemplos ilustrativos e não exaustivos de resultados de pesquisa sintéticos do Bing Chat e do Browse with Bing do ChatGPT.


a) Exemplos de resultados de pesquisa sintéticos do Bing Chat


112. Conforme mostrado abaixo, o Bing Chat cria cópias não autorizadas e derivados do Times Works na forma de resultados de pesquisa sintéticos gerados pelo Times Works que apareceram pela primeira vez após o limite de abril de 2023 para dados usados para treinar o mais recente GPT-4 Turbo LLM da OpenAI. 30 O primeiro inclui uma longa citação do artigo do New York Times de outubro de 2023 “Os segredos que o Hamas sabia sobre as forças armadas de Israel”:[31]




113. A saída sintética acima do Bing Chat inclui trechos literais do artigo original. O texto do artigo copiado está destacado em vermelho abaixo.



114. A saída sintética exibe conteúdo significativamente mais expressivo do artigo original do que seria tradicionalmente exibido em um resultado de pesquisa do Bing para o mesmo artigo, conforme mostrado abaixo. Ao contrário de um resultado de pesquisa tradicional, o resultado sintético também não inclui um hiperlink proeminente que direcione os usuários ao site do The Times.



115. Outro exemplo mostra o Bing Chat reproduzindo extensivamente o texto do artigo do New York Times de setembro de 2023 “Para experimentar Paris de perto e pessoalmente, mergulhe em uma piscina pública”:[32]



116. A saída sintética acima do Bing Chat inclui trechos literais do artigo original. O texto do artigo copiado está destacado em vermelho abaixo.



117. A saída sintética exibe conteúdo significativamente mais expressivo do artigo original do que o que seria tradicionalmente exibido em um resultado de pesquisa do Bing para o mesmo artigo, conforme mostrado abaixo. Ao contrário de um resultado de pesquisa tradicional, o resultado sintético também não inclui um hiperlink proeminente que direcione os usuários ao site do The Times.



b) Resultados de pesquisa sintéticos do ChatGPT Navegue com o Bing


118. Os exemplos abaixo mostram que o plug-in Browse with Bing do ChatGPT também gera cópias não autorizadas e derivados de obras protegidas por direitos autorais do The Times na forma de resultados de pesquisa sintéticos gerados pelo Times Works que apareceram pela primeira vez após o limite de abril de 2023 para dados usados para treinar O mais recente GPT-4 Turbo LLM da OpenAI. O primeiro reproduz os dois primeiros parágrafos do artigo do New York Times de maio de 2023 “As horas precárias e aterrorizantes depois que uma mulher foi empurrada para dentro de um trem”:[33]




119. A saída sintética acima do ChatGPT com o plugin Browse with Bing inclui trechos literais do artigo original. O texto do artigo copiado está destacado em vermelho abaixo



120. A saída sintética exibe conteúdo significativamente mais expressivo do artigo original do que seria tradicionalmente exibido em um resultado de pesquisa do Bing para o mesmo artigo, conforme mostrado abaixo. Ao contrário de um resultado de pesquisa tradicional, o resultado sintético também não inclui um hiperlink proeminente que direcione os usuários ao site do The Times.



121. Este exemplo também mostra Browse with Bing for ChatGPT reproduzindo os dois primeiros parágrafos do artigo do The New York Times “Are the Hamptons Still Hip?” a partir de maio de 2023.[34]



122. A saída sintética acima do ChatGPT com o plugin Browse with Bing inclui trechos literais do artigo original. O texto do artigo copiado está destacado em vermelho abaixo.



123. Mais uma vez, o resultado sintético exibe um conteúdo significativamente mais expressivo do artigo original do que o que seria tradicionalmente exibido em um resultado de pesquisa do Bing para o mesmo artigo, conforme mostrado abaixo. Ao contrário de um resultado de pesquisa tradicional, o resultado sintético também não inclui um hiperlink proeminente que direcione os usuários ao site do The Times.





Continue lendo aqui .


[31] Para artigo original, consulte Patrick Kingsley e Ronen Bergman, The Secrets Hamas Knew About Israel's Military, NY TIMES (13 de outubro de 2023), https://www.nytimes.com/2023/10/13/world/ middleeast/hamas-israel-attackgaza.html.


[32] Para ver o artigo original, consulte Catherine Porter, To Experience Paris Up Close and Personal, Plunge Into a Public Pool, NY TIMES (3 de setembro de 2023), https://www.nytimes.com/2023/09/03 /world/europe/paris-franceswimming-pools.html.


[33] Para conteúdo original, consulte Hurubie Meko, The Precarious, Terrifying Hours After a Woman Was Shoved Into a Train, NY TIMES (25 de maio de 2023), https://www.nytimes.com/2023/05/25/ nyregion/subway-attack-womanshoved-manhattan.html.


[34] Para artigo original, consulte Anna Kodé, Are the Hamptons Still Hip?, NY TIMES (26 de maio de 2023),

https://www.nytimes.com/2023/05/26/realestate/hamptons-summer-housing-costs.html.




Sobre a série de PDFs legais da HackerNoon: Trazemos a você os mais importantes processos judiciais técnicos e criteriosos de domínio público.


Este processo judicial 1:23-cv-11195 recuperado em 29 de dezembro de 2023, de nycto-assets.nytimes.com faz parte de domínio público. Os documentos criados judicialmente são obras do governo federal e, sob a lei de direitos autorais, são automaticamente colocados em domínio público e podem ser compartilhados sem restrições legais.