paint-brush
The Times v. Microsoft/OpenAI: Uso ilegal do trabalho do The Times para criar produtos de IA (1)por@legalpdf
181 leituras

The Times v. Microsoft/OpenAI: Uso ilegal do trabalho do The Times para criar produtos de IA (1)

por Legal PDF4m2024/01/02
Read on Terminal Reader

Muito longo; Para ler

O jornalismo independente é vital para a nossa democracia. Também é cada vez mais raro e valioso. Por mais de 170 anos, o The Times deu ao mundo profundamente...
featured image - The Times v. Microsoft/OpenAI: Uso ilegal do trabalho do The Times para criar produtos de IA (1)
Legal PDF HackerNoon profile picture

O processo judicial The New York Times Company v. Microsoft Corporation em 27 de dezembro de 2023 faz parte da série Legal PDF da HackerNoon . Você pode pular para qualquer parte deste arquivo aqui . Esta é a parte 1 de 27.

Requerente The New York Times Company (“The Times”), por seus advogados Susman Godfrey LLP e Rothwell, Figg, Ernst & Manbeck, PC, por sua queixa contra os Réus Microsoft Corporation (“Microsoft”) e OpenAI, Inc., OpenAI LP , OpenAI GP LLC, OpenAI LLC, OpenAI OpCo LLC, OpenAI Global LLC, OAI Corporation, LLC, OpenAI Holdings, LLC, (coletivamente “OpenAI” e, com a Microsoft, “Réus”), alegam o seguinte:

I. NATUREZA DA AÇÃO

1. O jornalismo independente é vital para a nossa democracia. Também é cada vez mais raro e valioso. Por mais de 170 anos, o The Times tem oferecido ao mundo um jornalismo independente, especializado e profundamente reportado. Os jornalistas do Times vão aonde a história está, muitas vezes com grande risco e custo, para informar o público sobre questões importantes e urgentes. Eles testemunham conflitos e desastres, prestam contas pelo uso do poder e iluminam verdades que de outra forma passariam despercebidas. O seu trabalho essencial é possível graças aos esforços de uma organização grande e dispendiosa que fornece apoio jurídico, de segurança e operacional, bem como de editores que garantem que o seu jornalismo cumpre os mais elevados padrões de precisão e imparcialidade. Este trabalho sempre foi importante. Mas num ecossistema de informação danificado e inundado de conteúdos não fiáveis, o jornalismo do The Times presta um serviço que se tornou ainda mais valioso para o público, ao fornecer informações fiáveis, análises de notícias e comentários.


2. O uso ilegal do trabalho do The Times pelos réus para criar produtos de inteligência artificial que concorram com ele ameaça a capacidade do The Times de fornecer esse serviço. As ferramentas de inteligência artificial generativa (“GenAI”) dos réus dependem de modelos de linguagem ampla (“LLMs”) que foram construídos copiando e usando milhões de artigos de notícias protegidos por direitos autorais do The Times, investigações aprofundadas, artigos de opinião, resenhas, instruções guias e muito mais. Embora os Réus tenham se envolvido em cópias em larga escala de muitas fontes, eles deram ênfase especial ao conteúdo do Times ao construir seus LLMs – revelando uma preferência que reconhece o valor dessas obras. Através do Bing Chat da Microsoft (recentemente rebatizado como “Copilot”) e do ChatGPT da OpenAI, os Réus procuram aproveitar o enorme investimento do The Times no seu jornalismo, utilizando-o para construir produtos substitutos sem permissão ou pagamento.


3. A Constituição e a Lei dos Direitos de Autor reconhecem a importância crítica de dar aos criadores direitos exclusivos sobre as suas obras. Desde a fundação da nossa nação, uma forte protecção dos direitos de autor capacitou aqueles que recolhem e divulgam notícias para garantir os frutos do seu trabalho e investimento. A lei de direitos autorais protege o jornalismo expressivo e original do The Times, incluindo, entre outros, seus milhões de artigos que possuem direitos autorais registrados.


4. Os réus recusaram reconhecer esta protecção. Alimentadas por LLMs contendo cópias do conteúdo do Times, as ferramentas GenAI dos Réus podem gerar resultados que recitam o conteúdo do Times literalmente, resumem-no de perto e imitam seu estilo expressivo, conforme demonstrado por vários exemplos. Veja o Anexo J. Essas ferramentas também atribuem erroneamente informações falsas ao The Times.


5. Os réus também usam o índice de pesquisa Bing da Microsoft, que copia e categoriza o conteúdo on-line do The Times, para gerar respostas que contêm trechos literais e resumos detalhados de artigos do Times que são significativamente mais longos e detalhados do que aqueles retornados pelos mecanismos de pesquisa tradicionais. Ao fornecer conteúdo do Times sem a permissão ou autorização do Times, as ferramentas dos Réus prejudicam e prejudicam o relacionamento do Times com seus leitores e privam o Times de assinaturas, licenciamento, publicidade e receitas de afiliados.


6. Utilizar a valiosa propriedade intelectual de terceiros desta forma, sem pagar por isso, tem sido extremamente lucrativo para os Réus. A implantação de LLMs treinados pelo Times pela Microsoft em toda a sua linha de produtos ajudou a aumentar sua capitalização de mercado em um trilhão de dólares somente no ano passado. E o lançamento do ChatGPT pela OpenAI elevou sua avaliação para até US$ 90 bilhões. Os interesses comerciais da GenAI dos réus estão profundamente interligados, com a Microsoft destacando recentemente que o uso dos “melhores modelos de fronteira da categoria” da OpenAI gerou clientes – incluindo “startups líderes de IA” – para o produto Azure AI da Microsoft.[1]


7. O Times opôs-se depois de descobrir que os Réus estavam a utilizar conteúdo do Times sem autorização para desenvolver os seus modelos e ferramentas. Durante meses, o The Times tentou chegar a um acordo negociado com os Réus, de acordo com o seu histórico de trabalho produtivo com grandes plataformas tecnológicas para permitir a utilização do seu conteúdo em novos produtos digitais (incluindo os produtos noticiosos desenvolvidos pela Google, Meta e Maçã). O objetivo do Times durante estas negociações era garantir que recebia um valor justo pela utilização do seu conteúdo, facilitar a continuação de um ecossistema de notícias saudável e ajudar a desenvolver a tecnologia GenAI de uma forma responsável que beneficie a sociedade e apoie um público bem informado.


8. Estas negociações não conduziram a uma resolução. Publicamente, os Réus insistem que a sua conduta é protegida como “uso justo” porque o uso não licenciado de conteúdo protegido por direitos autorais para treinar modelos GenAI serve um novo propósito “transformador”. Mas não há nada de “transformador” em usar o conteúdo do The Times sem pagamento para criar produtos que substituam o The Times e roubem audiências dele. Como os resultados dos modelos GenAI dos Réus competem e imitam de perto os dados usados para treiná-los, copiar os trabalhos do Times para esse fim não é um uso justo.


9. A lei não permite o tipo de infração sistemática e concorrencial que os Réus cometeram. Esta acção procura responsabilizá-los pelos milhares de milhões de dólares em danos estatutários e reais que devem pela cópia e utilização ilegais de obras de valor único do The Times.



Continue lendo aqui .


[1] Teleconferência sobre os lucros do primeiro trimestre do ano fiscal de 2024 da Microsoft, MICROSOFT INVESTOR RELATIONS (24 de outubro de 2023), https://www.microsoft.com/en-us/Investor/events/FY-2024/earnings-fy- 2024-q1.aspx.




Sobre a série de PDFs legais da HackerNoon: Trazemos a você os mais importantes processos judiciais técnicos e criteriosos de domínio público.


Este processo judicial 1:23-cv-11195 recuperado em 29 de dezembro de 2023, de nycto-assets.nytimes.com faz parte de domínio público. Os documentos criados judicialmente são obras do governo federal e, sob a lei de direitos autorais, são automaticamente colocados em domínio público e podem ser compartilhados sem restrições legais.