Судебное заявление компании New York Times против корпорации Microsoft от 27 декабря 2023 г. является частью серии юридических документов HackerNoon в формате PDF . Вы можете перейти к любой части этого файла здесь . Это часть 1 из 27.
Истец The New York Times Company («The Times»), своими адвокатами Susman Godfrey LLP и Rothwell, Figg, Ernst & Manbeck, PC, по жалобе против ответчиков Microsoft Corporation («Microsoft») и OpenAI, Inc., OpenAI LP , OpenAI GP LLC, OpenAI LLC, OpenAI OpCo LLC, OpenAI Global LLC, OAI Corporation, LLC, OpenAI Holdings, LLC (совместно именуемые «OpenAI» и совместно с Microsoft «Ответчики»), утверждает следующее:
1. Независимая журналистика жизненно важна для нашей демократии. Он также становится все более редким и ценным. На протяжении более 170 лет «Таймс» предоставляла миру содержательную, экспертную и независимую журналистику. Журналисты Times отправляются туда, где рассказывается история, часто с большим риском и ценой, чтобы информировать общественность о важных и насущных проблемах. Они являются свидетелями конфликтов и катастроф, обеспечивают ответственность за использование силы и освещают истины, которые в противном случае остались бы незамеченными. Их основная работа стала возможной благодаря усилиям крупной и дорогостоящей организации, обеспечивающей юридическую, охранную и оперативную поддержку, а также редакторов, которые следят за тем, чтобы их журналистика соответствовала самым высоким стандартам точности и справедливости. Эта работа всегда была важна. Но в рамках поврежденной информационной экосистемы, переполненной ненадежным контентом, журналистика The Times предоставляет услугу, которая стала еще более ценной для общественности за счет предоставления достоверной информации, анализа новостей и комментариев.
2. Незаконное использование ответчиками работ The Times для создания конкурирующих с ней продуктов искусственного интеллекта ставит под угрозу способность The Times предоставлять эти услуги. Инструменты генеративного искусственного интеллекта ответчиков («GenAI») основаны на моделях большого языка («LLM»), которые были созданы путем копирования и использования миллионов новостных статей The Times, защищенных авторским правом, углубленных расследований, мнений, обзоров, практических руководств. гиды и многое другое. Хотя Ответчики занимались широкомасштабным копированием из многих источников, они уделяли особое внимание содержанию Times при создании своих LLM, демонстрируя предпочтение, признающее ценность этих работ. С помощью Bing Chat от Microsoft (недавно переименованного в «Copilot») и ChatGPT от OpenAI Ответчики стремятся воспользоваться огромными инвестициями The Times в свою журналистику, используя их для создания замещающих продуктов без разрешения или оплаты.
3. Конституция и Закон об авторском праве признают исключительную важность предоставления авторам исключительных прав на их произведения. С момента основания нашей страны надежная защита авторских прав дала возможность тем, кто собирает и сообщает новости, обезопасить плоды своего труда и инвестиций. Закон об авторском праве защищает выразительную, оригинальную журналистику The Times, включая, помимо прочего, миллионы статей, на которые зарегистрированы авторские права.
4. Ответчики отказались признать эту защиту. Используя LLM, содержащие копии контента Times, инструменты GenAI Ответчиков могут генерировать выходные данные, которые дословно воспроизводят контент Times, точно резюмируют его и имитируют его выразительный стиль, о чем свидетельствует множество примеров. См. Приложение J. Эти инструменты также ошибочно приписывают The Times ложную информацию.
5. Ответчики также используют поисковый индекс Microsoft Bing, который копирует и классифицирует онлайн-контент The Times, для генерации ответов, содержащих дословные выдержки и подробные изложения статей Times, которые значительно длиннее и подробнее, чем те, которые возвращаются традиционными поисковыми системами. Предоставляя контент «Таймс» без разрешения или разрешения «Таймс», инструменты Ответчиков подрывают и вредят отношениям «Таймс» с ее читателями и лишают «Таймс» подписки, лицензирования, рекламы и партнерских доходов.
6. Использование ценной интеллектуальной собственности других лиц таким образом без оплаты за нее было чрезвычайно прибыльным для Ответчиков. Использование Microsoft LLM, прошедших обучение в Times, по всей линейке ее продуктов помогло увеличить ее рыночную капитализацию на триллион долларов только за последний год. А выпуск OpenAI ChatGPT увеличил его оценку до 90 миллиардов долларов. Бизнес-интересы ответчиков в области GenAI глубоко переплетены, и Microsoft недавно подчеркнула, что использование ею «лучших в своем классе передовых моделей OpenAI» привлекло клиентов, в том числе «ведущие стартапы в области искусственного интеллекта», для продукта Microsoft Azure AI.[1]
7. The Times подала возражение после того, как обнаружила, что Ответчики использовали контент Times без разрешения для разработки своих моделей и инструментов. В течение нескольких месяцев The Times пыталась достичь соглашения с Ответчиками путем переговоров, в соответствии с ее историей продуктивной работы с крупными технологическими платформами, чтобы разрешить использование ее контента в новых цифровых продуктах (включая новостные продукты, разработанные Google, Meta и Яблоко). Целью The Times в ходе этих переговоров было обеспечить получение справедливой стоимости за использование ее контента, способствовать продолжению здоровой новостной экосистемы и помочь ответственно развивать технологию GenAI, принося пользу обществу и поддерживая хорошо информированную общественность.
8. Эти переговоры не привели к решению. Публично Ответчики настаивают на том, что их поведение защищено как «добросовестное использование», поскольку нелицензионное использование ими контента, защищенного авторским правом, для обучения моделей GenAI служит новой «преобразующей» цели. Но нет ничего «преобразующего» в использовании контента «Таймс» без оплаты для создания продуктов, которые заменяют «Таймс» и отнимают у нее аудиторию. Поскольку результаты моделей GenAI Ответчиков конкурируют и близко имитируют входные данные, используемые для их обучения, копирование работ Times для этой цели не является добросовестным использованием.
9. Закон не допускает такого рода систематических и конкурентных нарушений, которые совершили Ответчики. Этот иск направлен на то, чтобы привлечь их к ответственности за установленные законом и фактические убытки в миллиарды долларов, которые они должны за незаконное копирование и использование уникально ценных произведений The Times.
Продолжить чтение здесь .
[1] Конференц-звонок Microsoft по итогам первого квартала 2024 финансового года, MICROSOFT INVESTOR RELATIONS (24 октября 2023 г.), https://www.microsoft.com/en-us/Investor/events/FY-2024/earnings-fy- 2024-q1.aspx.
О HackerNoon Legal PDF-серия: Мы представляем вам наиболее важные технические и содержательные материалы судебных дел, являющиеся общественным достоянием.
Это судебное дело 1:23-cv-11195, полученное 29 декабря 2023 г. с сайта nycto-assets.nytimes.com , является частью общественного достояния. Созданные судом документы являются произведениями федерального правительства и в соответствии с законом об авторском праве автоматически становятся общественным достоянием и могут распространяться без юридических ограничений.