paint-brush
The Times против Microsoft/OpenAI: несанкционированное получение и распространение текущих новостей (13)к@legalpdf
170 чтения

The Times против Microsoft/OpenAI: несанкционированное получение и распространение текущих новостей (13)

Слишком долго; Читать

Приложения синтетического поиска, созданные на основе LLM GPT, включая Bing Chat и Browse with Bing for ChatGPT, отображают обширные выдержки или перефразирования.
featured image - The Times против Microsoft/OpenAI: несанкционированное получение и распространение текущих новостей (13)
Legal PDF: Tech Court Cases HackerNoon profile picture

Судебное заявление компании New York Times против корпорации Microsoft от 27 декабря 2023 г. является частью серии юридических документов HackerNoon в формате PDF . Вы можете перейти к любой части этого файла здесь . Это часть 13 из 27.

IV. ФАКТИЧЕСКИЕ ОБЪЯВЛЕНИЯ

C. Несанкционированное использование и копирование материалов Times ответчиками

4. Несанкционированное получение и распространение текущих новостей


108. Приложения синтетического поиска, созданные на основе GPT LLM, включая Bing Chat и Browse with Bing for ChatGPT, отображают обширные выдержки или пересказы содержимого результатов поиска, включая контент Times, который, возможно, не был включен в обучающий набор модели. Техника «заземления», используемая в этих продуктах, включает получение подсказки от пользователя, копирование содержимого Times, связанного с подсказкой, из Интернета, предоставление подсказки вместе со скопированным содержимым Times в качестве дополнительного контекста для LLM и объединение LLM. перефразирует или цитирует скопированный контент Times для создания заменителей на естественном языке, которые служат той же информативной цели, что и оригинал. В некоторых случаях модели Ответчиков просто выплевывают несколько абзацев из статей The Times.


109. Содержание таких синтетических ответов часто выходит далеко за рамки фрагментов, которые обычно отображаются в обычных результатах поиска. Даже если ответы синтетического поиска включают ссылки на исходные материалы, пользователям меньше необходимости переходить к этим источникам, поскольку их выразительный контент уже цитируется или перефразируется в описательном результате. Действительно, такое указание на авторство может повысить вероятность того, что пользователи будут доверять только сводке и не будут переходить по ней для проверки.


110. Таким образом, синтетические результаты поиска отвлекают важный трафик от правообладателей, таких как The Times. Пользователь, который уже прочитал последние новости или нашел нужный продукт, даже (или особенно) со ссылкой на The New York Times, имеет меньше причин посещать первоисточник.


111. Ниже приведены несколько наглядных и неисчерпывающих примеров синтетических результатов поиска из Bing Chat и ChatGPT’s Browse with Bing.


а) Примеры результатов синтетического поиска в чате Bing


112. Как показано ниже, Bing Chat создает несанкционированные копии и производные Times Works в форме синтетических результатов поиска, сгенерированных из Times Works, которые впервые появились после прекращения в апреле 2023 года данных, используемых для обучения последней версии OpenAI GPT-4 Turbo LLM. 30 Первый включает длинную цитату из статьи New York Times за октябрь 2023 года «Секреты, которые ХАМАС знал об израильских вооруженных силах»:[31]




113. Приведенный выше синтетический вывод Bing Chat включает дословные выдержки из оригинальной статьи. Скопированный текст статьи выделен ниже красным.



114. Синтетический вывод отображает значительно более выразительный контент исходной статьи, чем тот, который традиционно отображался бы в результатах поиска Bing для той же статьи, как показано ниже. В отличие от традиционного результата поиска, синтетический результат также не включает в себя заметную гиперссылку, которая направляет пользователей на сайт The Times.



115. Еще один пример показывает, что Bing Chat широко воспроизводит текст из статьи New York Times за сентябрь 2023 года «Чтобы познакомиться с Парижем лично и поближе, окунитесь в общественный бассейн»:[32]



116. Приведенный выше синтетический вывод Bing Chat включает дословные выдержки из оригинальной статьи. Скопированный текст статьи выделен ниже красным.



117. Синтетический вывод отображает значительно более выразительный контент исходной статьи, чем тот, который традиционно отображался бы в результатах поиска Bing для той же статьи, как показано ниже. В отличие от традиционного результата поиска, синтетический результат также не включает в себя заметную гиперссылку, которая направляет пользователей на сайт The Times.



б) Синтетические результаты поиска из ChatGPT. Просмотр с помощью Bing.


118. Приведенные ниже примеры показывают, что плагин ChatGPT Browse with Bing также выводит несанкционированные копии и производные произведений, защищенных авторским правом, из The Times в виде синтетических результатов поиска, сгенерированных из Times Works, которые впервые появились после прекращения в апреле 2023 года данных, используемых для обучения. Последняя версия GPT-4 Turbo LLM от OpenAI. В первом воспроизводятся первые два абзаца статьи New York Times за май 2023 года «Ненадежные, ужасающие часы после того, как женщину затолкали в поезд»:[33]




119. Приведенный выше синтетический вывод ChatGPT с плагином Browse with Bing включает дословные выдержки из исходной статьи. Скопированный текст статьи выделен ниже красным цветом



120. Синтетический вывод отображает значительно более выразительное содержание исходной статьи, чем то, что традиционно отображалось бы в результатах поиска Bing для той же статьи, как показано ниже. В отличие от традиционного результата поиска, синтетический результат также не включает в себя заметную гиперссылку, которая направляет пользователей на сайт The Times.



121. В этом примере также показано, как «Просмотр с помощью Bing для ChatGPT» воспроизводит первые два абзаца статьи The New York Times «А Хэмптонс все еще моден?» с мая 2023 г.[34]



122. Приведенный выше синтетический вывод ChatGPT с плагином Browse with Bing включает дословные выдержки из исходной статьи. Скопированный текст статьи выделен ниже красным.



123. Опять же, синтетический вывод отображает значительно более выразительный контент исходной статьи, чем тот, который традиционно отображался бы в результатах поиска Bing для той же статьи, как показано ниже. В отличие от традиционного результата поиска, синтетический результат также не включает в себя заметную гиперссылку, которая направляет пользователей на сайт The Times.





Продолжить чтение здесь .


[31] Оригинал статьи см. Патрик Кингсли и Ронен Бергман, «Секреты, которые Хамас знал об израильских вооруженных силах», NY TIMES (13 октября 2023 г.), https://www.nytimes.com/2023/10/13/world/ middleeast/hamas-israel-attackgaza.html.


[32] Оригинал статьи см. Кэтрин Портер, «Чтобы увидеть Париж вблизи и лично, окунитесь в общественный бассейн», NY TIMES (3 сентября 2023 г.), https://www.nytimes.com/2023/09/03. /world/europe/paris-franceswimming-pools.html.


[33] Оригинальный контент см. Хуруби Меко, «Ненадежные, ужасающие часы после того, как женщину затолкали в поезд», NY TIMES (25 мая 2023 г.), https://www.nytimes.com/2023/05/25/ nyregion/subway-attack-womenshoved-manhattan.html.


[34] Оригинальную статью см. в статье Анны Коде, Are the Hamptons Still Hip?, NY TIMES (26 мая 2023 г.),

https://www.nytimes.com/2023/05/26/realestate/hamptons-summer-housing-costs.html.




О HackerNoon Legal PDF-серия: Мы представляем вам наиболее важные технические и содержательные материалы судебных дел, являющиеся общественным достоянием.


Это судебное дело 1:23-cv-11195, полученное 29 декабря 2023 г. с сайта nycto-assets.nytimes.com , является частью общественного достояния. Созданные судом документы являются произведениями федерального правительства и в соответствии с законом об авторском праве автоматически становятся общественным достоянием и могут распространяться без юридических ограничений.