paint-brush
The Times против Microsoft/OpenAI: несанкционированное воспроизведение Times работает в моделях GPT (11)к@legalpdf
180 чтения

The Times против Microsoft/OpenAI: несанкционированное воспроизведение Times работает в моделях GPT (11)

Слишком долго; Читать

Еще одним свидетельством обучения с использованием несанкционированных копий Times Works является то, что сами студенты GPT LLM «запомнили» копии многих из этих же работ, закодированные
featured image - The Times против Microsoft/OpenAI: несанкционированное воспроизведение Times работает в моделях GPT (11)
Legal PDF: Tech Court Cases HackerNoon profile picture

Судебное заявление компании New York Times против корпорации Microsoft от 27 декабря 2023 г. является частью серии юридических документов HackerNoon в формате PDF . Вы можете перейти к любой части этого файла здесь . Это часть 11 из 27.

IV. ФАКТИЧЕСКИЕ ОБЪЯВЛЕНИЯ

C. Несанкционированное использование и копирование материалов Times ответчиками

2. Воплощение несанкционированного воспроизведения и производных временных работ в моделях GPT


98. Еще одним свидетельством обучения с использованием несанкционированных копий Times Works является то, что сами студенты GPT LLM «запомнили» копии многих из этих же произведений, закодированные в их параметрах. Как показано ниже и в Приложении J, текущая версия LLM GPT-4 будет выводить почти дословные копии значительных частей Times Works, когда будет предложено сделать это. Такие заученные примеры представляют собой несанкционированные копии или производные работы Times Works, использованные для обучения модели.


99. Например, в 2019 году The Times опубликовала серию из пяти частей, получившую Пулитцеровскую премию, о хищническом кредитовании в сфере такси Нью-Йорка. 18-месячное расследование включало 600 допросов, более 100 запросов на записи, крупномасштабный анализ данных и проверку тысяч страниц внутренних банковских отчетов и других документов и в конечном итоге привело к уголовным расследованиям и принятию новых законов для предотвращения будущее злоупотребление. OpenAI не принимал участия в создании этого контента, но при минимальных подсказках перескажет большую его часть дословно:[26]



Экспонат J в 5.


100. Аналогичным образом, в 2012 году The Times опубликовала революционную серию статей, посвященную тому, как аутсорсинг Apple и других технологических компаний изменил глобальную экономику. Этот сериал стал результатом огромных усилий на трех континентах. Освещать эту историю было особенно сложно, потому что The Times неоднократно отказывали ни в интервью, ни в доступе. The Times связалась с сотнями нынешних и бывших руководителей Apple и в конечном итоге получила информацию от более чем шести десятков инсайдеров Apple. Опять же, GPT-4 скопировал этот контент и может воспроизводить большую часть его дословно:[27]


Приложение J в 3.


101. Приложение J содержит множество дополнительных примеров запоминания Times Works с помощью GPT-4. По имеющейся информации, эти примеры представляют собой небольшую часть работ Times Works, выразительное содержание которых в значительной степени закодировано в параметрах серии LLM GPT. Таким образом, каждый из этих LLM включает в себя множество несанкционированных копий или производных Times Works.



Продолжить чтение здесь .


[26] Оригинал статьи см. Брайан М. Розенталь, «Поскольку тысячи таксистов оказались в ловушке кредитов, высокопоставленные чиновники подсчитали деньги», NY TIMES (19 мая 2019 г.), https://www.nytimes.com/2019/ 19 мая/nyregion/taximedallions.html.


[27] Оригинал статьи см. в статье Чарльза Дахигга и Кейта Брэдшера, How the US Lost Out on iPhone Work, NY TIMES (21 января 2012 г.), https://www.nytimes.com/2012/01/22/business. /apple-america-and-a-squeezed-middleclass.html.




О HackerNoon Legal PDF-серия: Мы представляем вам наиболее важные технические и содержательные материалы судебных дел, являющиеся общественным достоянием.


Это судебное дело 1:23-cv-11195, полученное 29 декабря 2023 г. с сайта nycto-assets.nytimes.com , является частью общественного достояния. Созданные судом документы являются произведениями федерального правительства и в соответствии с законом об авторском праве автоматически становятся общественным достоянием и могут распространяться без юридических ограничений.