paint-brush
The Times против Microsoft/OpenAI: бизнес-модель, основанная на массовом нарушении авторских прав (8)к@legalpdf
252 чтения

The Times против Microsoft/OpenAI: бизнес-модель, основанная на массовом нарушении авторских прав (8)

Слишком долго; Читать

OpenAI стартовала с стартового капитала в размере 1 миллиарда долларов от своих основателей, группы самых богатых технологических предпринимателей, инвесторов и компаний.
featured image - The Times против Microsoft/OpenAI: бизнес-модель, основанная на массовом нарушении авторских прав (8)
Legal PDF: Tech Court Cases HackerNoon profile picture

Судебное заявление компании New York Times против корпорации Microsoft от 27 декабря 2023 г. является частью серии юридических документов HackerNoon в формате PDF . Вы можете перейти к любой части этого файла здесь . Это 8 часть из 27.

IV. ФАКТИЧЕСКИЕ ОБЪЯВЛЕНИЯ

B. Продукты GenAI ответчиков

1. Бизнес-модель, основанная на массовом нарушении авторских прав


55. OpenAI была основана в декабре 2015 года как «некоммерческая исследовательская компания в области искусственного интеллекта». OpenAI стартовала с стартового капитала в размере 1 миллиарда долларов от своих основателей, группы самых богатых технологических предпринимателей и инвесторов, а также таких компаний, как Amazon Web Services и InfoSys. В эту группу входили Илон Маск, генеральный директор Tesla и X Corp. (ранее известной как Twitter); Рид Хоффман, соучредитель LinkedIn; Сэм Альтман, бывший президент Y Combinator; и Грег Брокман, бывший технический директор Stripe.


56. Несмотря на то, что при своем основании OpenAI приняла очень крупные инвестиции от чрезвычайно богатых компаний и частных лиц, первоначально она утверждала, что ее исследования и работа будут совершенно не мотивированы прибылью. В пресс-релизе от 11 декабря 2015 года Брокман и соучредитель Лия Суцкевер (ныне президент и главный научный сотрудник OpenAI соответственно) написали: «Наша цель — продвигать цифровой интеллект таким образом, чтобы это с наибольшей вероятностью принесло пользу человечеству в целом». , не ограниченный необходимостью получения финансовой отдачи. Поскольку наши исследования свободны от финансовых обязательств, мы можем лучше сосредоточиться на положительном воздействии на человека». В соответствии с этой миссией OpenAI пообещала, что ее работа и интеллектуальная собственность будут открыты и доступны для общественности, что ее «[исследователям] будет настоятельно предложено публиковать свои работы, будь то в виде статей, сообщений в блогах или кода» и что его «патенты (если таковые имеются) будут доступны всему миру».


57. Несмотря на свои первоначальные обещания альтруизма, OpenAI быстро превратилась в многомиллиардный коммерческий бизнес, построенный в значительной степени на нелицензионном использовании произведений, защищенных авторским правом, принадлежащих The Times и другим. Всего через три года после своего основания OpenAI утратила статус исключительно некоммерческой организации. В марте 2019 года она создала OpenAI LP, коммерческую компанию, занимающуюся львиной долей операций OpenAI, включая разработку продуктов, и привлечением капитала от инвесторов, стремящихся получить прибыль. Корпоративная структура OpenAI превратилась в сложную сеть коммерческих холдинговых, операционных и подставных компаний, которые управляют повседневной деятельностью OpenAI и предоставляют инвесторам OpenAI (в первую очередь Microsoft) полномочия и влияние на операции OpenAI, одновременно привлекая миллиарды долларов в виде инвестиций. капитал от инвесторов. Результат: сегодня OpenAI — это коммерческое предприятие, стоимость которого оценивается в 90 миллиардов долларов, а в 2024 году прогнозируется, что выручка превысит 1 миллиард долларов.


58. С переходом к коммерческому статусу произошло еще одно изменение: OpenAI также прекратила свою деятельность.

приверженность открытости. OpenAI выпустила первые две итерации своей флагманской модели GenAI.

GPT-1 и GPT-2 в открытом доступе в 2018 и 2019 годах соответственно. Но OpenAI изменился

курс в 2020 году, начиная с выпуска GPT-3 вскоре после OpenAI LP и других коммерческих

Были сформированы подразделения OpenAI, которые взяли под свой контроль проектирование и разработку продуктов.


59. GPT-3.5 и GPT-4 на порядок мощнее двух предыдущих поколений, однако Ответчики держали их конструкцию и подготовку в полном секрете. Для предыдущих поколений OpenAI имел объемные отчеты с подробным описанием содержания обучающего набора, конструкции и аппаратного обеспечения LLM. Не так для GPT-3.5 или GPT-4. Например, для GPT-4 в «техническом отчете», опубликованном OpenAI, говорится: «Этот отчет не содержит дополнительных подробностей об архитектуре (включая размер модели), аппаратном обеспечении, обучающих вычислениях, построении набора данных, методе обучения и т. д.». 3]


60. Главный научный сотрудник OpenAI Суцкевер оправдал эту секретность коммерческими соображениями: «Там конкуренция…. И есть много компаний, которые хотят сделать то же самое, поэтому с точки зрения конкуренции вы можете рассматривать это как развитие отрасли». модели от правообладателей, таких как The Times.


61. Имя OpenAI стало нарицательным после выпуска ChatGPT в ноябре 2022 года. ChatGPT — это чат-бот, генерирующий текст, который, учитывая подсказки, созданные пользователем, может имитировать человеческие ответы на естественном языке. ChatGPT мгновенно стал вирусной сенсацией, охватив один миллион пользователей в течение месяца после его выпуска и более 100 миллионов пользователей в течение трех месяцев.


62. OpenAI через OpenAI OpCo LLC и по указанию OpenAI Inc., OpenAI LP и других организаций OpenAI предлагает набор услуг на базе своих LLM, ориентированных как на обычных потребителей, так и на предприятия. Версия ChatGPT на базе GPT-3.5 доступна пользователям бесплатно. OpenAI также предлагает потребителям премиальную услугу на базе «самой функциональной модели OpenAI» GPT-4 за 20 долларов в месяц. Предложения OpenAI, ориентированные на бизнес, включают инструменты ChatGPT Enterprise и ChatGPT API, позволяющие разработчикам включать ChatGPT в индивидуальные приложения. OpenAI также лицензирует свою технологию корпоративным клиентам за лицензионные сборы.


63. Эти коммерческие предложения оказались чрезвычайно ценными для OpenAI. Более 80% компаний из списка Fortune 500 используют ChatGPT.[5] Согласно последним отчетам, OpenAI генерирует доход в размере 80 миллионов долларов в месяц и может превысить 1 миллиард долларов в течение следующих 12 месяцев.[6]


64. Этот коммерческий успех во многом основан на крупномасштабном нарушении авторских прав со стороны OpenAI. Одной из основных особенностей, способствующих использованию и продажам ChatGPT и связанных с ним продуктов, является способность LLM создавать текст на естественном языке в различных стилях. Чтобы добиться этого результата, OpenAI в ходе «обучения» LLM сделала многочисленные репродукции защищенных авторским правом произведений, принадлежащих The Times.


65. По имеющейся информации и предположениям, все Ответчики OpenAI были либо непосредственно вовлечены в широкомасштабные нарушения OpenAI и коммерческую эксплуатацию Times Works, либо направляли, контролировали их и получали прибыль от них. OpenAI Inc. вместе с Microsoft контролировала и направляла широкое воспроизведение, распространение и коммерческое использование материалов The Times, осуществляемое OpenAI LP и OpenAI Global LLC через ряд холдинговых и подставных компаний, в число которых входят OpenAI Holdings LLC, OpenAI GP LLC, и ООО «Корпорация ОАИ». OpenAI LP и OpenAI Global LLC принимали непосредственное участие в проектировании, разработке и коммерциализации продуктов OpenAI на основе GPT, а также непосредственно участвовали в широком воспроизведении, распространении и коммерческом использовании Times Works. OpenAI LP и OpenAI Global LLC также контролировали и руководили OpenAI, LLC и OpenAI OpCo LLC, которые занимались распространением, продажей и лицензированием продуктов OpenAI на основе GPT и, таким образом, монетизировали воспроизведение, распространение и коммерческое использование Times Works.


66. По крайней мере, с 2019 года Microsoft принимала и продолжает активно участвовать в обучении, разработке и коммерциализации продуктов OpenAI GPT. В интервью Wall Street Journal на Всемирном экономическом форуме 2023 года генеральный директор Microsoft Сатья Наделла сказал, что «семейство моделей ChatGPT и GPT… это то, с чем мы уже несколько лет тесно сотрудничаем с OpenAI». Благодаря этому партнерству Microsoft участвовала в создании и коммерциализации программ GPT LLM и продуктов на их основе как минимум двумя способами.


67. Во-первых, Microsoft создала и эксплуатировала специальные компьютерные системы для осуществления массовых нарушений авторских прав, подробно описанных здесь. Эти системы использовались для создания многократного воспроизведения интеллектуальной собственности The Times с целью создания моделей GPT, которые используют и, во многих случаях, сохраняют значительную часть выражений, охраняемых авторским правом, содержащихся в этих произведениях.


68. Microsoft является единственным поставщиком облачных вычислений для OpenAI. Microsoft и OpenAI совместно разработали суперкомпьютерные системы на базе облачной компьютерной платформы Microsoft Azure, которые использовались для обучения всех моделей OpenAI GPT после GPT-1. В программной речи на конференции Microsoft Inspire в июле 2023 года г-н Наделла сказал: «Мы создали инфраструктуру для обучения их моделей. Они внедряют инновации в алгоритмы и обучение этих передовых моделей».


69. Эта инфраструктура представляла собой не просто компьютерные системы общего назначения, которые OpenAI могла использовать по своему усмотрению. Microsoft специально разработала его с целью использования практически всего Интернета (с непропорционально большим количеством Times Works) для обучения самых способных LLM в истории. В интервью в феврале 2023 года г-н Наделла сказал:


Но помните, что под тем, что OpenAI выпускает в виде больших моделей,

тяжелая работа была проделана командой [Microsoft] Azure по созданию

компьютерная инфраструктура. Поскольку эти рабочие нагрузки настолько

отличается от всего, что было раньше. Поэтому нам нужно было

полностью переосмыслить даже центр обработки данных вплоть до инфраструктуры, которая

сначала дал нам даже шанс построить модели. И теперь мы

перевод моделей в продукты.[7]


70. Microsoft построила этот суперкомпьютер «в сотрудничестве с OpenAI и исключительно для него» и «спроектировала [его] специально для обучения моделей искусственного интеллекта этой компании». [8] Даже по стандартам суперкомпьютеров он был необычайно сложным. По словам Microsoft, он работал как «единая система с более чем 285 000 процессорными ядрами, 10 000 графическими процессорами и 400 гигабитами в секунду сетевого подключения для каждого графического сервера». Эта система вошла в пятерку самых мощных общеизвестных суперкомпьютерных систем в мире.


71. Чтобы убедиться, что суперкомпьютерная система соответствует потребностям OpenAI, Microsoft необходимо было протестировать систему как независимо, так и в сотрудничестве с разработчиками программного обеспечения OpenAI. По словам г-на Наделлы в отношении OpenAI: «Они создают базовые модели, а мы [Microsoft] много работаем над ними, включая инструменты для ответственного ИИ и безопасности ИИ». По имеющейся информации и убеждениям, такое «инструментирование вокруг ИИ и безопасности ИИ» включает в себя тонкую настройку и калибровку продуктов на основе GPT перед их выпуском для широкой публики.[9]


72. В сотрудничестве с OpenAI Microsoft также коммерциализировала технологию OpenAI на основе GPT и объединила ее со своим собственным поисковым индексом Bing. В феврале 2023 года Microsoft представила Bing Chat, функцию чат-бота с генеративным искусственным интеллектом в своей поисковой системе на базе GPT-4. В мае 2023 года Microsoft и OpenAI представили «Просмотр с помощью Bing», плагин для ChatGPT, который позволил ему получить доступ к новейшему контенту в Интернете через поисковую систему Microsoft Bing. Bing Chat и Browse with Bing сочетают в себе способность GPT-4 имитировать человеческое выражение, в том числе выражение The Times, с возможностью генерировать на естественном языке краткое изложение содержимого результатов поиска, включая обращения к Times Works, что устраняет необходимость посещения собственных веб-сайтов The Times. . Эти «синтетические» результаты поиска призваны напрямую отвечать на запросы пользователей и могут включать в себя обширные пересказы и прямые цитаты из репортажей Times. Такое копирование поддерживает взаимодействие с собственными сайтами и приложениями Ответчиков, вместо того, чтобы перенаправлять пользователей в The Times так же, как обычные списки результатов поиска.


73. В недавнем интервью г-н Наделла признал тесное участие Microsoft в деятельности OpenAI и, следовательно, нарушение авторских прав:


[Мы] были очень уверены в своих силах. У нас есть все права интеллектуальной собственности и все возможности. Если завтра OpenAI исчезнет, я не хочу, чтобы кто-либо из наших клиентов беспокоился об этом, честно говоря, потому что у нас есть все права продолжать инновации. Не только для того, чтобы обслуживать продукт, но мы можем пойти и просто сделать то, что мы делали в партнерстве сами. У нас есть люди, у нас есть компьютеры, у нас есть данные, у нас есть все.


74. Благодаря своему сотрудничеству как в создании, так и в коммерциализации моделей GPT, Ответчики получили прибыль от массового нарушения авторских прав, коммерческой эксплуатации и незаконного присвоения интеллектуальной собственности The Times. Как недавно выразился г-н Наделла: «[OpenAI] делает ставку на нас, мы делаем ставку на них». Он продолжил, описывая эффект от инвестиций Microsoft в 13 миллиардов долларов:


И это дает нам значительные права, как я уже сказал. И еще эта штука, она ведь не без помощи рук, верно? Мы там. Мы ниже их, над ними, вокруг них. Мы оптимизируем ядро, создаем инструменты, создаем инфраструктуру. Вот почему я думаю, что многие промышленные аналитики говорят: «Ого, это действительно совместный проект Microsoft и OpenAI». Реальность такова, что мы, как я уже сказал, очень самодостаточны во всем этом.





Продолжить чтение здесь .


[3] OPENAI, ТЕХНИЧЕСКИЙ ОТЧЕТ GPT-4 (2023 г.), https://cdn.openai.com/papers/gpt-4.pdf.


[4] Джеймс Винсент, соучредитель OpenAI, о прошлом подходе компании к открытому обмену результатами исследований: «Мы были неправы», THE VERGE (15 марта 2023 г.), https://www.theverge.com/2023/3/15 /23640180/openai-gpt-4-launch-closedresearch-ilya-sutskever-interview.


[5] OpenAI, Представляем ChatGPT Enterprise, OPENAI (28 августа 2023 г.), https://openai.com/blog/introducing-chatgpt-enterprise.


[6] Крис Моррис, Годовой объем продаж OpenAI приближается к 1 миллиарду долларов, FAST COMPANY (30 августа 2023 г.), https://www.fastcompany.com/90946849/openai-chatgpt-reportedly-nears-1-billion-annual -продажи.


[7] Впервые на CNBC: Стенограмма CNBC: Генеральный директор Microsoft Сатья Наделла беседует с Джоном Форттом из CNBC

«Мощный обед» сегодня, CNBC (7 февраля 2023 г.), https://www.cnbc.com/2023/02/07/first-on-cnbc-cnbc-transcriptmicrosoft-ceo-satya-nadella-speaks-with -cnbcs-jon-fortt-on-power-lunch-today.html.


[8] Дженнифер Лэнгстон, Microsoft анонсирует новый суперкомпьютер, излагает концепцию будущей работы в области искусственного интеллекта, MICROSOFT (19 мая 2020 г.), https://news.microsoft.com/source/features/ai/openai-azure-supercomputer/. 9 СЕБАСТЬЕН БУБЕК И ДР., ИСКРЫ ИСКУССТВЕННОГО ОБЩЕГО ИНТЕЛЛЕКТА: РАННИЕ ЭКСПЕРИМЕНТЫ С GPT-4 (2023), https://arxiv.org/pdf/2303.12712.pdf




О HackerNoon Legal PDF-серия: Мы представляем вам наиболее важные технические и содержательные материалы судебных дел, являющиеся общественным достоянием.


Это судебное дело 1:23-cv-11195, полученное 29 декабря 2023 г. с сайта nycto-assets.nytimes.com , является частью общественного достояния. Документы, созданные судом, являются произведениями федерального правительства и в соответствии с законом об авторском праве автоматически становятся общественным достоянием и могут распространяться без юридических ограничений.