paint-brush
The Times 대 Microsoft/OpenAI: 대량 저작권 침해에 기반한 비즈니스 모델(8)by@legalpdf
207

The Times 대 Microsoft/OpenAI: 대량 저작권 침해에 기반한 비즈니스 모델(8)

Legal PDF9m2024/01/02
Read on Terminal Reader

OpenAI는 가장 부유한 기술 기업가, 투자자 및 기업으로 구성된 창립자들의 초기 자금 10억 달러로 시작되었습니다.
featured image - The Times 대 Microsoft/OpenAI: 대량 저작권 침해에 기반한 비즈니스 모델(8)
Legal PDF HackerNoon profile picture

New York Times Company v. Microsoft Corporation 법원에 2023년 12월 27일 제출된 소송은 HackerNoon의 법적 PDF 시리즈 의 일부입니다. 여기에서 이 서류의 어느 부분으로든 이동할 수 있습니다. 27개 중 8번째 부분입니다.

IV. 사실적 주장

B. 피고의 GenAI 제품

1. 대량 저작권 침해에 기반한 비즈니스 모델


55. OpenAI는 2015년 12월 “비영리 인공지능 연구회사”로 설립되었습니다. OpenAI는 창립자, 가장 부유한 기술 기업가, 투자자, Amazon Web Services 및 InfoSys와 같은 회사의 초기 자금 10억 달러로 시작되었습니다. 이 그룹에는 Tesla 및 X Corp.(이전에는 Twitter로 알려짐)의 CEO인 Elon Musk가 포함되었습니다. LinkedIn의 공동 창업자인 Reid Hoffman; Y Combinator의 전 사장 Sam Altman; 그리고 Stripe의 전 최고 기술 책임자(CTO)인 Greg Brockman도 있습니다.


56. OpenAI는 창립 당시 엄청나게 부유한 기업과 개인으로부터 대규모 투자를 받아들였음에도 불구하고 원래 연구와 작업이 이익에 의해 전혀 동기가 부여되지 않을 것이라고 주장했습니다. 2015년 12월 11일 보도 자료에서 Brockman과 공동 창립자 Lya Sutskever(현재 OpenAI의 사장 겸 수석 과학자)는 다음과 같이 썼습니다. “우리의 목표는 인류 전체에 가장 도움이 되는 방식으로 디지털 지능을 발전시키는 것입니다. , 재정적 수익을 창출해야 하는 필요성에 제약을 받지 않습니다. 우리 연구에는 재정적 의무가 없기 때문에 인간에게 긍정적인 영향을 미치는 데 더 집중할 수 있습니다.” 해당 사명에 따라 OpenAI는 자신의 작업과 지적 재산이 대중에게 공개되어 이용 가능하며 “연구원들이 자신의 작업을 논문, 블로그 게시물 또는 코드 형태로 게시하도록 강력히 권장할 것”이라고 약속했습니다. “특허가 (있다면) 세계와 공유될 것”이라는 것입니다.


57. 초기에 이타주의를 약속했음에도 불구하고, OpenAI는 The Times와 다른 회사에 속한 저작물의 무면허 이용을 기반으로 빠르게 수십억 달러 규모의 영리 사업이 되었습니다. OpenAI는 설립된 지 불과 3년 만에 독점적 비영리 지위를 벗어났습니다. 2019년 3월에는 제품 개발을 포함하여 OpenAI 운영의 대부분을 수행하고 수익을 추구하는 투자자로부터 자본을 조달하는 데 전념하는 영리 회사인 OpenAI LP를 설립했습니다. OpenAI의 기업 구조는 OpenAI의 일상적인 운영을 관리하고 OpenAI의 투자자(가장 두드러지게는 Microsoft)에게 OpenAI의 운영에 대한 권한과 영향력을 부여하는 동시에 수십억 달러를 모금하는 영리를 위한 지주, 운영 및 쉘 회사의 복잡한 웹으로 성장했습니다. 투자자로부터의 자본. 결과: 오늘날 OpenAI는 가치가 900억 달러에 달하는 상업 기업으로 성장했으며, 2024년에는 매출이 10억 달러를 넘을 것으로 예상됩니다.


58. 영리 목적으로 전환하면서 또 다른 변화가 생겼습니다. OpenAI도 종료되었습니다.

개방에 대한 약속. OpenAI는 자사의 주력 GenAI 모델의 처음 두 가지 반복을 출시했습니다.

GPT-1과 GPT-2는 각각 2018년과 2019년에 오픈 소스 기반으로 출시됩니다. 하지만 OpenAI는 변했다

2020년 OpenAI LP 직후 GPT-3 출시를 시작으로 기타 영리 목적

OpenAI 엔터티가 형성되어 제품 설계 및 개발을 제어했습니다.


59. GPT-3.5와 GPT-4는 모두 이전 두 세대보다 훨씬 더 강력하지만 피고는 설계와 훈련을 완전히 비밀로 유지했습니다. 이전 세대의 경우 OpenAI는 LLM의 훈련 세트, 설계 및 하드웨어 내용을 자세히 설명하는 방대한 보고서를 보유했습니다. GPT-3.5 또는 GPT-4의 경우에는 그렇지 않습니다. 예를 들어, GPT-4의 경우 OpenAI가 발표한 "기술 보고서"에는 "이 보고서에는 아키텍처(모델 크기 포함), 하드웨어, 교육 계산, 데이터 세트 구성, 교육 방법 등에 대한 추가 세부 정보가 포함되어 있지 않습니다."[ 삼]


60. OpenAI의 수석 과학자 Sutskever는 상업적인 근거로 이러한 비밀을 정당화했습니다. “밖에서는 경쟁이 치열합니다… 그리고 같은 일을 하려는 기업이 많기 때문에 경쟁적인 측면에서 보면 이는 해당 분야의 성숙이라고 볼 수 있습니다.”[4] 하지만 그 효과는 OpenAI가 최신 교육을 위해 복사한 데이터의 신원을 숨기는 것이었습니다. The Times와 같은 권리 보유자의 모델.


61. OpenAI는 2022년 11월 ChatGPT가 출시되면서 유명해졌습니다. ChatGPT는 사용자가 생성한 프롬프트가 제공되면 인간과 유사한 자연어 응답을 모방할 수 있는 텍스트 생성 챗봇입니다. ChatGPT는 출시 후 한 달 만에 100만 명에 달하는 사용자를 확보하고 3개월 만에 1억 명 이상의 사용자를 확보하는 등 즉각적인 바이럴 센세이션을 일으켰습니다.


62. OpenAI는 OpenAI OpCo LLC를 통해 OpenAI Inc., OpenAI LP 및 기타 OpenAI 단체의 지시에 따라 일반 소비자와 기업 모두를 대상으로 LLM을 기반으로 하는 서비스 제품군을 제공합니다. GPT-3.5로 구동되는 ChatGPT 버전은 사용자에게 무료로 제공됩니다. OpenAI는 또한 OpenAI의 "가장 유능한 모델"인 GPT-4를 기반으로 하는 프리미엄 서비스를 월 20달러에 소비자에게 제공합니다. OpenAI의 비즈니스 중심 제품에는 개발자가 ChatGPT를 맞춤형 애플리케이션에 통합할 수 있도록 설계된 ChatGPT Enterprise 및 ChatGPT API 도구가 포함됩니다. OpenAI는 또한 라이선스 비용을 받고 기업 고객에게 기술 라이선스를 제공합니다.


63. 이러한 상업용 제품은 OpenAI에 매우 가치가 있습니다. Fortune 500대 기업 중 80% 이상이 ChatGPT를 사용하고 있습니다.[5] 최근 보고서에 따르면 OpenAI는 매월 8천만 달러의 수익을 창출하고 있으며 향후 12개월 내에 10억 달러를 넘어설 예정입니다.[6]


64. 이러한 상업적 성공은 대부분 OpenAI의 대규모 저작권 침해에 기반을 두고 있습니다. ChatGPT 및 관련 제품의 사용 및 판매를 촉진하는 주요 기능 중 하나는 다양한 스타일의 자연어 텍스트를 생성하는 LLM의 기능입니다. 이 결과를 달성하기 위해 OpenAI는 LLM을 "교육"하는 과정에서 The Times가 소유한 저작물을 수많은 복제품으로 만들었습니다.


65. 정보와 믿음에 따르면 모든 OpenAI 피고인은 OpenAI의 Times Works에 대한 광범위한 침해 및 상업적 이용에 직접적으로 연루되었거나 이를 지시, 통제 및 이익을 얻었습니다. OpenAI Inc.는 Microsoft와 함께 OpenAI Holdings LLC, OpenAI GP LLC, 및 OAI Corporation LLC. OpenAI LP와 OpenAI Global LLC는 OpenAI의 GPT 기반 제품의 설계, 개발 및 상용화에 직접 참여했으며 Times Works의 광범위한 복제, 배포 및 상업적 사용에도 직접 참여했습니다. OpenAI LP와 OpenAI Global LLC는 또한 OpenAI의 GPT 기반 제품의 배포, 판매 및 라이선스에 관여하는 OpenAI, LLC 및 OpenAI OpCo LLC를 통제하고 감독하여 Times Works의 복제, 배포 및 상업적 사용을 수익화했습니다.


66. 최소 2019년부터 Microsoft는 OpenAI의 GPT 제품의 교육, 개발 및 상용화에 긴밀하게 참여해 왔으며 계속해서 참여하고 있습니다. 2023년 세계 경제 포럼에서 열린 Wall Street Journal과의 인터뷰에서 Microsoft CEO Satya Nadella는 "ChatGPT 및 GPT 모델 제품군은… 우리가 수년 동안 OpenAI와 깊이 파트너십을 맺어온 것"이라고 말했습니다. 이 파트너십을 통해 Microsoft는 최소한 두 가지 방식으로 GPT LLM 및 이를 기반으로 하는 제품의 생성 및 상용화에 참여해 왔습니다.


67. 첫째, Microsoft는 여기에 설명된 대량 저작권 침해를 실행하기 위해 맞춤형 컴퓨팅 시스템을 만들고 운영했습니다. 이러한 시스템은 해당 저작물에 포함된 저작권 보호 표현의 상당 부분을 활용하고 유지하는 GPT 모델을 생성할 목적으로 The Times의 지적 재산을 여러 번 복제하는 데 사용되었습니다.


68. Microsoft는 OpenAI를 위한 유일한 클라우드 컴퓨팅 제공업체입니다. Microsoft와 OpenAI는 GPT-1 이후 모든 OpenAI의 GPT 모델을 훈련하는 데 사용된 Microsoft의 클라우드 컴퓨터 플랫폼 Azure를 기반으로 하는 슈퍼컴퓨팅 시스템을 설계하기 위해 협력했습니다. 2023년 7월 Microsoft Inspire 컨퍼런스의 기조 연설에서 Nadella 씨는 다음과 같이 말했습니다. “우리는 모델을 교육하기 위한 인프라를 구축했습니다. 그들은 알고리즘과 이러한 프론티어 모델의 교육을 혁신하고 있습니다.”


69. 해당 인프라는 OpenAI가 적합하다고 생각하는 대로 사용할 수 있는 범용 컴퓨터 시스템이 아니었습니다. Microsoft는 역사상 가장 유능한 LLM을 교육하기 위해 기본적으로 전체 인터넷(Times Works를 불균형하게 기능하도록 큐레이팅됨)을 사용하는 목적으로 특별히 설계했습니다. 2023년 2월 인터뷰에서 Nadella 씨는 다음과 같이 말했습니다.


하지만 OpenAI가 대형 모델로 내놓는 것 아래에는 다음을 기억하세요.

어려운 작업은 [Microsoft] Azure 팀에서 수행했습니다.

컴퓨터 인프라. 왜냐하면 이러한 작업량이 너무 많기 때문입니다.

이전에 온 것과는 다릅니다. 그래서 우리는

데이터센터부터 인프라까지 완전히 다시 생각해 보세요.

먼저 우리에게 모델을 만들 기회도 주었습니다. 그리고 지금 우리는

모델을 제품으로 변환합니다.[7]


70. Microsoft는 "OpenAI와 협력하여 독점적으로" 이 슈퍼컴퓨터를 구축했으며 "해당 회사의 AI 모델을 교육하기 위해 특별히 설계했습니다."[8] 슈퍼컴퓨팅 표준에 의해서도 매우 복잡했습니다. 마이크로소프트에 따르면, 이 시스템은 "285,000개 이상의 CPU 코어, 10,000개의 GPU 및 각 GPU 서버에 대해 초당 400기가비트의 네트워크 연결을 갖춘 단일 시스템"으로 작동했습니다. 이 시스템은 세계에서 공개적으로 알려진 가장 강력한 슈퍼컴퓨팅 시스템 상위 5위 안에 들었습니다.


71. 슈퍼컴퓨팅 시스템이 OpenAI의 요구 사항에 적합한지 확인하기 위해 Microsoft는 독립적으로 그리고 OpenAI 소프트웨어 엔지니어와 협력하여 시스템을 테스트해야 했습니다. Nadella 씨에 따르면 OpenAI와 관련하여 "그들은 기초 모델을 수행하고 우리[Microsoft]는 책임 있는 AI 및 AI 안전에 관한 도구를 포함하여 이를 중심으로 많은 작업을 수행합니다." 정보와 믿음에 따라 이러한 "AI 및 AI 안전을 위한 도구 사용"에는 GPT 기반 제품이 대중에게 출시되기 전에 미세 조정 및 보정이 포함됩니다.[9]


72. Microsoft는 OpenAI와 협력하여 OpenAI의 GPT 기반 기술도 상용화하고 이를 자체 Bing 검색 인덱스와 결합했습니다. 2023년 2월, Microsoft는 GPT-4로 구동되는 검색 엔진의 생성적 AI 챗봇 기능인 Bing Chat을 공개했습니다. 2023년 5월, Microsoft와 OpenAI는 Microsoft Bing 검색 엔진을 통해 인터넷의 최신 콘텐츠에 액세스할 수 있는 ChatGPT 플러그인인 "Bing with Bing"을 공개했습니다. Bing Chat 및 Browse with Bing은 The Times의 표현을 포함하여 사람의 표현을 모방하는 GPT-4의 기능과 Times Works의 조회수를 포함하여 검색 결과 콘텐츠의 자연어 요약을 생성하는 기능을 결합하여 The Times의 자체 웹사이트를 방문할 필요가 없습니다. . 이러한 "합성" 검색 결과는 사용자 쿼리에 직접 답변한다고 주장하며 Times 보고에 대한 광범위한 설명과 직접 인용문을 포함할 수 있습니다. 이러한 복사는 검색 결과의 유기적 목록과 동일한 방식으로 사용자에게 The Times를 추천하는 대신 피고의 자체 사이트 및 애플리케이션에 대한 참여를 유지합니다.


73. 최근 인터뷰에서 Nadella 씨는 Microsoft가 OpenAI 운영에 긴밀히 관여하여 저작권 침해를 인정했습니다.


우리는 우리 자신의 능력에 대해 매우 자신감이 있었습니다. 우리는 모든 지적재산권과 모든 역량을 보유하고 있습니다. OpenAI가 내일 사라진다면 우리 고객 중 누구도 이에 대해 솔직하게 걱정하지 않기를 바랍니다. 왜냐하면 우리는 혁신을 계속할 모든 권리를 갖고 있기 때문입니다. 단지 제품을 제공하는 것뿐만 아니라 우리가 파트너십을 통해 하던 일을 직접 수행할 수도 있습니다. 우리에게는 사람이 있고, 컴퓨팅이 있고, 데이터가 있고, 모든 것이 있습니다.


74. 피고인들은 GPT 모델의 제작과 상업화에 대한 협력을 통해 The Times의 지적 재산에 대한 대규모 저작권 침해, 상업적 이용 및 남용으로부터 이익을 얻었습니다. Nadella 씨는 최근 "[OpenAI]가 우리에게 돈을 걸었습니다. 우리는 그들에게 돈을 걸었습니다."라고 말했습니다. 그는 계속해서 Microsoft의 130억 달러 투자 효과를 설명했습니다.


그리고 그것은 내가 말했듯이 우리에게 중요한 권리를 부여합니다. 그리고 이것도 손을 대지 않는 거죠, 그렇죠? 우리는 거기에 있습니다. 우리는 그들 아래, 그들 위에, 그들 주위에 있습니다. 우리는 커널 최적화를 수행하고, 도구를 구축하고, 인프라를 구축합니다. 그래서 많은 업계 분석가들이 '와, 정말 Microsoft와 OpenAI 간의 공동 프로젝트다'라고 말하고 있는 것 같습니다. 제가 말했듯이 현실은 우리가 이 모든 것에 대해 매우 자급자족하고 있다는 것입니다.





여기에서 계속 읽으세요.


[3] OPENAI, GPT-4 기술 보고서(2023), https://cdn.openai.com/papers/gpt-4.pdf.


[4] James Vincent, OpenAI 공동 창립자, 연구 공개 공유에 대한 회사의 과거 접근 방식: 'We Were Wrong', THE VERGE(2023년 3월 15일), https://www.theverge.com/2023/3/15 /23640180/openai-gpt-4-launch-closedresearch-ilya-sutskever-interview.


[5] OpenAI, ChatGPT Enterprise 소개, OPENAI(2023년 8월 28일), https://openai.com/blog/introducing-chatgpt-enterprise.


[6] Chris Morris, OpenAI의 연간 매출이 10억 달러에 육박한다고 보고됨, FAST COMPANY(2023년 8월 30일), https://www.fastcompany.com/90946849/openai-chatgpt-reportedly-nears-1-billion-annual -매상.


[7] CNBC에서 첫 번째: CNBC 대본: Microsoft CEO Satya Nadella가 CNBC의 Jon Fortt와 대화합니다.

“파워 런치” 오늘, CNBC(2023년 2월 7일), https://www.cnbc.com/2023/02/07/first-on-cnbc-cnbc-transcriptmicrosoft-ceo-satya-nadella-speaks-with -cnbcs-jon-fortt-on-power-lunch-today.html.


[8] Jennifer Langston, Microsoft가 새로운 슈퍼컴퓨터 발표, 미래 AI 작업에 대한 비전 제시, MICROSOFT(2020년 5월 19일), https://news.microsoft.com/source/features/ai/openai-azure-supercomputer/. 9 SÉBASTIEN BUBECK 외, 인공 일반 지능의 불꽃: GPT-4를 사용한 초기 실험(2023), https://arxiv.org/pdf/2303.12712.pdf




HackerNoon 법률 PDF 시리즈 정보: 가장 중요한 기술적이고 통찰력 있는 공개 도메인 법원 소송 서류를 제공합니다.


nycto-assets.nytimes.com 에서 2023년 12월 29일에 검색된 이 법원 사건 1:23-cv-11195는 공개 도메인의 일부입니다. 법원이 작성한 문서는 연방 정부의 저작물이며 저작권법에 따라 자동으로 공개 도메인에 배치되며 법적 제한 없이 공유될 수 있습니다.