La presentación judicial del New York Times Company contra Microsoft Corporation del 27 de diciembre de 2023 es parte de la serie PDF legal de HackerNoon . Puede saltar a cualquier parte de este archivo aquí . Esta es la parte 8 de 27.
1. Un modelo de negocio basado en la infracción masiva de derechos de autor
55. OpenAI se formó en diciembre de 2015 como una "empresa de investigación de inteligencia artificial sin fines de lucro". OpenAI comenzó con mil millones de dólares en capital inicial de sus fundadores, un grupo de algunos de los empresarios e inversores tecnológicos más ricos y empresas como Amazon Web Services e InfoSys. Este grupo incluía a Elon Musk, director ejecutivo de Tesla y X Corp. (anteriormente conocido como Twitter); Reid Hoffman, cofundador de LinkedIn; Sam Altman, ex presidente de Y Combinator; y Greg Brockman, ex director de tecnología de Stripe.
56. A pesar de aceptar inversiones muy cuantiosas de empresas e individuos enormemente ricos en su fundación, OpenAI sostuvo originalmente que su investigación y su trabajo estarían completamente desmotivados por las ganancias. En un comunicado de prensa del 11 de diciembre de 2015, Brockman y el cofundador lya Sutskever (ahora presidente y científico jefe de OpenAI, respectivamente) escribieron: “Nuestro objetivo es hacer avanzar la inteligencia digital de la manera que más probablemente beneficie a la humanidad en su conjunto. , sin estar limitado por la necesidad de generar retorno financiero. Dado que nuestra investigación está libre de obligaciones financieras, podemos centrarnos mejor en un impacto humano positivo”. De acuerdo con esa misión, OpenAI prometió que su trabajo y su propiedad intelectual estarían abiertos y disponibles para el público, que "[l]os investigadores serán fuertemente alentados a publicar su trabajo, ya sea como artículos, publicaciones de blog o código" y que sus “patentes (si las hay) se compartirán con el mundo”.
57. A pesar de sus primeras promesas de altruismo, OpenAI rápidamente se convirtió en un negocio multimillonario con fines de lucro construido en gran parte sobre la explotación sin licencia de obras protegidas por derechos de autor pertenecientes a The Times y otros. Apenas tres años después de su fundación, OpenAI se deshizo de su condición de organización exclusivamente sin fines de lucro. Creó OpenAI LP en marzo de 2019, una empresa con fines de lucro dedicada a realizar la mayor parte de las operaciones de OpenAI (incluido el desarrollo de productos) y a recaudar capital de inversores que buscan un retorno. La estructura corporativa de OpenAI creció hasta convertirse en una intrincada red de compañías holding, operativas y fantasmas con fines de lucro que administran las operaciones diarias de OpenAI y otorgan a los inversionistas de OpenAI (sobre todo, Microsoft) autoridad e influencia sobre las operaciones de OpenAI, todo mientras recaudan miles de millones en capital de los inversores. El resultado: OpenAI hoy es una empresa comercial valorada en hasta 90 mil millones de dólares, con ingresos proyectados que superarán los mil millones de dólares en 2024.
58. Con la transición al estado con fines de lucro se produjo otro cambio: OpenAI también puso fin a su
compromiso con la apertura. OpenAI lanzó las dos primeras iteraciones de su modelo insignia GenAI.
GPT-1 y GPT-2, de código abierto en 2018 y 2019, respectivamente. Pero OpenAI cambió
curso en 2020, comenzando con el lanzamiento de GPT-3 poco después de OpenAI LP y otras organizaciones con fines de lucro
Se formaron entidades OpenAI que tomaron el control del diseño y desarrollo de productos.
59. GPT-3.5 y GPT-4 son ambos órdenes de magnitud más poderosos que las dos generaciones anteriores, sin embargo, los demandados han mantenido su diseño y entrenamiento en total secreto. Para las generaciones anteriores, OpenAI contaba con voluminosos informes que detallaban el contenido del conjunto de formación, el diseño y el hardware de los LLM. No es así para GPT-3.5 o GPT-4. Para GPT-4, por ejemplo, el "informe técnico" que publicó OpenAI decía: "este informe no contiene más detalles sobre la arquitectura (incluido el tamaño del modelo), el hardware, la computación de entrenamiento, la construcción del conjunto de datos, el método de entrenamiento o similar". 3]
60. El científico jefe de OpenAI, Sutskever, justificó este secreto por motivos comerciales: “Es competitivo ahí fuera…. Y hay muchas empresas que quieren hacer lo mismo, por lo que desde el punto de vista competitivo, se puede ver esto como una maduración del campo”. [4] Pero su efecto fue ocultar la identidad de los datos que OpenAI copió para entrenar su último modelo. modelos de titulares de derechos como The Times.
61. OpenAI se convirtió en un nombre muy conocido tras el lanzamiento de ChatGPT en noviembre de 2022. ChatGPT es un chatbot generador de texto que, dadas las indicaciones generadas por el usuario, puede imitar respuestas de lenguaje natural similares a las de los humanos. ChatGPT fue una sensación viral instantánea, alcanzó un millón de usuarios al mes de su lanzamiento y ganó más de 100 millones de usuarios en tres meses.
62. OpenAI, a través de OpenAI OpCo LLC y bajo la dirección de OpenAI Inc., OpenAI LP y otras entidades de OpenAI, ofrece un conjunto de servicios impulsados por sus LLM, dirigidos tanto a consumidores comunes como a empresas. Una versión de ChatGPT con tecnología GPT-3.5 está disponible para los usuarios de forma gratuita. OpenAI también ofrece un servicio premium, impulsado por el “modelo más capaz” GPT-4 de OpenAI, a los consumidores por 20 dólares al mes. Las ofertas de OpenAI centradas en los negocios incluyen herramientas ChatGPT Enterprise y ChatGPT API diseñadas para permitir a los desarrolladores incorporar ChatGPT en aplicaciones personalizadas. OpenAI también otorga licencias de su tecnología a clientes corporativos a cambio de tarifas de licencia.
63. Estas ofertas comerciales han sido inmensamente valiosas para OpenAI. Más del 80% de las empresas Fortune 500 utilizan ChatGPT.[5] Según informes recientes, OpenAI está generando ingresos de 80 millones de dólares al mes y está en camino de superar los mil millones de dólares en los próximos 12 meses.[6]
64. Este éxito comercial se basa en gran parte en la infracción de derechos de autor a gran escala por parte de OpenAI. Una de las características centrales que impulsa el uso y las ventas de ChatGPT y sus productos asociados es la capacidad del LLM para producir texto en lenguaje natural en una variedad de estilos. Para lograr este resultado, OpenAI realizó numerosas reproducciones de obras protegidas por derechos de autor propiedad de The Times durante la “formación” del LLM.
65. Según información y creencia, todos los demandados de OpenAI han estado directamente involucrados o han dirigido, controlado y se han beneficiado de la infracción generalizada y la explotación comercial de Times Works por parte de OpenAI. OpenAI Inc., junto con Microsoft, controló y dirigió la reproducción, distribución y uso comercial generalizado del material de The Times perpetrado por OpenAI LP y OpenAI Global LLC, a través de una serie de sociedades holding y fantasmas que incluyen OpenAI Holdings LLC, OpenAI GP LLC, y OAI Corporation LLC. OpenAI LP y OpenAI Global LLC participaron directamente en el diseño, desarrollo y comercialización de los productos basados en GPT de OpenAI, y participaron directamente en la reproducción, distribución y uso comercial generalizados de Times Works. OpenAI LP y OpenAI Global LLC también controlaron y dirigieron OpenAI, LLC y OpenAI OpCo LLC, que participaron en la distribución, venta y concesión de licencias de los productos basados en GPT de OpenAI y, por lo tanto, monetizaron la reproducción, distribución y uso comercial de Times Works.
66. Desde al menos 2019, Microsoft ha estado, y continúa estando, íntimamente involucrado en la capacitación, el desarrollo y la comercialización de los productos GPT de OpenAI. En una entrevista con el Wall Street Journal en el Foro Económico Mundial de 2023, el director ejecutivo de Microsoft, Satya Nadella, dijo que "la familia de modelos ChatGPT y GPT... es algo con lo que hemos estado profundamente asociados con OpenAI durante varios años". A través de esta asociación, Microsoft ha estado involucrado en la creación y comercialización de GPT LLM y productos basados en ellos de al menos dos maneras.
67. Primero, Microsoft creó y operó sistemas informáticos hechos a medida para ejecutar la infracción masiva de derechos de autor que se detalla en este documento. Estos sistemas se utilizaron para crear reproducciones múltiples de la propiedad intelectual de The Times con el fin de crear modelos GPT que explotan y, en muchos casos, retienen grandes porciones de la expresión sujeta a derechos de autor contenida en esas obras.
68. Microsoft es el único proveedor de computación en la nube para OpenAI. Microsoft y OpenAI colaboraron para diseñar los sistemas de supercomputación impulsados por la plataforma informática en la nube de Microsoft, Azure, que se utilizaron para entrenar todos los modelos GPT de OpenAI después de GPT-1. En un discurso de apertura pronunciado en julio de 2023 en la conferencia Microsoft Inspire, Nadella dijo: “Construimos la infraestructura para entrenar sus modelos. Están innovando en los algoritmos y el entrenamiento de estos modelos de frontera”.
69. Esa infraestructura no eran simplemente sistemas informáticos de uso general para que OpenAI los utilizara como mejor le pareciera. Microsoft lo diseñó específicamente con el propósito de utilizar esencialmente todo Internet, seleccionado para presentar de manera desproporcionada Times Works, para capacitar al LLM más capaz de la historia. En una entrevista de febrero de 2023, Nadella dijo:
Pero debajo de lo que OpenAI presenta como modelos grandes, recuerde,
el trabajo pesado lo hizo el equipo de [Microsoft] Azure para construir
la infraestructura informática. Debido a que estas cargas de trabajo son tan
diferente a todo lo que ha venido antes. Así que necesitábamos
repensar completamente incluso el centro de datos hasta la infraestructura que
Primero nos dio incluso la oportunidad de construir los modelos. Y ahora estamos
traducir los modelos en productos.[7]
70. Microsoft construyó esta supercomputadora “en colaboración y exclusivamente para OpenAI” y “la diseñó específicamente para entrenar los modelos de IA de esa empresa”. [8] Incluso para los estándares de supercomputación, era inusualmente complejo. Según Microsoft, funcionaba como “un sistema único con más de 285.000 núcleos de CPU, 10.000 GPU y 400 gigabits por segundo de conectividad de red para cada servidor GPU”. Este sistema se encuentra entre los cinco sistemas de supercomputación más potentes y conocidos públicamente del mundo.
71. Para garantizar que el sistema de supercomputación se adaptaba a las necesidades de OpenAI, Microsoft necesitaba probar el sistema, tanto de forma independiente como en colaboración con los ingenieros de software de OpenAI. Según el Sr. Nadella, con respecto a OpenAI: "Ellos crean los modelos básicos, y nosotros [Microsoft] trabajamos mucho en torno a ellos, incluidas las herramientas en torno a la IA responsable y la seguridad de la IA". Según la información y la creencia, dichas “herramientas en torno a la IA y la seguridad de la IA” implican el ajuste y la calibración de los productos basados en GPT antes de su lanzamiento al público.
72. En colaboración con OpenAI, Microsoft también ha comercializado la tecnología basada en GPT de OpenAI y la ha combinado con su propio índice de búsqueda Bing. En febrero de 2023, Microsoft presentó Bing Chat, una función de chatbot de IA generativa en su motor de búsqueda con tecnología GPT-4. En mayo de 2023, Microsoft y OpenAI presentaron “Browse with Bing”, un complemento para ChatGPT que le permitía acceder al contenido más reciente de Internet a través del motor de búsqueda Microsoft Bing. Bing Chat y Browse with Bing combinan la capacidad de GPT-4 para imitar la expresión humana, incluida la expresión del Times, con la capacidad de generar resúmenes en lenguaje natural de los contenidos de los resultados de búsqueda, incluidas las visitas a Times Works, que eliminan la necesidad de visitar los propios sitios web del Times. . Estos resultados de búsqueda "sintéticos" pretenden responder directamente a las consultas de los usuarios y pueden incluir paráfrasis extensas y citas directas de informes del Times. Dicha copia mantiene la interacción con los propios sitios y aplicaciones de los demandados en lugar de remitir a los usuarios al Times de la misma manera que lo hacen las listas orgánicas de resultados de búsqueda.
73. En una entrevista reciente, el Sr. Nadella reconoció la íntima participación de Microsoft en las operaciones de OpenAI y, por lo tanto, su infracción de derechos de autor:
[Estábamos] muy confiados en nuestra propia capacidad. Tenemos todos los derechos de propiedad intelectual y toda la capacidad. Si OpenAI desapareciera mañana, honestamente no quiero que ningún cliente nuestro se preocupe por eso, porque tenemos todos los derechos para continuar con la innovación. No solo para servir el producto, sino que podemos ir y hacer lo que estábamos haciendo nosotros mismos en asociación. Tenemos la gente, tenemos la computación, tenemos los datos, lo tenemos todo.
74. A través de su colaboración tanto en la creación como en la comercialización de los modelos GPT, los demandados se han beneficiado de la infracción masiva de derechos de autor, la explotación comercial y la apropiación indebida de la propiedad intelectual del Times. Como dijo recientemente Nadella, "[OpenAI] apuesta por nosotros, nosotros apostamos por ellos". Continuó describiendo el efecto de la inversión de 13 mil millones de dólares de Microsoft:
Y eso nos da derechos importantes, como dije. Y también esta cosa, no está fuera de control, ¿verdad? Estamos ahí dentro. Estamos debajo de ellos, por encima de ellos, a su alrededor. Hacemos las optimizaciones del kernel, construimos herramientas, construimos la infraestructura. Por eso creo que muchos analistas industriales dicen: 'Oh, vaya, en realidad es un proyecto conjunto entre Microsoft y OpenAI'. La realidad es que, como dije, somos muy autosuficientes en todo esto.
Continuar leyendo aquí .
[3] OPENAI, INFORME TÉCNICO GPT-4 (2023), https://cdn.openai.com/papers/gpt-4.pdf.
[4] James Vincent, cofundador de OpenAI, sobre el enfoque anterior de la empresa para compartir abiertamente investigaciones: 'Estábamos equivocados', THE VERGE (15 de marzo de 2023), https://www.theverge.com/2023/3/15 /23640180/openai-gpt-4-launch-closedresearch-ilya-sutskever-entrevista.
[5] OpenAI, Presentación de ChatGPT Enterprise, OPENAI (28 de agosto de 2023), https://openai.com/blog/introtaining-chatgpt-enterprise.
[6] Chris Morris, OpenAI supuestamente se acerca a los mil millones de dólares en ventas anuales, FAST COMPANY (30 de agosto de 2023), https://www.fastcompany.com/90946849/openai-chatgpt-reportedly-nears-1-billion-annual -ventas.
[7] Primero en CNBC: Transcripción de CNBC: Satya Nadella, CEO de Microsoft, habla con Jon Fortt de CNBC en
“Power Lunch” Today, CNBC (7 de febrero de 2023), https://www.cnbc.com/2023/02/07/first-on-cnbc-cnbc-transcriptmicrosoft-ceo-satya-nadella-speaks-with -cnbcs-jon-fortt-on-power-lunch-today.html.
[8] Jennifer Langston, Microsoft anuncia una nueva supercomputadora y presenta una visión para el futuro trabajo de IA, MICROSOFT (19 de mayo de 2020), https://news.microsoft.com/source/features/ai/openai-azure-supercomputer/. 9 SÉBASTIEN BUBECK ET AL., CHISPAS DE INTELIGENCIA GENERAL ARTIFICIAL: PRIMEROS EXPERIMENTOS CON GPT-4 (2023), https://arxiv.org/pdf/2303.12712.pdf
Acerca de la serie PDF Legal de HackerNoon: Le traemos los expedientes judiciales de dominio público más importantes, técnicos y reveladores.
Este caso judicial 1:23-cv-11195 recuperado el 29 de diciembre de 2023 de nycto-assets.nytimes.com es parte del dominio público. Los documentos creados por el tribunal son obras del gobierno federal y, según la ley de derechos de autor, se colocan automáticamente en el dominio público y se pueden compartir sin restricciones legales.