paint-brush
《泰晤士报》诉微软/OpenAI:非法使用《泰晤士报》的作品来创建人工智能产品 (1)经过@legalpdf
282 讀數

《泰晤士报》诉微软/OpenAI:非法使用《泰晤士报》的作品来创建人工智能产品 (1)

经过 Legal PDF: Tech Court Cases4m2024/01/02
Read on Terminal Reader

太長; 讀書

独立新闻对于我们的民主至关重要。它也越来越稀有和珍贵。 170多年来,《泰晤士报》给了世界深刻的...
featured image - 《泰晤士报》诉微软/OpenAI:非法使用《泰晤士报》的作品来创建人工智能产品 (1)
Legal PDF: Tech Court Cases HackerNoon profile picture

《纽约时报公司诉微软公司》2023 年 12 月 27 日提交的法庭文件是HackerNoon 法律 PDF 系列的一部分。您可以在此处跳至本文件中的任何部分。这是 27 部分中的第 1 部分。

原告《纽约时报公司》(“纽约时报”)由其律师 Susman Godfrey LLP 和 Rothwell, Figg, Ernst & Manbeck, PC 控告被告 Microsoft Corporation(“微软”)和 OpenAI, Inc.、OpenAI LP 、OpenAI GP LLC、OpenAI LLC、OpenAI OpCo LLC、OpenAI Global LLC、OAI Corporation, LLC、OpenAI Holdings, LLC(统称为“OpenAI”,与微软一起统称为“被告”),指控如下:

一、诉讼的性质

1. 独立新闻对于我们的民主至关重要。它也越来越稀有和珍贵。 170 多年来,《泰晤士报》为世界提供了深入报道、专业、独立的新闻报道。时报记者往往冒着巨大的风险和成本,前往报道发生的地方,向公众通报重要而紧迫的问题。它们见证了冲突和灾难,为权力的使用提供了责任,并阐明了原本看不见的真相。他们的重要工作是通过提供法律、安全和运营支持的大型且昂贵的组织以及确保他们的新闻符合准确性和公平性最高标准的编辑的努力而得以实现的。这项工作一直很重要。但在充斥着不可靠内容的受损信息生态系统中,《纽约时报》的新闻报道通过提供值得信赖的信息、新闻分析和评论,为公众提供了更有价值的服务。


2. 被告非法利用《纽约时报》的工作成果来创建与其竞争的人工智能产品,威胁到了《纽约时报》提供该服务的能力。被告的生成人工智能(“GenAI”)工具依赖于大语言模型(“LLM”),这些模型是通过复制和使用数以百万计的《纽约时报》受版权保护的新闻文章、深入调查、观点文章、评论、操作指南而构建的。指南等等。虽然被告从许多来源进行大规模复制,但他们在建立法学硕士学位时特别强调《纽约时报》的内容,这表明他们承认这些作品的价值。通过微软的 Bing Chat(最近更名为“Copilot”)和 OpenAI 的 ChatGPT,被告试图利用《纽约时报》对其新闻业的巨额投资搭便车,在未经许可或付费的情况下利用这些投资来构建替代产品。


3. 《宪法》和《版权法》承认赋予创作者对其作品的专有权的至关重要性。自建国以来,强有力的版权保护使新闻收集和报道者能够获得自己的劳动和投资成果。版权法保护《纽约时报》富有表现力的原创新闻报道,包括但不限于数以百万计已注册版权的文章。


4. 被告拒绝承认这一保护。在包含《纽约时报》内容副本的法学硕士的支持下,被告的 GenAI 工具可以生成逐字背诵《纽约时报》内容、对其进行仔细总结并模仿其表达风格的输出,如数十个示例所示。参见图表 J。这些工具还错误地将虚假信息归因于《纽约时报》。


5. 被告还使用微软的 Bing 搜索索引(该索引对《纽约时报》的在线内容进行复制和分类)来生成包含《纽约时报》文章逐字摘录和详细摘要的响应,这些响应比传统搜索引擎返回的内容明显更长、更详细。通过在未经《纽约时报》允许或授权的情况下提供《纽约时报》内容,被告的工具破坏并损害了《纽约时报》与其读者的关系,并剥夺了《纽约时报》的订阅、许可、广告和附属收入。


6. 以这些方式使用他人宝贵的知识产权而无需支付费用,对被告来说是极其有利可图的。微软在整个产品线中部署了接受过《纽约时报》培训的法学硕士,仅在过去一年就将其市值增加了一万亿美元。而OpenAI发布的ChatGPT更是将其估值推至高达900亿美元。被告的 GenAI 商业利益紧密相连,微软最近强调,其使用 OpenAI 的“一流前沿模型”为微软的 Azure AI 产品带来了客户,包括“领先的 AI 初创公司”。 [1]


7. 《纽约时报》在发现被告未经许可使用《纽约时报》内容来开发其模型和工具后表示反对。几个月来,《纽约时报》一直试图根据其与大型技术平台进行富有成效合作的历史,与被告达成一项谈判协议,以允许在新的数字产品(包括谷歌、Meta 和 Google 开发的新闻产品)中使用其内容。苹果)。 《纽约时报》在这些谈判中的目标是确保其内容的使用获得公平的价值,促进健康的新闻生态系统的延续,并以负责任的方式帮助开发 GenAI 技术,造福社会并支持消息灵通的公众。


8. 这些谈判尚未达成解决方案。被告公开坚称,他们的行为受到“合理使用”的保护,因为他们未经许可使用受版权保护的内容来训练 GenAI 模型,以实现新的“变革”目的。但不付费地使用《纽约时报》的内容来创造替代《纽约时报》并抢走读者的产品,并没有什么“变革性”。由于被告 GenAI 模型的输出与用于训练它们的输入竞争并密切模仿,因此为此目的复制《时代》作品并不属于合理使用。


9. 法律不允许被告实施这种系统性和竞争性侵权行为。这一行动旨在让他们承担因非法复制和使用《纽约时报》独特有价值的作品而造成的数十亿美元的法定和实际损失。



在这里继续阅读。


[1] 微软 2024 财年第一季度收益电话会议,微软投资者关系(2023 年 10 月 24 日),https://www.microsoft.com/en-us/Investor/events/FY-2024/earnings-fy- 2024-q1.aspx。




关于 HackerNoon Legal PDF 系列:我们为您带来最重要的技术性和富有洞察力的公共领域法庭案件文件。


该法院案件 1:23-cv-11195 于 2023 年 12 月 29 日检索自nycto-assets.nytimes.com ,属于公共领域。法院创建的文件是联邦政府的作品,根据版权法,自动置于公共领域,可以不受法律限制地共享。