paint-brush
《泰晤士报》诉 Microsoft/OpenAI:未经授权检索和传播时事新闻 (13)经过@legalpdf
137 讀數

《泰晤士报》诉 Microsoft/OpenAI:未经授权检索和传播时事新闻 (13)

经过 Legal PDF5m2024/01/02
Read on Terminal Reader

太長; 讀書

基于 GPT LLM 构建的综合搜索应用程序(包括 Bing Chat 和 Browse with Bing for ChatGPT)显示大量摘录或释义
featured image - 《泰晤士报》诉 Microsoft/OpenAI:未经授权检索和传播时事新闻 (13)
Legal PDF HackerNoon profile picture

《纽约时报公司诉微软公司》2023 年 12 月 27 日提交的法庭文件是HackerNoon 法律 PDF 系列的一部分。您可以在此处跳至本文件中的任何部分。这是 27 部分中的第 13 部分。

四.事实指控

C. 被告未经授权使用和复制时报内容

4. 未经授权检索和传播时事新闻


108. 基于 GPT LLM 构建的综合搜索应用程序,包括 Bing Chat 和 Browse with Bing for ChatGPT,显示搜索结果内容的大量摘录或释义,包括 Times 内容,这些内容可能未包含在模型的训练集中。这些产品采用的“基础”技术包括接收用户的提示,从互联网复制与提示相关的《泰晤士报》内容,将提示与复制的《泰晤士报》内容一起提供作为法学硕士的附加背景,以及将法学硕士缝合在一起对复制的《纽约时报》内容进行释义或引用,以创建与原始内容具有相同信息目的的自然语言替代品。在某些情况下,被告的模型只是简单地吐出《泰晤士报》文章的几段内容。


109. 此类综合答复的内容往往远远超出普通搜索结果通常显示的片段。即使综合搜索响应包含指向源材料的链接,用户也很少需要导航到这些源,因为他们的表达内容已经在叙述结果中引用或解释。事实上,这种归属指示可能会让用户更有可能只相信摘要,而不是点击进行验证。


110. 通过这种方式,合成搜索结果将重要的流量从《泰晤士报》等版权所有者手中转移开。已经阅读过最新新闻或找到合适产品的用户,甚至(或特别是)归因于《纽约时报》的用户,就没有理由访问原始来源。


111. 下面是来自 Bing Chat 和 ChatGPT 的 Browse with Bing 的综合搜索结果的一些说明性且非详尽的示例。


a) Bing Chat 的综合搜索结果示例


112. 如下所示,Bing Chat 以 Times Works 生成的综合搜索结果的形式创建了 Times Works 的未经授权的副本和衍生品,该搜索结果首次出现在 2023 年 4 月用于训练 OpenAI 最新 GPT-4 Turbo LLM 的数据截止之后。 30 第一条引用了《纽约时报》2023 年 10 月文章“哈马斯了解以色列军队的秘密”的长段引用:[31]




113. Bing Chat 的上述综合输出包括原始文章的逐字摘录。复制的文章文本在下面以红色突出显示。



114. 合成输出显示的原始文章内容比传统上在 Bing 搜索结果中显示的同一文章的内容明显更具表现力,如下所示。与传统的搜索结果不同,合成输出也不包含将用户引导至《纽约时报》网站的显着超链接。



115. 另一个例子显示,Bing Chat 广泛复制了《纽约时报》2023 年 9 月文章“近距离体验巴黎,跳进公共泳池”中的文本:[32]



116. Bing Chat 的上述综合输出包括原始文章的逐字摘录。复制的文章文本在下面以红色突出显示。



117. 与传统上在 Bing 搜索结果中显示的同一文章的内容相比,合成输出显示的原始文章内容明显更具表现力,如下所示。与传统的搜索结果不同,合成输出也不包含将用户引导至《纽约时报》网站的显着超链接。



b) ChatGPT 的综合搜索结果 使用 Bing 浏览


118. 以下示例显示,ChatGPT 的 Browse with Bing 插件还以 Times Works 生成的综合搜索结果的形式输出《The Times》版权作品的未经授权副本和衍生品,该结果首次出现在 2023 年 4 月用于训练的数据截止之后OpenAI 最新的 GPT-4 Turbo LLM。第一篇转载了《纽约时报》2023 年 5 月文章“一名妇女被推入火车后的危险、可怕的几个小时”的前两段:[33]




119. 上述使用 Bing 插件浏览的 ChatGPT 的综合输出包括原始文章的逐字摘录。复制的文章文本在下面以红色突出显示



120. 与传统上在 Bing 搜索结果中显示的同一文章的内容相比,合成输出显示的原始文章内容明显更具表现力,如下所示。与传统的搜索结果不同,合成输出也不包含将用户引导至《纽约时报》网站的显着超链接。



121. 此示例同样显示使用 Bing for ChatGPT 浏览,重现《纽约时报》文章“汉普顿仍然时尚吗?”的前两段。从2023年5月开始。[34]



122. 使用 Bing 插件浏览的 ChatGPT 的上述综合输出包括原始文章的逐字摘录。复制的文章文本在下面以红色突出显示。



123. 同样,合成输出显示的原始文章内容比传统上在 Bing 搜索结果中显示的同一文章的内容明显更具表现力,如下所示。与传统的搜索结果不同,合成输出也不包含将用户引导至《纽约时报》网站的显着超链接。





在这里继续阅读。


[31] 原创文章,请参阅 Patrick Kingsley 和 Ronen Bergman,《哈马斯了解以色列军队的秘密》,《纽约时报》(2023 年 10 月 13 日),https://www.nytimes.com/2023/10/13/world/中东/hamas-israel-attackgaza.html。


[32] 原创文章请参阅 Catherine Porter,《近距离体验巴黎,跳入公共泳池》,《纽约时报》(2023 年 9 月 3 日),https://www.nytimes.com/2023/09/03 /world/europe/paris-franceswimming-pools.html。


[33] 原创内容请参阅 Hurubie Meko,《一名妇女被推入火车后的危险、恐怖时刻》,《纽约时报》(2023 年 5 月 25 日),https://www.nytimes.com/2023/05/25/纽约地区/subway-attack-womanshoved-manhattan.html。


[34] 原创文章请参阅 Anna Kodé,Are the Hamptons Still Hip?,纽约时报(2023 年 5 月 26 日),

https://www.nytimes.com/2023/05/26/realestate/hamptons-summer-housing-costs.html。




关于 HackerNoon Legal PDF 系列:我们为您带来最重要的技术性和富有洞察力的公共领域法庭案件文件。


该法庭案件 1:23-cv-11195 于 2023 年 12 月 29 日检索自nycto-assets.nytimes.com ,属于公共领域。法院创建的文件是联邦政府的作品,根据版权法,自动置于公共领域,可以不受法律限制地共享。