媒体行业对AI公司最重要的版权诉讼AI版权诉讼标志性案件
美国版权侵权大语言模型版权进行中
The New York Times v. OpenAI and Microsoft
重要性评级
法院:美国纽约南区联邦地区法院(S.D.N.Y.),主审法官:Sidney Stein
当事方:原告:纽约时报公司(The New York Times Company),以及后续加入的每日新闻、调查性报道中心等多家媒体 被告:Microsoft Corporation 和 OpenAI, Inc.(包括多个关联实体)

2023年12月,《纽约时报》对OpenAI和微软提起版权侵权诉讼,指控其未经授权使用数百万篇新闻文章训练GPT系列模型。《纽约时报》提供大量证据证明ChatGPT能够逐字输出其受版权保护的文章,可绕过付费墙。2025年5月,Judge Stein驳回OpenAI大部分驳回动议,允许核心主张继续推进。案件还涉及OpenAI涉嫌销毁"输出日志"证据的争议。

双方观点

原告主张

1.OpenAI训练行为是对新闻作品的大规模盗版,严重损害付费墙商业模式和授权收入。2.ChatGPT能够逐字输出文章,证明模型对内容的"记忆"和"复制"。3.OpenAI在处理训练数据时故意删除版权管理信息,违反DMCA第1202条。

被告抗辩

1.使用公开可获取的新闻文章训练AI模型属于转化性公平使用。2.逐字输出是极少数情况下的异常现象,非模型正常运作方式。3.申请获取《纽约时报》自身使用AI工具的信息(被法院驳回)。

法院说理

案件仍在进行中。2023年12月提起诉讼,被认为是媒体行业对AI公司最重要的版权挑战。

最终判决结果

2025年5月:Judge Stein驳回OpenAI大部分驳回动议,允许版权侵权和DMCA违规核心主张继续推进。法院驳回了针对微软的全部DMCA 1202(b)(1)主张,OpenAI仅成功驳回部分。案件还涉及OpenAI涉嫌销毁"输出日志"证据的争议,法院已就此召开听证会。案件仍在审理中。

AI技术详情

技术类型:大语言模型
技术原理示意图 · 大语言模型
训练数据书籍/文章/代码分词处理TokenizationTransformer注意力机制输出生成文本/代码大语言模型工作原理 · 训练阶段数据流向

技术实现说明

OpenAI的GPT系列大语言模型和微软的Copilot使用包含大量新闻文章的数据集进行训练。《纽约时报》提供了ChatGPT能够逐字输出其文章内容的证据。

延伸阅读

法律意义

迄今为止最具影响力的媒体机构对AI公司的版权诉讼。该案的结果将对整个新闻行业与AI公司的关系产生深远影响,并可能推动AI公司与媒体机构签订许可协议。