爱案例·全球AI诉讼风向标

美国民事诉讼大语言模型著作权进行中

In re OpenAI (多区诉讼)

重要性评级

法院：Southern District of New York

判决时间：2025年01月01日

内容目录

雷

AI 风险雷达

五维风险综合评估

版权风险

高

数据合规

低

平台责任

低

算法责任

低

隐私侵权

低

最高风险维度：版权风险

案情概述

核心争议焦点

1AI模型训练数据版权
2未经授权使用受版权保护的作品训练LLM
3AI生成内容是否构成侵权

法院说理

裁判要点

1十余起案件被集中审理，可能对LLM诉讼产生巨大影响
2审前活动将由同一法官监督
3据报道已进行和解谈判

AI技术详情

技术类型：大语言模型

技术原理示意图 · 训练数据侵权链条

技术实现说明

大语言模型（LLM）的训练过程涉及对互联网上海量文本数据的采集和处理，其中可能包含大量受版权保护的内容。本案（In re OpenAI多区诉讼）涉及的核心技术争议： 1. 训练数据来源：OpenAI使用的Common Crawl、Books1、Books2等数据集包含了大量未经授权的版权作品； 2. 记忆效应（Memorization）：研究表明，LLM在训练过程中会对频繁出现的文本形成近乎完整的"记忆"，能够在特定提示下逐字输出原始训练数据； 3. 输出侵权：当用户要求ChatGPT复述特定书籍内容时，模型能够生成与原著高度相似的文本； 4. 系统性侵权：OpenAI的数据采集行为构成大规模、系统性的版权侵权，而非偶发性侵权。法律争议焦点：LLM训练过程中对版权作品的"学习"是否构成合理使用；以及模型输出与原著高度相似是否构成实质性相似侵权。

原始法律文书

1 份

In re OpenAI MDL 转移合并令

非营利数据库裁定书2025/4/3

来源：CourtListener (RECAP)

案号: 1:25-md-03143 (S.D.N.Y.) | 多区诉讼合并转移令

下载

延伸阅读

学术观点与媒体报道

Mass Tort Litigation and AI: Lessons from In re OpenAI

Ryan Calo·Yale Law Journal Forum

内容目录

法律文书1

裁定书

雷

AI 风险雷达

五维风险综合评估

版权风险

高

数据合规

低

平台责任

低

算法责任

低

隐私侵权

低

最高风险维度：版权风险

案件信息

法域美国

类型民事诉讼

AI技术大语言模型

法律问题著作权

状态进行中

重要性

浏览次数17

相关案例

同法域或同类型案例

美国AI Agent、AI购物工具

AI Agent首案：Perplexity遭初步禁令

Perplexity的AI购物工具Comet因伪装人类用户访问亚马逊网站被判初步禁令。

美国非生成式AI

汤森路透诉罗斯智能案

美国法院认定罗斯智能未经授权使用汤森路透的法律批注训练AI工具构成直接著作权侵权，并驳回合理使用抗辩。

美国大语言模型

Bartz 诉 Anthropic

Andrea Bartz等多位书籍作者以集体诉讼形式，指控Anthropic使用从"影子图书馆"获取的盗版书籍训练Claude AI模型。2025年6月23日，Judge William Alsup作出里程碑式"分裂判决"：AI训练副本构成公平使用（极度转化性），但从盗版渠道获取书籍建立"中央图书馆"的行为本身构成侵权。法院认证集体诉讼后，Anthropic面临数万亿美元法定赔偿风险，双方于2026年初达成15亿美元和解协议，创美国版权和解历史纪录。

美国大语言模型

Ziff Davis 等诉 OpenAI 等（涉及robots协议与反规避）

法院裁定robots.txt不构成DMCA下有效控制访问的技术措施，驳回原告相关诉请。