美国知识产权大语言模型版权侵权/合理使用进行中
Alexander v. Salesforce, Inc.

Alexander诉Salesforce案

重要性评级
案号:3:25-cv-09560
法院:United States District Court for the Northern District of California, San Francisco Division
当事方:Alexander et al. vs Salesforce, Inc.

原告起诉Salesforce在未经授权的情况下使用受版权保护的内容训练其AI产品(Einstein AI),主张版权侵权并要求赔偿。本案代表了针对企业级AI工具的版权侵权诉讼新趋势,涉及B2B场景下AI训练数据的合规问题。

内容目录
AI 风险雷达

五维风险综合评估

版权风险
数据合规
平台责任
算法责任
隐私侵权

最高风险维度:版权风险

案情概述

原告塔莎·亚历山大(Tasha Alexander)是一名作家,于2025年11月5日在美国加利福尼亚北区地方法院对Salesforce公司提起集体诉讼。诉讼的核心指控是Salesforce公司故意侵犯了包括原告及其他集体成员在内的数百万受版权保护的作品,以训练其CodeGen和xGen大型语言模型(LLMs)以及商业AI产品,特别是Agentforce。Salesforce的Agentforce是一款旨在学习、适应和简化工作流程的AI软件产品,由生成式AI驱动。诉状指出,Salesforce未经许可或支付费用就使用了这些受版权保护的作品,而是未经授权地利用它们。这些作品据称是从“盗版来源”和影子图书馆(如Books3,它是The Pile、RedPajama和C4等大型数据集的一部分)下载、复制和存储的。原告认为,Salesforce的行为通过允许用户生成原本应由作家创作并获得报酬的文本,从而损害了作家的生计,并稀释了其作品的市场。诉状中甚至引用了Salesforce首席执行官马克·贝尼奥夫(Marc Benioff)的话,承认“所有训练数据都被盗用了”。该诉讼旨在解决这种涉嫌故意侵权造成的损害,并根据《版权法》要求各种补救措施,包括损害赔偿和禁令救济。这是一起集体诉讼,代表了数千名作家和版权所有者。Salesforce最初曾披露其使用了The Pile、RedPajama和C4等数据集,但在AI训练数据版权问题受到更多关注后,试图通过将其替换为“公开可用来源”和“自然语言内容”来掩盖这些引用。

核心争议焦点

  • 1Salesforce是否未经授权复制和使用了受版权保护的作品来训练其AI模型?
  • 2Salesforce的行为是否构成版权侵权?
  • 3Salesforce的AI模型训练是否属于合理使用?
  • 4Salesforce的行为是否对原告及其他版权所有者的市场造成了损害?
  • 5Salesforce的侵权行为是否是故意的?

双方观点

原告主张

["Salesforce未经许可或支付费用,故意复制、存储并使用原告及其他集体成员的受版权保护作品来训练其LLMs和AI产品Agentforce。","Salesforce使用的训练数据集(如Books3、The Pile、RedPajama、C4)包含大量盗版和未经授权的作品。","Salesforce的行为损害了作者的生计,通过生成替代作品稀释了原告作品的市场价值。","Salesforce的侵权行为并非合理使用,因为其目的是商业性的,且未经授权复制了作品的全部或实质性部分。","Salesforce试图掩盖其使用盗版数据的行为,表明其侵权是故意的。"]

被告抗辩

["Salesforce可能会辩称其使用受版权保护的作品进行AI模型训练属于合理使用,因为其用途具有变革性。","Salesforce可能会主张其AI模型在训练完成后不存储原始作品,而是学习模式和参数,因此不构成直接复制。","Salesforce可能会强调其AI产品Agentforce的创新性和对用户体验的提升,以证明其行为的社会价值。","Salesforce可能会质疑原告所称的市场损害,或认为其产品并未直接替代原告的作品。","Salesforce可能会辩称其已采取措施删除或避免使用有版权争议的数据集,以减轻侵权责任。"]

法院说理

该案件目前仍处于审理初期阶段,尚未有最终判决或重要的程序性裁定。根据诉状,案件已于2025年11月5日立案,并指定了法官查尔斯·R·布雷耶(Charles R Breyer)。诉讼程序包括原告提交集体诉讼申请,并要求陪审团审判。目前,法院的主要任务是审理集体诉讼的认证申请,并评估各方提出的法律论点,特别是关于版权侵权和合理使用的争议。原告方已提交了详细的诉状,阐述了Salesforce侵权行为的性质、范围以及对作者市场造成的损害。被告Salesforce将需要提交答辩状,并可能提出驳回动议或合理使用抗辩。法院将根据双方提交的证据和法律论点,决定是否批准集体诉讼,并进一步推进案件审理。由于案件涉及AI训练数据版权这一新兴且复杂的法律问题,法院在审理过程中可能会面临如何平衡技术创新与版权保护的挑战。

最终判决结果

Alexander v. Salesforce Inc.一案对AI产业和法律规则具有深远的影响。首先,对于AI产业而言,此案可能重新定义AI模型训练数据的获取和使用规范。如果法院认定Salesforce的行为构成侵权,将迫使AI开发者更加重视版权合规性,推动建立更透明、更道德的数据许可和使用机制。这可能增加AI模型开发的成本,但也可能促进版权内容创作者与AI公司之间的合作,形成新的商业模式。其次,对法律规则的影响主要体现在《版权法》中“合理使用”原则的解释和适用。此案将考验法院如何平衡AI训练的“变革性使用”与版权所有者的“专有权利”。法院的判决将为未来AI训练数据版权纠纷提供重要的判例指导,尤其是在判断AI模型是否构成“衍生作品”以及其输出是否侵犯原作品权利方面。最后,此案对全球AI治理具有重要意义。随着AI技术的快速发展,各国都在探索如何制定有效的AI监管框架。此案的结果将为国际社会在AI版权保护、数据伦理和知识产权政策制定方面提供参考,可能促使各国在AI治理上达成更广泛的共识,以确保AI技术在尊重创作者权益的前提下健康发展。此案也凸显了在数字时代,传统版权法律面临的挑战,以及在技术创新背景下,法律体系需要不断演进以适应新情况的必要性。
阿来律师 AI分身
AI 分身