Logo

全球AI诉讼风向标

Global AI Litigation Compass

训练数据版权AIGC大模型

“铸剑”与“舞剑”:AIGC版权认定中模型训练贡献与内容创作贡献的界分

区分“铸剑”与“舞剑”:将定向训练后的模型能力从“独创性”贡献中剥离

张延来律师
2025年7月21日约 8 分钟阅读1 次阅读

区分“铸剑”与“舞剑”:将定向训练后的模型能力从“独创性”贡献中剥离

人工智能生成内容(AIGC)的繁荣,特别是开发者(训练者)通过微调(Fine-tuning)、知识蒸馏(Knowledge Distillation)、低秩适应(LoRA)等前沿技术对基础大模型进行深度定向训练,催生了一批能稳定输出特定类型高质量内容(如风格化写真、特定流派漫画、工业设计图稿)的专用模型。当这些模型生成的图片、文本、视频等内容具备高度的艺术性或商业价值时,其版权归属问题便成为法律与技术交叉领域的焦点。当前实践可能陷入一个误区:以生成内容的最终“完成度”或“艺术效果”反向推定使用者(提示词输入者)的创作贡献,从而模糊了模型开发者(训练者)“铸剑”之功与使用者“舞剑”之劳的本质区别。这种模糊性不仅可能导致版权归属错位,更会挫伤模型开发者(训练者)的创新动力。因此,亟需在版权认定标准中严格区分“模型训练贡献”与“内容创作贡献”。

一、 定向训练:开发者(训练者)“铸剑”之功的本质

开发者(训练者)利用微调、蒸馏、LoRA等技术对基础模型进行深度改造,其核心贡献在于塑造了模型的“潜在创作可能性”与“特定风格/领域表达能力”,主要体现在以下三个方面:

技术深度而非直接创作: 开发者(训练者)投入的是精选数据集、复杂的算法设计、大量的计算资源与调优经验。这些工作旨在提升模型在特定任务(如生成“日式赛璐珞风格漫画”)上的性能、稳定性与风格一致性。LoRA通过低秩矩阵注入特定知识,微调则调整模型内部权重以适应新领域——这些本质上是对“工具”本身的锻造与优化。

确立“能力边界”: 定向训练决定了模型能“做什么”以及“做得多好”。一个经过高质量动漫数据集微调的模型,其生成的任何图像天然带有动漫风格倾向,这是开发者(训练者)设定的“能力基线”。用户的提示词是在此既定边界内进行引导,而非从零开始构建风格。

贡献物是“能力”而非“作品”: 开发者(训练者)最终获得的是一个具备特定内容生成能力的AI模型。该模型本身作为技术成果,可能受专利、商业秘密或特殊许可协议保护,但其生成的具体内容在未被用户有效引导前,仅是一系列未实现的“可能性”,并非可版权化的表达。

内容生成:使用者“舞剑”的成果体现

当用户使用经过定向训练的模型生成具体内容时,其核心贡献在于通过输入(提示词、参数设置、初始图像/文本等)对模型的“潜在可能性”进行具象化选择和编排,同样体现在以下三个方面:

引导与选择: 用户输入的提示词(Prompt)是启动生成过程的关键指令。高质量的提示词需要精确描述期望内容(主题、构图、色彩、氛围、细节要求),甚至包含否定性约束。这要求用户对目标风格、领域知识有深刻理解,并能有效“沟通”。

突破随机性与体现意图: 尽管模型能力由开发者(训练者)设定,但具体输出仍存在随机性。用户通过迭代调整提示词、筛选生成结果、进行后期精修等操作,实质是将模型的随机输出收敛于其特定、个性化的创作意图之上。这种“从混沌到有序”的引导过程,体现了使用者的判断与选择。

独创性表达的落脚点: 版权法保护的是“独创性的表达”。只有当使用者的具体输入(特别是复杂、高度结构化的提示词工程)和后续选择/编排过程,使得最终生成的内容体现出了使用者独特的审美选择、信息安排、情感表达或思想呈现,且这种表达超越了模型本身固有的风格倾向和简单的机械性操作时,使用者的贡献才可能构成可版权化的“创作”。

构建更清晰的版权认定路径

基于被定向训练过的大模型自带的内容上的高完成度,我们从直觉出发很容易根据生成内容的优质呈现倾向于将其认定为作品从而享有版权,甚至默认使用者具有了“高度原创能力”,很容易引发“以结果倒推原因”的误判。

这是因为“高完成度”很大程度上依赖模型能力,非必然源于使用者独创性贡献。 一张精美的动漫角色图,其“精美”首先归功于开发者(训练者)构建的强大模型能力。用户可能仅输入了“一个女孩,端坐,文艺范”这样基础且通用的提示词。此时的高质量输出,主要反映的是模型的训练水平,而非使用者的创作性智力投入。

我们知道版权旨在激励“创作”行为本身,而非对工具优异性能的研发投入或者被动享受,因此AIGC可版权认定应聚焦于生成具体内容过程中人类的“创作性贡献”:

开发者(训练者)的“工具贡献”

承认模型(尤其是经深度定向训练的模型)作为强大的“智能创作工具”的属性,其能力的来源是开发者(训练者)的训练贡献,这部分贡献可以并且应当通过软件、商业秘密、专利等方式进行保护,并且可以由模型开发者(训练者)对外进行模型使用授权的方式收回成本获得收益。

但一般情况下不应当给予开发者(训练者)版权激励,因其没有对具体内容创作做出贡献(模型训练旨在令模型具备某种无差别生成能力,没有具体作品创作层面的目的,通俗的讲,就是定向训练一个模型不是为了生成某一个作品)。

模型使用者的“创作贡献”

对于使用被定向训练过的模型进行内容生成的模型使用者而言,其是否对生成内容享有版权,审查的核心应聚焦于:使用者对模型的依赖度以及其在使用该工具生成特定内容时,其输入(提示词等)及后续操作是否注入了足以构成“独创性表达”的智力选择、判断和编排。

判断使用者对模型的依赖度:模型越强人越弱?

在使用定向训练过的模型进行生成的场景下,常常会出现“模型越强,人越弱”的情况,必须对使用者的独创性贡献跟模型自身具备的定向生成能力进行区分,要考察使用者在多大程度上依赖模型自有能力,这一点跟使用一般的通用模型有所区别。

定向模型在某些生成纬度上本来就很强,此时很可能使用者无需再投入过多个性化要求,依赖模型能力就可以轻松获得高完成度的生成结果,比如被定向训练具有高度还原“吉卜力”风格能力的模型(这种模型一度非常流行),用户无需通过提示词等要求就能轻松获得这种风格的图片,因此在认定可版权性是需将这种风格从“独创性”贡献中剥离出去,避免将模型能力等同于创作贡献。

定向训练模型使用者的独创性贡献究竟几何?

当把模型能力从使用者的独创性贡献中剥离出去之后,我们再从以下几个细致的维度,考察独创性是否存在:

提示词的复杂性与特异性: 是通用的、模糊的描述,还是包含了独特的情节设定、视角构图、风格融合要求、排除性指令等细节?是否体现了使用者的个性化构思?

引导过程的迭代性(多轮线性修订)与控制力: 用户是否进行了多轮提示词调整、结果筛选、局部修改(Inpainting/Outpainting)?是否运用了复杂的提示词工程技巧?这个过程是否体现了对生成结果的主动、精细控制以实现其具体构想?

最终内容的“不可预测性”: 在给定模型能力的前提下,仅凭一个简单提示词,其他普通用户能否大概率生成高度相似的结果?若使用者通过其独特、复杂的输入使得结果显著区别于模型的“默认”或“平均”输出,则其贡献更具独创性。

小结

版权法对“独创性”的要求在AI时代似乎极具前瞻性,今后的“创立创作”应该更注重考察是否摆脱了对模型能力的依赖而达成的“独立”状态。AIGC的版权新秩序必须建立在清晰区分“铸剑者”(模型开发者(训练者))与“舞剑者”(内容使用者)各自贡献的基础之上。开发者(训练者)通过微调、蒸馏、LoRA等定向训练技术“铸就”了模型强大的、特定领域的内容生成能力——这属于技术成果的范畴。而使用者通过提示词工程及后续操作“舞动”模型以生成具体内容,其能否获得版权,则严格取决于其输入和引导行为是否在该模型能力边界内注入了可识别的、具有“显著性”的独创性智力表达。

摒弃“以最终效果倒推使用者创作能力”的粗放思维,构建聚焦于生成过程中人类具体创作行为的精细化版权认定标准,是保障AIGC领域健康、公平发展,有效激励技术研发与艺术创作双重创新的关键所在。唯有如此,才能在人工智能时代守护版权制度的核心价值——保护真正的智力创造。