作者:王茜
能够生成文本、图像、音乐和代码的人工智能系统,通常依赖海量现有素材进行训练。而这些素材中,不可避免地包含大量受著作权保护的作品。这一现实已在美国引发了超过40起由作者、艺术家及其他创作者针对AI开发者提起的诉讼。
这些争议的核心问题是:如果一家AI公司复制受著作权保护的书籍或图像来训练模型,这是否构成著作权侵权?
Bartz v. Anthropic和Kadrey v. Meta这两起美国的案件率先对这一问题提供了具有参考意义的司法分析。虽然裁决尚未终结争论,但它们开始勾勒出法院在著作权框架下审视AI训练行为的思路。
为什么AI训练在法律上具有争议?
在训练大型语言模型(LLMs)或其他生成式AI系统时,开发者通常会将大量数据(包括书籍、文章及其他表达性作品)复制并输入系统进行分析。
对此,作者方面通常会主张未经许可复制其作品构成侵权。而AI公司则会以“原作品并未被逐字逐句发布,且原作品仅用作模型分析,因此构成美国著作权法下的“合理使用”(fair use)”进行回应。
在美国著作权法中,合理使用允许在特定条件下未经许可使用受保护作品,尤其是当该使用具有新的、不同的目的时。
法院如何看待这一问题?
2025年3月,在Bartz v. Anthropic和Kadrey v. Meta这两起案件中,Bartz和Kadrey代表作品被用于训练Claude和Llama模型的作者群体,在分别针对Anthropic和Meta提起的集体诉讼中担任首席原告。在2025年6月,两案各自的法官在大体上都支持了被告的合理使用抗辩,但仍对两被告小部分论点提出了质疑。
两家法院都认同一个关键点:在某些情况下,将受著作权保护的作品用于训练AI模型可以被视为“具有转换性”(transformative)。
1. AI训练可构成“转换性使用”
在美国法下,合理使用分析中最重要的因素之一,是该使用是否具有转换性,即是否赋予作品新的功能或目的。
两案法官的逻辑是:作者创作书籍的目的是教育或娱乐读者,而AI公司则通过统计分析书籍内容来训练模型。由于目的不同(阅读 vs. 机器学习),法院认为训练用途具有高度转换性。
但需要强调的是:即便具有转换性,也并不自动意味着合法。法院仍需综合考量其他合理使用因素。在本案中,法院也将作品性质纳入考虑,认为小说、回忆录等高度表达性的作品通常享有更强的著作权保护,而说明书等事实性作品的保护范围相对较窄。
法院承认,AI开发者选择这些书籍正是因为其语言表达丰富,因此这一因素在一定程度上不利于合理使用抗辩。不过,这一因素本身不足以决定案件结果。
2. 复制作品的限度和目的
通常情况下,完整复制整部作品不利于构成合理使用抗辩。但法院还会进一步审查:被告复制整部作品的具体目的。
两案中的AI开发者主张,为有效分析语言模式,完整文本是技术上必要的。两位法官都接受了这一解释,认为在训练背景下,复制整部作品可能具有合理性。
3. 最具争议的问题:“市场稀释”
案件中最引发争议的,是一个新的理论:AI是否会通过大量生成内容,从而间接损害人类创作者的市场?这一理论被称为“市场稀释”。
具体来说,部分作者认为:AI可以非常快速生成海量内容,即使这些内容未直接复制具体作品,也可能与人类创作竞争。若读者转向AI生成的小说或文章,作者收入将减少,长远来看,这可能削弱创作动力。这一理论不同于传统著作权中的“直接替代”(如盗版书籍直接取代正版销售),而是强调一种间接的市场压力。
Bartz案中的Alsup法官对这一理论持怀疑态度,认为其过于推测性。
Kadrey案中的Chhabria法官则表示,如果未来原告能够提供具体证据证明AI生成内容确实造成经济损害,法院可能会更加严肃对待这一主张。生成式AI的输出会造成间接的市场替代,这一点在认定合理使用抗辩时也应适当考虑。
但我们仍能看出法院要求的是实际、具体的损害证据,而不仅是预测。这一问题预计将在上诉和未来案件中继续被深入探讨。
案件意义
1.对AI开发者
以上裁决表明:
法院可能接受AI训练使用作品具有转换性;
为技术目的复制整部作品可能被认为合理;
但AI生成作品是否会导致“市场稀释”的问题仍无明确倾向。
法院还暗示,与其全面禁止AI训练,不如通过金钱赔偿或许可机制解决争议。这意味着,未来可能出现创作者与AI企业之间的许可市场。
2.对作者和创作者
对于作者,相较于新晋创作者而言,知名作者因品牌和声誉优势,可能较少受到冲击;而类型小说作者(如言情、生活类、新闻写作),由于其创作性相对较低,可能更容易受到高频AI生成内容的竞争压力。
3.国际视角
尽管这些案件源于美国法,但其影响具有全球意义。AI训练问题在所有国界都已成为学界与政策讨论的热点,全球范围内,政策制定者都在思考:AI训练是否应取得许可?是否需要建立补偿机制?如何在保护创作者的同时推动创新?答案仍在形成之中。
结语
这些早期判决既没有为AI公司提供“通行证”,也没有确保作者必然胜诉。它们传达的信息是:某些训练行为可能构成合理使用,另一些则未必,尤其是在市场损害证据明确的情况下。法院也关注创意产业的长期健康,对全面阻断技术发展持谨慎态度。
法律框架仍在演进,上诉程序也可能进一步塑造规则。
围绕AI训练与著作权的争论,不仅是法律问题,更是关于社会如何评价创造力、创新与公平的价值判断。随着AI能力不断提升,全球法院将继续在鼓励技术进步与保护人类创作之间寻找平衡。
目前可以确定的是:这场讨论远未结束。