AI版权战升温
关于AI训练数据的法律斗争正在多个司法管辖区升级,内容创作者和科技公司对合理使用提出了根本不同的观点,法院需要解决这些观点。
这些诉讼遵循一种模式:创作者发现他们的作品在未经许可或补偿的情况下被用来训练AI系统。他们起诉。AI公司援引合理使用。法院必须确定百年前的版权框架是否适用于其起草者从未想象过的技术。
结果将塑造AI开发的未来。如果训练受版权保护的材料需要许可,AI的经济将发生巨大变化。如果合理使用保护适用,现有的权力动态基本保持不变。
AI行业的辩护
科技公司认为,在公开可用的内容上训练AI模型构成转换性使用,创造根本的新能力而不是简单地复制现有内容。
这反映了人类如何学习:我们阅读现有作品,内化模式和想法,然后创建受我们所消费内容影响的新事物。版权从未禁止从已发表作品中学习,只禁止复制它们。
限制AI训练将使能力集中在拥有现有内容许可或资源创建庞大专有数据集的组织之间。较小的公司和研究人员将被完全关在AI开发之外。
"如果阅读和学习已发表的材料需要许可,我们不是在保护创作者——我们将AI开发交给少数有资源应对许可噩梦的科技巨头。"
创作者的反驳
内容创作者看到了不同的情况。他们的作品在未经许可或补偿的情况下被用来构建将与他们竞争的系统。AI公司正在从创意作品中提取价值,同时认为他们不欠创作者任何东西。
规模使AI训练与人类学习区别开来。一个人一生中阅读可管理数量的作品。AI系统在几天内摄入数百万受版权保护的作品,创造出个人创作者无法匹敌的竞争优势。
创作者指出,AI公司仔细保护自己的知识产权——模型权重、训练程序、架构——同时坚持使用他人的知识产权不需要许可。这种不对称感觉是故意的。
法院正在考虑什么
早期的法院判决好坏参半,反映了关于现有法律如何适用的真正不确定性。法官正在权衡几个因素:使用的目的、受版权保护作品的性质、使用的数量以及对原作市场的影响。
转换性使用原则为AI公司提供了最有力的论据。法院历史上保护将受版权保护的材料转换为新内容而不是仅仅复制它的使用。
但是市场效应因素不利于AI公司。如果训练在受版权保护内容上的AI系统与该内容竞争——例如,以艺术家的风格生成图像——对创作者的经济损害是直接和可衡量的。
立法回应
由于对诉讼的进展感到沮丧,一些司法管辖区正在考虑专门解决AI训练的立法。方法差异很大,从强制许可计划到明确的合理使用例外到对某些类型训练的完全禁令。
挑战在于制定足够具体以可执行但足够灵活以适应快速技术变化的规则。对2024年AI能力有意义的东西可能在2027年变得无关紧要。
国际协调极少。在全球运营的公司面临相互冲突的要求拼凑——在一个司法管辖区允许的东西可能在另一个司法管辖区被禁止。合规成为战略约束。
实际安排
在等待法院和立法机构明确的同时,一些科技公司正在与主要内容提供商达成许可协议。这些协议提供了法律确定性和公关价值,尽管它们通常不解决基本的哲学问题。
此类协议对可以协商有利条款的大型内容所有者有意义。它们使较小的创作者没有筹码要求公平补偿,使议价能力中现有的不平等永久化。
像退出机制这样的技术解决方案提供了另一条路径。但它们将负担放在创作者身上,去发现他们的作品正在被使用并采取行动阻止它——创作者认为这颠倒了适当顺序的立场。
接下来发生什么
版权战将通过法院和立法机构需要数年才能解决。在此期间,AI开发在法律不确定性下继续,这对规避风险的组织不利。
最可能的结果是一个混乱的妥协:一些使用被允许,其他被限制,边界通过逐案诉讼定义。这并不高效,但这是法律系统通常处理新颖技术的方式。
对于AI公司,战略问题是争取最大的自由还是接受一些限制以换取法律确定性。对于创作者,是推动全面保护还是接受对其作品使用的有限补偿。
双方都不会得到他们想要的一切。问题是什么妥协出现,以及它是否服务于在公平补偿创意工作的同时实现有益AI开发的更广泛目标。