音乐出版商就2万首作品的"公然盗版"起诉Anthropic索赔30亿美元
最初,这些音乐出版商就Anthropic使用约500部受版权保护作品提起了诉讼。现在他们大幅扩大了案件,指控AI公司未经许可或补偿系统性地训练了2万首歌曲,他们称之为"历史上最大的大规模版权侵权之一"。
诉讼已经从对500首歌曲的争议演变为对Anthropic商业模式的生存挑战。出版商寻求30亿美元的损害赔偿——每部作品约15万美元,这是故意版权侵权的最高法定惩罚。该案可能重塑AI公司如何训练其模型,并可能为整个行业的版权责任建立先例。
扩大的指控
当去年最初提起诉讼时,它集中在Claude模型可以 reproduced 的相对狭窄的歌词集。出版商声称他们的受版权保护歌词出现在Claude输出中,没有归属或补偿。Anthropic辩解为合理使用,认为其使用是变革性的,模型学习了歌曲模式而不是复制特定作品。
修正后的投诉讲述了一个不同的故事。出版商声称他们已获得Anthropic的内部文件,显示从多个来源系统性地抓取受版权保护的歌曲歌词,包括许可歌词网站和音乐流媒体平台。诉讼称Anthropic故意构建专注于商业上成功的歌曲的训练数据集,而不是偶然包含。
更损害的是,投诉指控Anthropic的内部文件讨论了许可策略,但最终决定在未经许可的情况下进行,计算训练受版权保护材料的好处超过诉讼风险。如果这些指控属实,Anthropic的合理使用辩护将大大削弱。
"这不是偶然侵权。这不是合理使用。这是一个经过计算的商业决定,在未经许可或支付的情况下使用他人的创意作品,在未补偿的词曲作者背上建立数十亿美元的公司。"
发现过程
出版商如何发现所谓的内部文件?通过发现,即诉讼中各方交换证据的法律程序。最初的诉讼允许出版商传唤Anthropic的训练记录、内部通信和数据收集做法。扩大的投诉表明发现揭示了比最初怀疑的更广泛的侵权。
Anthropic一直努力保持某些文件的机密性,声称商业秘密保护。但法院通常对指控秘密是非法活动的商业秘密索赔缺乏同情。Anthropic越试图压制训练细节,法院往往变得越怀疑。
发现过程还据报道揭示了Anthropic和其他AI公司之间关于版权策略的通信。出版商寻求引入这些通信作为行业范围内协调侵权版权的证据,这可能对Anthropic之外产生影响。
技术辩护
随着案件的进展,Anthropic的法律策略已经演变。最初,公司主张合理使用并质疑音乐出版商代表词曲作者起诉的立场。这些论点仍然存在,但Anthropic还引入了关于其模型实际如何工作的技术辩护。
公司声称虽然Claude在歌词上训练,但它不存储或 reproduced 受版权保护的作品。相反,模型学习关于歌词如何构建的统计模式——押韵方案、主题元素、常用短语——它可以应用来生成原创内容。从Anthropic的角度来看,这与人类通过研究现有歌曲学习歌曲创作没有区别。
出版商反驳说Anthropic自己的内部文件与这一主张相矛盾。他们声称Claude可以并且确实 reproduced 受版权保护歌词的大部分,特别是对于知名歌曲。投诉包括例子,其中Claudio在被适当提示时 reportedly 生成了流行歌曲歌词的近乎精确的复制品。
更广泛的AI行业影响
此案已成为AI版权问题的风向标。虽然其他案件解决了视觉艺术、代码和文本,但音乐行业传统上一直是版权最积极的执法者。此案件的解决方式可能会影响整个AI行业的策略。
如果出版商胜诉,AI公司可能面临许可训练数据或开发无需受版权材料训练的方法的压力。一些公司已经在探索"基于同意"的训练数据集和创作者补偿计划。Anthropic的损失将大幅加速这些努力。
相反,如果Anthropic成功辩护其合理使用论点,它可能鼓励AI公司继续未经许可训练受版权保护的作品。这可能导致更多诉讼,并最终导致最高法院考虑版权法如何适用于AI训练。
还有责任问题。法院可能裁定Anthropic的预训练使用是侵权的,但公司当前运营是允许的,如果它停止使用受版权保护的数据。或者,法院可能发现使用侵权数据训练的模型本身就是侵权的,可能迫使公司从头开始重新训练其系统。
立法角度
除了法院之外,此案正在推动立法活动。国会议员对澄清版权法如何适用于AI训练表示兴趣。一些提案将要求AI公司披露其训练来源,而其他人将为AI训练数据创建新的许可制度。
音乐行业在AI版权问题的游说方面特别活跃。美国唱片业协会倡导了更强的保护和强制许可。立法是否在此案件结束前通过是一个悬而未决的问题,但诉讼无疑增加了对AI版权问题的政治关注。
利益攸关
对于Anthropic,利害关系的30亿美元超过了公司迄今为止的总资金。在这个规模上的损失可能是生存性的,特别是如果法院还发布禁令要求Anthropic在没有受版权保护材料的情况下重新训练其模型。公司可能面临来自其他版权持有人的类似诉讼,成倍增加潜在责任。
对于音乐行业,此案代表在AI变得更加根深蒂固之前建立先例的机会。出版商知道,如果AI公司现在可以不经许可训练,以后改变这些做法将更加困难。此案是为AI时代建立规则,而不仅仅是追回过去侵权的损害赔偿。
对于更广泛的AI行业,不确定性本身是有问题的。公司不知道他们是否可以合法地训练受版权保护的材料,是否需要许可训练数据,或者他们过去训练的暴露可能是什么。这种不确定性让投资者紧张,并可能减慢AI开发,直到法律问题得到解决。
前进的道路
除非达成和解,否则案件可能在今年晚些时候进入审判。鉴于潜在的损害赔偿,Anthropic有强大的动力和解,但和解需要双方同意条款——出版商可能相信他们可以通过诉讼提取更优惠的条款。
任何和解都可能包括大量付款、对未来训练实践的承诺,以及可能的某种形式的持续许可安排。问题是Anthropic能否负担出版商可能要求的规模和解。
此案不会是AI和版权的最后一句话,但可能是最重要的。音乐行业积极追求侵权的意愿、利害关系的大量损害赔偿以及详细的发现过程使此诉讼成为潜在的里程碑。无论它如何解决,决定将在未来几年塑造AI和版权之间的关系。