
学者控告苹果AI版权侵权:Books3数据集引发争议
纽约州立大学健康科学大学的两名研究人员——苏珊娜・马丁内斯-康德与斯蒂芬・麦克尼克——近日联合向法院提起集体诉讼,指控苹果公司非法使用含有盗版图书的数据库“Books3”训练其人工智能系统,侵犯他们的原创作品版权。两人要求陪审团审理,并依据美国版权法索赔最高达每部作品15万美元。目前案件尚处初期阶段,尚未排定开庭时间,苹果公司未就此作出公开回应。
苹果AI训练数据遭质疑,原告作品被指被用于模型学习
原告诉称,苹果在研发“苹果智能”AI系统时,使用的训练数据中包含他们的著作《幻觉冠军》和《思维的诡计》的盗版版本。这些内容出现在“Books3”数据库中,而“Books3”是OpenELM语言模型所使用的数据集“The Pile”的一部分。苹果在2024年4月曾承认这一事实。尽管该数据库早在2023年10月被移除,但原告认为,苹果在此之前已完成对其作品的提取和学习,构成侵权行为。
AI版权案件的法律争议与前例参考
该案法律难点在于,如何认定AI训练中对版权作品的使用是否构成侵权。苹果并未公开其全部训练数据清单,使得举证困难重重。美国此前在Anthropic与Midjourney等案件中,法官对“合理使用”范围持不同态度。部分案例认为AI学习可属于合理使用,但若保留作品副本或未经授权复制,则可能违反版权法。本案的审理结果或将成为AI行业版权边界的重要参照。
案件影响与行业启示
两位原告除要求经济赔偿外,还希望法院下达永久禁令,禁止苹果继续使用涉案作品。若法院认定其行为构成故意侵权,苹果可能需承担高额赔偿责任。业内专家指出,此案不仅关乎苹果一家公司,更折射出AI时代版权保护的制度挑战。随着AI训练数据使用愈发广泛,如何在创新与合规之间取得平衡,已成为全球科技企业亟需面对的法律与伦理课题。
© 版权声明
文章版权归作者所有,未经允许请勿转载。