4月7日消息,有诉讼指出苹果在训练AI模型时使用了包含数百万条YouTube视频的数据集。科技媒体MacRumors发现,Ted Entertainment、Matt Fisher与Golfholics这三个YouTube频道联合发起了一场集体诉讼,控告苹果绕过YouTube的反爬虫防护机制,下载了数量达数百万的视频。
根据诉讼文件,苹果研究团队曾发表一篇题为《STIV:可扩展文本与图像条件视频生成》的研究论文,其中提到团队采用名为Panda-70M的数据集,来训练论文所介绍的视频生成模型。
据IT之家了解,Panda-70M数据集就像一份地图或索引文件,能借助网址、视频标识符和时间戳来定位特定的YouTube视频及其片段。单个YouTube视频可以被分割成多个片段,每个片段都作为独立的训练样本。提取任何一个片段都需要单独访问YouTube原视频并截取指定的段落,在这个过程中,每获取一个片段,就形成了一次独立的规避行为。
原告方表示,其内容在该数据集中的出现次数超过500次,因此希望代表“所有处境相同的其他权利人”提起集体诉讼。
简言之,原告方主张,即便该数据集仅包含视频链接,苹果仍涉嫌绕过YouTube的反爬虫保护措施,下载并利用视频原内容来训练其AI模型。
据此,原告方要求由陪审团审理全部诉求,并提出以下主张:
1. 认定本案为集体诉讼,指定原告及原告方律师代表全体集体诉讼成员;
2. 认定被告存在故意规避YouTube为保护原告及集体诉讼成员视听内容而建立的版权保护系统的行为。
3. 按照《美国法典》第17编第1203条的规定,提出法定赔偿(单次侵权依照法律规定的最高限额进行赔付)、禁令救济以及律师费与诉讼成本的主张;
4. 依据《美国法典》第17编、第28编以及法院的固有职权,申请采取公平救济措施,以防范或制止原告及集体诉讼成员受版权保护的内容遭受侵权,具体包括颁布临时及永久禁令,要求被告及其高管、代理人、雇员、律师、董事、继承人、受让人、被许可方,以及所有协同参与相关行为的主体,立即停止侵权行为,或停止从事促成、协助、纵容、推动、鼓励、诱导、实质性参与原告及集体诉讼成员依据联邦法律所享有的专属权利被侵权的行为,附件A、B、C中所列的内容也包含在受保护范围内;
5. 申请法院就对被告作出的所有金钱赔偿判决,按法律最大限度判令支付判决前及判决后利息;
6. 申请法院裁定其他合理且正当的救济措施。
除苹果之外,原告方还针对亚马逊和OpenAI发起了集体诉讼,控告这两家公司在各自的AI模型训练过程中也使用了Panda-70M数据集。