快科技1月14日消息,據國內媒體報道,Meta最近因使用數千本盜版書籍訓練人工智能模型存在法律風險而引發版權侵權訴訟。
據悉,Meta使用大量盜版書籍的Books3”數據集訓練其LLAM 1和LLAM 2模型,Meta雖承認使用 Books3 數據集,卻拒絕向作者支付適當的補償。
Books3是一個包含19.5萬本圖書、總容量近37GB的文本數據集,由AI研究者Shawn Presser於2020年創建,旨在為改進機器學習算法提供更好的數據源。
Meta也將其用於訓練自己的LLAM模型,然而Books3中包含大量從盜版網站Bibliotik爬取的受版權保護作品,使得Meta的行為面臨法律風險。
多位科技公司今年面臨類似的投訴,指責他們在構建生成式AI模型時侵犯藝術傢、作者和其他內容創作者的版權。
此外,歐盟關於人工智能的新臨時規則可能會迫使公司披露用於訓練模型的數據集,這可能會使他們面臨更大的法律風險。