美東時間周二,美國八傢新聞機構在紐約聯邦法院對OpenAI、微軟提起訴訟,指控這兩傢公司在未經許可的情況下,使用它們的新聞作品來訓練生成式人工智能(AI)。據悉,這八傢新聞機構分別為《紐約每日新聞》、《芝加哥論壇報》、《奧蘭多哨兵報》、《水星報》、《丹佛郵報》、《先鋒新聞》等,它們均屬於一傢叫做奧爾登全球資本公司的對沖基金。
這些新聞機構當天指控稱,微軟的Copilot和OpenAI的ChatGPT非法復制數百萬篇文章來培訓AI模型。
訴狀還提到,某些時候微軟和OpenAI的AI會逐字或近乎逐字地復制受版權保護的新聞作品,但不提供這些作品的作者、標題、版權或使用條款信息。更可惡的是,ChatGPT還“偽造”那些損害其聲譽的文章,比如《丹佛郵報》一篇宣揚吸煙可以治療哮喘的虛假文章。
這些新聞機構要求OpenAI和微軟賠償它們的損失,並停止進一步侵犯版權行為。
OpenAI發言人周二表示,該公司在產品開發和設計過程中非常註重支持新聞機構。“盡管我們之前沒有意識到奧爾登公司的擔憂,但我們正在積極與世界各地的許多新聞機構建立建設性的合作夥伴關系和進行對話,以探索機會,討論任何問題,並提供解決方案。”
在此之前,《紐約時報》和另外三傢新聞機構The Intercept、Raw Story和AlterNet也對微軟和OpenAI發起類似的訴訟。
新聞行業的律師Steven Lieberman評論稱,OpenAI的巨大成功也要歸功於其他人的工作,它在未經許可或付款的情況下獲取大量優質內容。
《紐約時報》本月揭露稱,OpenAI、谷歌、Meta等公司為獲取訓練語料,不惜修改政策條款、無視互聯網信息的使用規則,違法使用“多個來源”的數據。
這一切的背後是,訓練大語言模型用的數據越多,表現就會越好,但現在科技公司使用數據的速度已經超過數據生產的速度,甚至已經耗盡互聯網上所有可靠的英文文本資源。
版權合作
與此同時,科技公司也在與新聞機構達成合作協議。就在本周,英國《金融時報》(FT)宣佈與OpenAI達成協議,將授權後者使用其資料庫來訓練AI模型。
今年1月,OpenAI表示,其正與數十傢出版商洽談文章授權協議。截至目前,除FT外,OpenAI還和美國的美聯社、德國的施普林格、法國的《世界報》和西班牙的Prisa Media達成協議。
OpenAI每年向一些媒體公司提供100萬至500萬美元的授權費用,這遠遠低於蘋果等其他公司的報價。