鳳凰網科技訊《AI前哨》 北京時間8月16日消息,面對AI技術的大規模采用,傳統媒體出手。《紐約時報》日前更新其服務條款,禁止未經許可將其內容用於訓練人工智能系統。通過采取預防措施,阻止其內容被用來訓練人工智能模型。
據悉,《紐約時報》8月3日更新其服務條款,禁止將其內容(包括文本、照片、圖像、音頻/視頻剪輯、“外觀和感覺”、元數據或編譯)用於開發“任何軟件程序,包括但不限於訓練機器學習或人工智能(AI)系統”。
更新的條款還明確指出,未經書面許可,不能使用網站爬蟲類自動化工具訪問、收集平臺發佈的內容。紐約時報表示,拒絕遵守這些新限制可能會導致罰款或處罰。
盡管在政策中引入新規,但《紐約時報》似乎沒有對其robots.txt文件進行任何更改,該文件會通知搜索引擎爬蟲可以訪問哪些URL。
此舉或許是對谷歌最近更新的隱私政策的回應。該政策披露,搜索巨頭可能會從網絡上收集公共數據來訓練其各種人工智能服務,如Bard或Cloud AI。為OpenAI ChatGPT等人工智能服務提供“動力”的許多大型語言模型都是在龐大的數據集上訓練出來的,而這些數據集可能包含未經原創作者許可從網絡上搜刮來的受版權保護或其他保護的資料。
盡管如此,《紐約時報》也在今年2月與谷歌簽署一項價值1億美元的協議,允許這傢搜索巨頭在未來三年內在其《紐約時報》的一些平臺上發佈內容。該出版物稱,兩傢公司將在內容分發、訂閱、營銷、廣告和實驗工具方面展開合作,因此《紐約時報》服務條款的修改有可能是針對OpenAI或微軟等其他公司的。
據Semafor此前報道,《紐約時報》已經退出一個試圖與科技公司就人工智能訓練數據進行聯合談判的媒體聯盟。這意味著如果它真的與公司達成交易,可能更多的是根據具體情況而定。
OpenAI最近宣佈,網站運營商現在可以阻止其GPTBot網絡爬蟲對其網站進行抓取。微軟也在自己的條款和條件中增加一些新的限制,禁止人們使用其人工智能產品“創建、訓練或改進(直接或間接)任何其他人工智能服務”,同時禁止用戶從其人工智能工具中搜刮或以其他方式提取數據。
本月早些時候,包括美聯社和歐洲出版商理事會在內的多傢新聞機構簽署一封公開信,呼籲全球立法者制定相關規則,要求訓練數據集透明,並在使用數據進行訓練前征得權利人的同意。