繼“美版貼吧”Reddit宣佈向AI公司收取數據使用費之後,又有一傢網站計劃跟進。IT問答網站StackOverflow日前宣佈,計劃從今年年中起,向大型AI開發商收取數據訪問費用,付費後才可以獲取該平臺上的5000萬個問題與答案。
Stack Overflow是一個程序設計領域的問答網站,隸屬Stack Exchange Network。網站上最常見的問答主題包括JavaScript、Java、C#、PHP、Android、Python、jQuery和HTML等。如今其註冊用戶已超過2000萬。
其首席執行官Prashanth Chandrasekar表示,“社區平臺推動大語言模型(LLM)發展,所作出的貢獻也必須得到補償。”
同樣也是在本周,美國新聞媒體聯盟(The News/Media Alliance,前美國報業協會)公佈多項原則,呼籲AIGC開發公司就數據使用展開談判,並要求這些開發公司尊重新聞媒體獲得公平補償的權利。
環球音樂集團(Universal Music Group)近日也發出警告,阻止AI服務從其受版權保護的歌曲中抓取旋律和歌詞。
科技巨頭或成主要收費對象 馬斯克已作出“價格示范”
實際上,OpenAI、Google、Meta等多傢科技公司在建立大規模AI項目時,歷來不會為大部分訓練數據付費,而是選擇從網絡直接“搜刮”,數據來源便囊括上文提到的Stack Overflow和Reddit。當然,在美國此舉通常被看作合法行為,但仍存在一些版權與網站條款爭議。
但即便在這種情況下,ChatGPT等一系列AI大模型/聊天機器人的開發費用也已高達數億美元。隨著Reddit、Stack Overflow等網站開始“開口要錢”,這些科技巨頭的AI開發費用未來很可能“再上一層樓”,而技術開發時間或也將進一步延長。
至於具體如何收費?不論是Stack Overflow還是Reddit都暫未發佈價格信息。
Reddit透露,“我們正在處理這個問題,將在未來幾周內與合作夥伴分享更多信息。”Stack Overflow則表示,公司將借鑒研究Reddit的策略,並與潛在客戶展開協商,目前已與部分客戶就數據訪問進行接觸。
這兩傢公司的收費方案或許都將針對大型科技公司:Stack Overflow稱希望收費對象僅限於以商用為目的開發LLM的大型公司;Reddit也有類似表態。而其餘用戶與公司則有望繼續免費使用數據。
而馬斯克或許也為這兩傢公司提供可供借鑒的定價方案——本月馬斯克已提高Twitter數據訪問價格,起價為每月4.2萬美元,可訪問5000萬條推文。而就在本周三,馬斯克剛剛指控微軟非法使用Twitter數據來訓練其AI模型,還直言“訴訟時間到”,警告要起訴微軟。