當地時間周五(5月5日),美國人工智能公司OpenAI首席執行官山姆·阿爾特曼(SamAltman)表示,公司已經“有一段時間”沒有使用付費客戶的數據來訓練人工智能(AI)大語言模型。
OpenAI是近期爆火的AI聊天機器人ChatGPT的開發商,而阿爾特曼提到的“大語言模型”就是ChatGPT背後的關鍵技術。據解,開發商在訓練大語言模型時需要攝取網絡上的海量數據,才能提高模型生成自然語言的能力。
阿爾特曼在專訪中說道,“用戶們顯然希望我們不要使用他們的數據進行訓練,所以我們已經改變我們的計劃,未來我們也不會這樣做。”
網絡記錄也顯示,今年3月1日,OpenAI悄然更新其服務條款:“不會使用通過其API提交的任何數據來‘服務改進’,包括AI模型訓練,除非客戶或組織選擇加入。”
此外,該公司同時添加30天的數據保留政策,API用戶可以選擇“根據用戶需求”進行更嚴格的保留,並簡化其條款和數據所有權,以明確用戶擁有模型的輸入和輸出。
鑒於新的隱私規則僅適用於API用戶,這也意味著,普通用戶和ChatGPT之間的對話內容,隻要用戶切換“關閉聊天記錄”按鈕,仍會進入到模型的訓練資料庫。
長期以來,開發人員一直對OpenAI先前的數據處理政策頗有異議,聲稱這會帶來隱私風險並允許公司從他們的數據中獲利。目前,亞馬遜等公司已經頒佈禁止員工分享敏感數據的措施,以防范ChatGPT這樣的大語言模型竊取公司機密。
另有消息稱,三星電子本周也推出一項新政策,要求員工不得在工作場所使用ChatGPT等生成式人工智能。此前,該公司的半導體業務部門曝出三起機密資料外泄案件,其中兩起與半導體設備有關的文件可能已經錄入到ChatGPT的學習資料庫中。
本周早些時候,美國作傢協會(WGA)與電影公司之間為期六周的合同談判破裂,好萊塢面臨15年來首次編劇罷工。而究其原因,是美國作傢協會要求限制人工智能編寫電影和電視劇劇本。
美國作傢協會談判委員會成員John August表示,編劇對人工智能主要有兩個不滿:他們不想讓自己的作品成為“喂飽”AI的材料,也不想以後隻能修改AI草率的初稿。