“ChatGPT之父”：OpenAI早已不使用客戶數據來訓練模型

2023-05-06 來自財聯社發表於業界精選

當地時間周五（5月5日），美國人工智能公司OpenAI首席執行官山姆·阿爾特曼（SamAltman）表示，公司已經“有一段時間”沒有使用付費客戶的數據來訓練人工智能（AI）大語言模型。

OpenAI是近期爆火的AI聊天機器人ChatGPT的開發商，而阿爾特曼提到的“大語言模型”就是ChatGPT背後的關鍵技術。據解，開發商在訓練大語言模型時需要攝取網絡上的海量數據，才能提高模型生成自然語言的能力。

阿爾特曼在專訪中說道，“用戶們顯然希望我們不要使用他們的數據進行訓練，所以我們已經改變我們的計劃，未來我們也不會這樣做。”

網絡記錄也顯示，今年3月1日，OpenAI悄然更新其服務條款：“不會使用通過其API提交的任何數據來‘服務改進’，包括AI模型訓練，除非客戶或組織選擇加入。”

此外，該公司同時添加30天的數據保留政策，API用戶可以選擇“根據用戶需求”進行更嚴格的保留，並簡化其條款和數據所有權，以明確用戶擁有模型的輸入和輸出。

鑒於新的隱私規則僅適用於API用戶，這也意味著，普通用戶和ChatGPT之間的對話內容，隻要用戶切換“關閉聊天記錄”按鈕，仍會進入到模型的訓練資料庫。

長期以來，開發人員一直對OpenAI先前的數據處理政策頗有異議，聲稱這會帶來隱私風險並允許公司從他們的數據中獲利。目前，亞馬遜等公司已經頒佈禁止員工分享敏感數據的措施，以防范ChatGPT這樣的大語言模型竊取公司機密。

另有消息稱，三星電子本周也推出一項新政策，要求員工不得在工作場所使用ChatGPT等生成式人工智能。此前，該公司的半導體業務部門曝出三起機密資料外泄案件，其中兩起與半導體設備有關的文件可能已經錄入到ChatGPT的學習資料庫中。

本周早些時候，美國作傢協會（WGA）與電影公司之間為期六周的合同談判破裂，好萊塢面臨15年來首次編劇罷工。而究其原因，是美國作傢協會要求限制人工智能編寫電影和電視劇劇本。

美國作傢協會談判委員會成員John August表示，編劇對人工智能主要有兩個不滿：他們不想讓自己的作品成為“喂飽”AI的材料，也不想以後隻能修改AI草率的初稿。

相關推薦