OpenAI被控非法使用圖書數據來訓練ChatGPT

2023-06-30 來自 TechWeb.com.cn 發表於業界精選

6月30日消息，據外媒報道，在一項集體訴訟中，OpenAI被控非法使用圖書數據來訓練ChatGPT。

ChatGPT是OpenAI於2022年11月30日推出的一種新型AI聊天機器人工具，可根據用戶的要求快速生成文章、故事、歌詞、散文、笑話，甚至代碼，並回答各類疑問。ChatGPT一經發佈就在互聯網上掀起一場風暴，並成為歷史上增長最快的消費者應用程序。

然而，兩名美國作傢在舊金山聯邦法院起訴OpenAI，聲稱該公司濫用他們的作品來“訓練”ChatGPT。他們表示，ChatGPT在未經許可的情況下提取從大量圖書中復制來的數據，侵犯作者的版權。

據報道，為訓練其強大的人工智能語言模型，OpenAI會利用從網絡收集來的大量數據，這些數據集包括維基百科文章、著名小說、社交媒體帖子等所有內容，而OpenAI沒有要求獲得任何許可。

這起在加州提起的集體訴訟稱，不遵守適當的采購指導方針，包括征求最初制作這些內容的人的同意，就相當於直接盜竊數據。

該訴訟請求法院裁定，OpenAI非法下載小說副本以訓練其人工智能系統，侵犯作傢的作品，ChatGPT的答案構成侵權。（小狐貍）

相關推薦

OpenAI突然“銷毀”10萬多本書，到底發生什麼？

2024-05-08

爭議仍在繼續。OpenAI周二在一份聲明中表示：“驅動當前ChatGPT和應用程序接口的模型不是使用這些數據集開發的。這些數據集是由OpenAI前員工創建的，最後一次使用是在2021年，並在2022年因未使用而被刪除。”

“ChatGPT之父”：OpenAI早已不使用客戶數據來訓練模型

2023-05-06

智能（AI）大語言模型。OpenAI是近期爆火的AI聊天機器人ChatGPT的開發商，而阿爾特曼提到的“大語言模型”就是ChatGPT背後的關鍵技術。據解，開發商在訓練大語言模型時需要攝取網絡上的海量數據，才能提高模型生成自然語言的

Google否認Bard是用ChatGPT數據訓練的

2023-03-30

包含可能令人震驚的指控，即Google如此低級地使用OpenAI的ChatGPT的數據來訓練Bard。報道稱，這些數據是從一個名為ShareGPT的網站上采集的，一位前Google人工智能研究員公開反對使用這些數據。但Google堅定而明確地否認使用這些數

谷歌頂級AI專傢加入OpenAI 曾警告不要用ChatGPT數據訓練Bard

2023-03-31

發的人工智能聊天機器人Bard正在用來自OpenAI聊天機器人ChatGPT的數據進行訓練。谷歌發言人則表示，“訓練Bard沒有用過任何來自ShareGPT或ChatGPT的數據。”據悉，用戶可以在ShareGPT這個平臺上發佈他們與聊天機器人ChatGPT所交流的信

ChatGPT真香！谷歌頂級AI專傢跳槽OpenAI

2023-03-31

自ShareGPT平臺的信息，如果這樣訓練的話，可能會讓Bard與ChatGPT過於相似。消息人士表示，在德弗林就這個問題對谷歌高管發出警告後，谷歌就停止使用這些數據來訓練Bard。據悉，德弗林在谷歌工作五年多的時間，2018年他作為主

OpenAI發佈重磅信息很快將推出ChatGPT企業版訂閱服務

2023-04-26

研究公司OpenAI在官網發佈的公告中表示，現在聊天機器人ChatGPT的用戶可以通過點擊設置中的切換開關，來阻止聊天記錄被用於訓練模型。比起這一改進，公告後半部分的消息明顯更為勁爆。OpenAI表示，公司正在開發新的“ChatGPTB

AI“三道閘”：海外新聞媒體打響“保衛戰”

2023-09-14

海外新聞業存在悲觀和樂觀的兩種態度。在悲觀者看來，ChatGPT的橫空出世代表著對新聞業的沖擊。而在樂觀者看來ChatGPT能使新聞業更加便捷自動化，新聞媒體可以自由創作更復雜、更有吸引力的內容。目前，多數海外傳媒多站

OpenAI再陷巨大爭議？Sora訓練數據被質疑非法 CTO采訪瘋狂翻車

2024-03-16

爭議，是這一年多全球相關人士討論最多的話題。如今，ChatGPT讓OpenAI的估值暴漲到800億美元；而Sora又幾乎要顛覆動輒上百億票房的好萊塢影視行業。然而這些收益卻進OpenAI的腰包，而做出關鍵貢獻的數據所有者，卻分文無收，

八傢新聞機構起訴OpenAI與微軟指控其AI工具侵犯版權

2024-05-01

基金。這些新聞機構當天指控稱，微軟的Copilot和OpenAI的ChatGPT非法復制數百萬篇文章來培訓AI模型。訴狀還提到，某些時候微軟和OpenAI的AI會逐字或近乎逐字地復制受版權保護的新聞作品，但不提供這些作品的作者、標題、版權或

企業帝國的優勢，馬斯克詳解如何打造“特立獨行”的AI？

2023-07-15

值觀，避免冒犯特定群體。馬斯克此前曾批評OpenAI，擔心ChatGPT“正被訓練成政治正確”。不過，馬斯克曾多次抨擊“覺醒心靈病毒”(指白人以外群體的權力增加)或進步價值觀，他表示：“我認為我們的AI可以給出人們可能會覺

AI產業的灰暗面：OpenAI、谷歌、Meta如何獲取訓練語料

2024-04-08

。隨後這些資料被輸入到GPT-4系統中，並成為聊天機器人ChatGPT的基礎。根據Google的政策，禁止用戶將平臺上的視頻用於“獨立”應用，同時禁止通過任何自動化手段（爬蟲等）訪問其視頻。有趣的是，在OpenAI偷偷扒Youtube視頻時

《紐約時報》更新條款禁止使用其內容訓練人工智能模型

2023-08-17

據來訓練其各種人工智能服務，如Bard或Cloud AI。為OpenAI ChatGPT等人工智能服務提供“動力”的許多大型語言模型都是在龐大的數據集上訓練出來的，而這些數據集可能包含未經原創作者許可從網絡上搜刮來的受版權保護或其他保

又有網站向AI公司開口要錢馬斯克已作出“價格示范”

2023-04-23

仍存在一些版權與網站條款爭議。但即便在這種情況下，ChatGPT等一系列AI大模型/聊天機器人的開發費用也已高達數億美元。隨著Reddit、Stack Overflow等網站開始“開口要錢”，這些科技巨頭的AI開發費用未來很可能“再上一層樓”

《紐約時報》更新條款禁止使用其內容訓練人工智能模型

2023-08-17

據來訓練其各種人工智能服務，如Bard或Cloud AI。為OpenAI ChatGPT等人工智能服務提供“動力”的許多大型語言模型都是在龐大的數據集上訓練出來的，而這些數據集可能包含未經原創作者許可從網絡上搜刮來的受版權保護或其他保

熱門推薦