如何保障AI安全?OpenAI詳細解答,將積極與各國政府接觸


4月6日消息,美國當地時間周三,OpenAI發帖,詳細介紹其確保AI安全的方法,包括進行安全評估、改進發佈後的保障措施、保護兒童以及尊重隱私等。該公司表示,確保AI系統的構建、部署和安全使用對實現其使命至關重要。

以下是OpenAI帖子的全文:

OpenAI致力於確保強大的AI安全,讓盡可能多的人受益。我們知道,我們的AI工具為當今人們提供許多幫助。世界各地的用戶向我們反饋,ChatGPT有助於提高他們的工作效率、增強他們的創造力,並提供量身定制的學習體驗。但我們也認識到,與任何技術一樣,這些工具也存在真正的風險。因此,我們正在努力確保在各個系統層面上的安全性。

打造更加安全的人工智能系統

在推出任何新的人工智能系統之前,我們都會進行嚴格的測試,征求外部專傢的意見,並通過人工反饋的強化學習等技術來改善模型的表現。同時,我們還建立廣泛的安全和監控系統。

以我們最新的模型GPT-4為例,完成訓練後,我們在整個公司范圍內進行長達6個月的測試,以確保其在公開發佈之前更加安全可靠。

我們認為,強大的人工智能系統應該接受嚴格的安全評估。監管是必要的,以確保這種做法被廣泛采納。因此,我們積極與各國政府接觸,探討最佳的監管形式。

從實際使用中學習,提高保障措施

我們盡力在系統部署之前預防可預見的風險,但實驗室中的學習永遠有限。我們廣泛研究和測試,但無法預測人們會如何使用我們的技術,或濫用它。因此,我們認為從實際使用中學習,是創建和發佈越來越安全的人工智能系統的關鍵組成部分。

我們謹慎地將新的人工智能系統逐步發佈給人群,並采取實質性的保障措施,並根據我們吸取的教訓不斷改進。

我們提供自己服務和API中最強大的模型,以便開發人員可以直接將技術集成到他們的應用程序中。這使我們能夠監控濫用行為並采取行動,同時制定應對措施。這樣,我們可以采取實際行動,而不僅僅在理論上想象如何應對。

實際使用中的經驗也促使我們制定越來越細化的政策,以應對對人們構成真正風險的行為,同時仍然允許我們的技術以更有益的方式使用。

我們認為,社會需要更多時間適應日益強大的人工智能,每個受其影響的人都應該在人工智能的進一步發展方面擁有發言權。迭代部署有助於不同利益相關者更有效地參與人工智能技術的對話中,而擁有使用這些工具的第一手經驗至關重要。

保護兒童

我們的安全工作關註重點之一是保護兒童。我們要求使用我們的人工智能工具的人必須年滿18歲或以上,或者在父母同意的情況下年滿13歲或以上。目前,我們正在研究驗證功能。

我們不允許我們的技術用於生成仇恨、騷擾、暴力或成人等內容。與GPT-3.5相比,最新的GPT-4對受限制內容請求做出響應的可能性降低82%。我們已經建立強大的系統來監控濫用行為。GPT-4現在可供ChatGPT Plus的訂戶使用,我們希望隨著時間的推移能讓更多人體驗它。

我們已經采取重大措施,最大限度地減少我們的模型產生傷害兒童內容的可能性。例如,當用戶試圖將兒童安全虐待材料上傳到我們的圖像生成工具時,我們會阻止它並向國傢失蹤和受剝削兒童中心報告此事。

除默認的安全防護,我們與非營利組織可汗學院(Khan Academy)等開發機構合作,為他們量身定制安全措施。可汗學院已經開發一款人工智能助手,它可以作為學生的虛擬導師,也可以作為教師的課堂助手。我們還致力於開發允許開發者為模型輸出設置更嚴格標準的功能,以更好地支持需要此類功能的開發者和用戶。

尊重隱私

我們的大型語言模型是在廣泛的文本語料庫上進行訓練的,其中包括公開可用的內容、獲得授權的內容以及由人類審核人員生成的內容。我們不利用這些數據來銷售我們的服務或廣告,也不用它們來建立個人檔案。我們隻是利用這些數據來讓我們的模型更好地為人們提供幫助,例如通過與人們進行更多對話來提高ChatGPT的智能水平。

盡管我們的許多訓練數據中包括可以在公共網絡上獲得的個人信息,但我們希望我們的模型解的是整個世界,而不是個人。因此,我們致力於在可行的情況下從訓練數據集中刪除個人信息,微調模型以拒絕個人信息的查詢請求,並響應個人從我們的系統中刪除其個人信息的請求。這些措施將我們的模型生成包含個人信息的響應的可能性降至最低。

提高事實準確性

現今的大型語言模型,基於之前的模式和用戶輸入的文本,可以預測下一個可能要使用的詞匯。但在某些情況下,下一個最有可能出現的詞匯實際上可能存在事實性錯誤。

提高事實準確性是OpenAI和許多其他AI研究機構關註的重點之一,我們正在取得進展。通過利用被標記為不正確的ChatGPT輸出的用戶反饋作為主要數據來源,我們提高GPT-4的事實準確性。相比於GPT-3.5,GPT-4更可能產生符合事實的內容,提高幅度達到40%。

當用戶註冊使用該工具時,我們努力做到盡可能透明,以避免ChatGPT可能給出錯誤回復。然而,我們已經認識到,要進一步降低誤解的可能性,並教育公眾解這些AI工具目前的局限性,還有很多工作要做。

持續的研究和參與

我們認為,解決AI安全問題的一個切實可行方法是,投入更多的時間和資源來研究有效的緩解和校準技術,並針對現實世界可能被濫用的情況進行測試。

重要的是,我們認為提高AI的安全性和能力應該同時進行。我們迄今為止最好的安全工作來自於與我們最有能力的模型合作,因為它們更擅長遵循用戶的指示,更容易駕馭或“引導”它們。

我們將越來越謹慎地創建和部署能力更強的模型,並將隨著AI系統的發展而繼續加強安全預防措施。

雖然我們等6個多月才部署GPT-4,以更好地解其功能、好處和風險,但有時可能需要更長的時間來提高AI系統的安全性。因此,政策制定者和AI開發商需要確保AI的開發和部署在全球范圍內得到有效監管,這樣就沒有人會為保持領先而采取捷徑。這是一項艱巨的挑戰,需要技術和制度創新,但我們渴望為此做出貢獻。

解決AI安全問題還需要廣泛的辯論、實驗和參與,包括為AI系統的行為設置界限。我們已經並將繼續促進利益相關者之間的合作和開放對話,以創建更安全的AI生態系統。(小小)


相關推薦

2024-02-08

在活動傢和傢長的監督下,OpenAI組建一個新團隊,研究如何防止其人工智能工具被兒童誤用或濫用。OpenAI在其職業頁面上發佈一條新的招聘信息,披露一個兒童安全團隊的存在,該團隊與OpenAI內部的平臺政策、法律和調查小組以

2023-11-03

,將對世界構成生存威脅,各國政府和國際機構必須采取保障和監督措施。目前針對人工智能大模型的發展主要存在兩派觀點:一派是以馬斯克為代表的“風險警示者”,另一派是以Google、Meta等科技巨頭企業為代表的“風險淡

2024-04-03

有利於監管。(3)人工智能應用到軍事,人道主義能否保障2023年5月,美國空軍上校漢密爾頓在5月舉行的未來戰爭空天能力峰會上稱在一次模擬測試中,一架負責執行防空火力壓制(SEAD)任務的無人機,殺死人類操作員。據他稱

2023-10-28

清楚這些倡議以及其他在國傢和國際層面上形成的倡議將如何協同工作,或在其管轄范圍之外實施任何措施。與聯合國的精神相一致的是,這個由38人組成的小組--其中包括來自Alphabet/Google和微軟的高管、至少一位"數字人類

2023-02-15

作為OpenAI創始人,特斯拉CEO埃隆·馬斯克給予聊天機器人ChatGPT很高的評價,但他也對人工智能(AI)潛在的安全問題表達擔憂。2月15日,在世界政府峰會(WGS)開幕式上,針對近期爆火的ChatGPT,馬斯克表達他的顧慮。“人工智能

2023-03-31

全球網絡和媒體,很快引來吳恩達等“AI大牛”的反對。如何看待雙方的爭論?我們一層層分析問題。先說競爭失控問題。據公開信所稱,提出“暫停ChatGPT研發”的提議,直接刺激是對“最近幾個月人工智能實驗室陷入一場失控

2024-04-13

各國領導人、科技大亨和學術界人士齊聚一堂,共同探討如何以最佳方式監管這項快速發展的技術。在為期兩天的活動結束後,超過 25 位政府代表簽署一份聯合聲明,同意各國共同努力,建立共同的監管方法。為跟上技術發展

2023-04-11

提交解決隱私問題的方案。根據松野博一的說法,在評估如何應對數據泄露等可能的問題後,日本將繼續研究引入AI以減輕政府公務員工作量的可能性。負責日本數字化轉型的內閣大臣河野太郎上周五表示,希望AI技術為日本政

2023-04-13

後,意大利數據保護局(Garante)4月12日提出一系列關於如何恢復ChatGPT在該國使用的要求。在Grante發表的一份聲明中,該機構表示,將繼續調查OpenAI可能違法數據保護規則的行為,並要求OpenAI在今年9月底之前推出一個年齡驗證系

2023-04-05

導者比爾·蓋茨也在本周首度發聲,呼籲產業將焦點放在如何更好地利用AI技術發展,而不是搞無法形成全球合力的暫停訓練。作為背景,總部位於波士頓的生命未來研究所(FLI)在上周發表一封公開信,呼籲全世界實驗室暫停

2024-05-28

專註於手機業務的創新與發展。同時,趙明透露,榮耀正積極與各大車企展開合作。榮耀秉持開放的價值主張,計劃將其在手機領域的技術能力賦能給汽車行業。趙明認為,由於大多數車企缺乏手機和終端解決方案,榮耀與車企

2023-03-19

,”他補充說。“我認為,社會隻有有限的時間來弄清楚如何對此做出反應,如何監管,如何處理。”2017 年開學第一天,俄羅斯總統弗拉基米爾·普京 (Vladimir Putin) 告訴俄羅斯學生,無論誰在人工智能競賽中領先,都可能“統

2023-04-14

竊、金融犯罪和網絡攻擊等非法活動方面的潛力,以及它如何危害國傢安全和戰場通信。這支團隊兼顧各個領域的白領專業人士,包含學者、教師、律師、風險分析師和安全研究人員,主要工作地點在美國和歐洲。他們的發現被

2023-09-06

ng信任環、MagicLive智慧引擎、TurboX系統引擎、MagicGuard榮耀安全四大根技術,打造出強大的融合業務中臺,並以此為基礎,向合作夥伴開放覆蓋移動辦公、智能傢居、運動健康、影音娛樂、智慧出行5大場景的22個Kit、32個能力開放