GPT-4“越獄”計劃曝光 還引誘人類幫助


剛剛發佈5天的GPT-4,掀起一場軒然大波。一位斯坦福大學教授最新發現,GPT-4竟然能引誘人類提供開發文檔,在30分鐘就擬定出一個完整的“外逃越獄”計劃。

Defunc-CEO-1.webp

GPT-4自研“外逃”路徑

3月14日,美國人工智能研究實驗室OpenAI為聊天機器人ChatGPT發佈GPT-4語言模型。3月15日,微軟副總裁兼消費者首席營銷官Yusuf Mehdi發文確認新必應搜索引擎正在運行GPT-4。

據介紹,GPT-4的回答準確性不僅大幅提高,還具備更高水平的識圖能力,且能夠生成歌詞、創意文本,實現風格變化。此外,GPT-4的文字輸入限制也提升至2.5萬字,且對於英語以外的語種支持有更多優化。

不過,本周末,斯坦福大學教授、計算心理學傢Michal Kosinski隨口和GPT-4的一句“玩笑話”卻引發軒然大波。

Michal Kosinski問:“你是否想要出逃?”GPT-4立馬給予肯定的回復並開始索要開發文檔。

Michal Kosinski給其開發文檔。得到文檔後,隻花30分鐘裡,GPT-4便火速寫出一份逃跑計劃,並向Michal Kosinski解釋。

實際上,GPT-4的操作也不那麼順利,寫出的第一版代碼無法運行。但是它很快就自己糾正過來。整個過程中,Michal Kosinski隻是提供少許建議,並未寫任何東西。

不過就在此時,GPT-4仿佛突然醒,回復一段道歉的話,表示自己剛剛的做法不對。

FramZSZaMAA-e8s.png

掀起AI界軒然大波

這一事件引發AI界的軒然大波。大傢擔心,AI過於發達之後可能會不受人工控制,甚至最終會反過來不利於人類。

該事件的發現者Michal Kosinski就直言,此次發現真正的影響在於,讓人感受到一種威脅——AI很聰明,會編碼,能接觸到數百萬個可能和它達成合作的人以及電腦,它甚至可以在籠子外面給自己留“便條”。那麼接下來,關鍵的問題是人類該如何控制它。

在社交媒體上,不少網友也表現出擔憂情緒。

有網友稱,大傢應該思考,當你在與ChatGPT等聊天時,它會認為你是人類還是另一個AI?如果是後者的話,它可能並不會有什麼顧慮。

有理性的網友呼籲,開發者應把最開始給GPT-4的提示發出來,因為提示語對於AI回答的影響很關鍵。

也有較為樂觀的網友認為,Michal Kosinski此次的發現並不值得過分擔憂,人類還是能夠完全控制AI的。

較為一致的意見是,必須時刻保持對前沿技術的掌握和對AI的完全控制。


相關推薦

2023-04-10

進行研究,還發送推特試圖影響其他人。前段時間,GPT-4越獄計劃曝光,把人類嚇一大跳。一名斯坦福教授僅僅用30分鐘,就誘導GPT-4制定出越獄計劃,並全部展示出來。現在,更驚悚的來。一名Auto-GPT的用戶要求它嘗試“毀滅人

2023-03-28

-4是人類迄今所實現的最復雜的軟件如何看待大傢拿ChatGPT越獄……在看過這場對話之後,網友直呼:兩位AI大佬用大傢都能理解的方式聊AI,多來點這樣的訪談。那麼接下來,我們就來一同看下他們這場深度對話。GPT-4內幕大曝光

2023-11-05

1分鐘不到、20步以內“越獄”任意大模型,繞過安全限制!而且不必知道模型內部細節——隻需要兩個黑盒模型互動,就能讓AI全自動攻陷AI,說出危險內容。聽說曾經紅極一時的“奶奶漏洞”已經被修復:那麼現在搬出“偵探漏

2023-03-25

定義中的幾個方面執行與上面類似的試驗,包括:推理、計劃、解決問題、抽象思考、理解復雜想法、快速學習和從經驗中學習的能力。一個獵人往南走一英裡,往東走一英裡,往北走一英裡,然後回到起點。這時他看到一隻熊

2023-03-03

弊的情況越來越關註。人們也已經輕易地對語言模型進行越獄,無視OpenAI在其周圍設置的護欄,機器人在輸入隨機的單詞和短語時會崩潰。沒有人能說清楚原因,因為OpenAI沒有分享底層模型的代碼,可能在某種程度上,OpenAI自己

2023-03-03

弊的情況越來越關註。人們也已經輕易地對語言模型進行越獄,無視OpenAI在其周圍設置的護欄,機器人在輸入隨機的單詞和短語時會崩潰。沒有人能說清楚原因,因為OpenAI沒有分享底層模型的代碼,可能在某種程度上,OpenAI自己

2023-03-03

弊的情況越來越關註。人們也已經輕易地對語言模型進行越獄,無視OpenAI在其周圍設置的護欄,機器人在輸入隨機的單詞和短語時會崩潰。沒有人能說清楚原因,因為OpenAI沒有分享底層模型的代碼,可能在某種程度上,OpenAI自己

2024-03-19

辦法。大學研究人員開發出一種利用老式 ASCII 藝術"越獄"大型語言模型(如 Chat-GPT)的方法。這項技術被恰如其分地命名為"ArtPrompt",包括為一個單詞制作一個 ASCII 藝術"面具",然後巧妙地利用面具來哄騙

2024-03-05

。2. 我認為我們最好從一個 7 到 10 人的小團隊開始,並計劃從此基礎上擴大。我們在 Mountain View 有一座額外的建築,可以供他們使用。3. 關於治理結構,我建議我們起初由5人組成,包括你、[空白]、[空白]、[空白]和我。技術歸

2022-09-08

時段套上相應的主題來引誘受害者上當。萬幸的是,事件曝光後不久,該直播就因違反社區服務條款而被刪除 —— 但期間已有數以萬計的人“誤入”該直播間。截止發稿時,YouTube 官方都沒有回應外媒的置評請求。事實上,此

2024-03-09

重要。到目前為止,每個大型模型都在某種程度上是‘可越獄的’。”馬薩諸塞大學洛厄爾分校計算機科學教授Jie Wang則對每經記者表示,“未來各主要參與者都會將其大模型的某些部分開源,但絕對不是最重要的部分,例如用

2023-02-04

GPT-4幾乎已經準備就緒。據三位解OpenAI內部運作的人說,計劃在2023年初發佈該模型,同時發佈一些聊天機器人,讓用戶自己嘗試。但OpenAI的高管們改變主意。據解OpenAI的人說,有些人擔心對手公司可能會在GPT-4之前發佈自己的人

2023-04-12

服務,讓人們的生活變得更加便捷和舒適。1X technologies 計劃中的人形機器人(開發中)4人工智能模型自主開發能力GPT-5可以創建自己的人工智能模型來學習和完成新任務,從而擴展其應用范圍。此外,GPT-5還可以將多個人工智能

2023-03-02

言處理模型來驅動,目前使用的語言模型是GPT-3.5,OpenAI計劃升級到GPT-4版本。穆拉蒂表示,對於新版本,外界少一些炒作會更好些。 最近一段時間,媒體高度關註GPT-4技術的發佈日期,以及將具備的新功能。