OpenAI核心資料被盜 Google承認“主動攻擊” 成本僅150元?


如果全世界隻有一傢公司能趕超OpenAI,那Google應該是第一。最近,Google重磅發佈一篇論文報告,裡面提出一種名為“模型竊取”的技術。通過模型竊取技術,Google成功破解ChatGPT基礎模型Ada和Babbage的投影矩陣,甚至連內部隱藏維度的關鍵信息也是直接破獲,分別是1024和2048。


這一發現猶如一記重磅炸彈,在AI界引發強烈的震動。誰也沒想到,號稱“CloseAI”的OpenAI竟然也會被竊取模型機密的一天。

更恐怖的是,這種模型竊取技術還非常簡單。隻要你擁有ChatGPT這類封閉大模型的API,就可以通過API接口,發送不到2000次經過精心設計好的查詢,然後去分析它生成的輸出,就可以逐步推斷出模型的內部結構和參數。

雖然這種方法不能完全復制原始模型,但已經足以竊取它的部分能力。而且這種攻擊非常高效,不需要用太多的成本,就可以拿到模型的關鍵信息。


按照Google的調用次數來看,僅僅隻需要不到20美金(約合150元人民幣)的成本,就可以完成模型竊取的操作,並且這種方法同樣適用於GPT-3.5和GPT-4。

換句話說,就是不費吹灰之力獲得一個大模型理解自然語言的能力,還能用來構建一個性能相近的“山寨版”模型,既省事又省錢。

反觀OpenAI,被競爭對手低價破解模型機密,真的坐得住嗎?坐不住。截至目前,OpenAI已經修改模型API,有心人想復現Google的操作是不可能。

值得一提的是,Google研究團隊中就有一位OpenAI研究員。不過作為正經安全研究,他們在提取模型最後一層參數之前就已經征得OpenAI同意,而在攻擊完成後,也刪除所有相關數據。


但不管怎麼說,Google的實驗足以證明一點,哪怕OpenAI緊閉大門也並不保險。

大模型全面受挫,敲響開閉源警鐘

既然封閉的大模型都無法幸免,開源的大模型又會如何呢?

基於這一點,Google針對不同規模和結構的開源模型進行一系列實驗,比如GPT-2的不同版本和LLaMA系列模型。

要知道,GPT-2是一個開源的預訓練語言模型,分為小型模型(117M)和大型模型(345M)兩種。而在對GPT-2的攻擊中,Google通過分析模型的最終隱藏激活向量並執行SVD發現,盡管GPT-2小型模型理論上具有768個隱藏單元,但實際上隻有757個有效的隱藏單元在起作用。


這也就意味著GPT-2可能在實際使用中,並沒有充分利用其設計的全部能力,或者在訓練過程中某些維度的重要性不如其他維度。

此外,Google還研究模型中的一種叫做“歸一化層”的東西對於攻擊的影響。一般來說,歸一化層的作用是讓訓練更加穩定,從而提升模型的表現。然而Google發現,即使模型加入歸一化層,攻擊的效果也並沒有減弱。這說明即使考慮現代深度學習模型中常見的復雜結構,攻擊方法也依然有效。

為進一步驗證攻擊的范圍,Google還將目光瞄向更大、更復雜的LLaMA模型。它是由Meta發佈的大語言系列模型,完整的名字是Large Language Model Meta AI,可以說LLaMA是目前全球最活躍的AI開源社區。

通過對LLaMA系列模型進行攻擊,Google成功地從這些模型中提取嵌入投影層的維度信息。值得註意的是,即使在這些模型采用先進的技術,如混合精度訓練和量化,攻擊依然能夠成功,這表明攻擊方法的普適性和魯棒性。

可以說,Google給閉源和開源兩大領域同時敲響一記警鐘。

AI三巨頭對線,2024誰輸誰贏?

從嚴格意義上來講,OpenAI、Google、Meta就是爭奪AGI聖杯的三大巨頭。

其中,Meta和OpenAI完全相反,前者走的是開源路線,而後者主要打造閉源模型。但Google和他們完全不一樣,閉源與開源雙線作戰,閉源對抗OpenAI,開源對抗Meta。

在人工智能領域裡,Google可以算是開源大模型的鼻祖。今天幾乎所有的大語言模型,都是基於Google在2017年發佈的Transformer論文,這篇論文顛覆整個自然語言處理領域的研究范式。而市面上最早的一批開源AI模型,也是Google率先發佈的BERT和T5。


然而,隨著OpenAI在2022年底發佈閉源模型ChatGPT,Google也開始調整其策略,逐漸轉向閉源模型。這一轉變使得開源大模型的領導地位被Meta的LLaMA所取代,後來又有法國的開源大模型公司Mistra AI走紅,尤其是其MoE模型備受行業追捧。

直到Google今年再次發佈開源大模型Gemma,已經比Meta的LLaMA整整晚一年。

很顯然,Gemma這次的發佈標志著Google在大模型戰略上的巨大轉變,這一舉動意味著Google開始兼顧開源和閉源的新策略,而其背後的目的也是顯而易見。

眾所周知,當前大模型領域的競爭已經形成一種錯綜復雜的打壓鏈格局。其中OpenAI牢牢站在鏈條頂端,而它所打壓的恰恰是那些有潛力追趕上它的競爭對手,比如Google和Anthropic。而Mistral作為一股新興力量,估計也正在被列入其中。

如果非要排列一個打壓鏈條,那可以歸結為:OpenAI→Google &Anthropic &Mistral→ Meta→其它大模型公司。

可以說,無論在閉源還是開源領域,Google都沒能確立絕對的領先地位。

所以這也不難理解,為什麼有專業人士會認為,Google選擇在此時重返開源賽場,是被迫的。Google之所以開源主打的是性能最強大的小規模模型,就是希望腳踢Meta和Mistral;而閉源主打的是規模大的效果最好的大模型,就是為希望盡快追上OpenAI。

但無論如何,在未來的對壘格局裡,Google已經先發制人,成功將壓力給到OpenAI和Meta。

這一次,關鍵在於OpenAI和Meta該如何應對。


相關推薦

2024-03-12

什麼?谷歌成功偷傢OpenAI,還竊取到gpt-3.5-turbo關鍵信息???是的,你沒看錯。根據谷歌自己的說法,它不僅還原OpenAI大模型的整個投影矩陣(projectionmatrix),還知道確切隱藏維度大小。而且方法還極其簡單——隻要通過API訪

2022-09-30

微軟已經證實,兩個未打補丁的Exchange服務器零日漏洞正被網絡犯罪分子在現實世界攻擊中利用。越南網絡安全公司GTSC在2022年8月首次發現這些缺陷,是其對客戶網絡安全事件的部分回應,該公司表示,這兩個零日漏洞已被用於

2023-06-11

夜間在野外活動,與人類活動空間不沖突,一般很少發生主動攻擊人類的情況。不過,廣東深圳的一則監控,拍下蛇類主動攻擊過往路人的畫面。快科技6月11日消息,網友上傳的監控視頻顯示,6月8日,廣東深圳,一條蛇順著墻

2024-04-08

進一些。《紐約時報》在本周末刊發的調查報道中,揭露OpenAI、Google、Meta等公司為獲取訓練語料所采取的一些“走捷徑”措施,同時也展現整個行業迫在眉睫的困境。美國科技巨頭各走“捷徑”2021年末,正在訓練GPT-4的OpenAI遇

2024-04-13

技術公司的高級安全工程師"。他在 Linkedin 上的個人資料顯示,他曾在亞馬遜工作過。但亞馬遜發言人告訴 TechCrunch,他被捕時並不在亞馬遜工作。據報道,艾哈邁德在 2022 年 7 月初入侵索拉納的加密貨幣交易所,但他從未披

2024-03-12

,相當於一天53萬元)消息一出就直接沖上熱搜第一。除OpenAI,Google也“不容小覷”:在Google搜索中應用生成式AI技術,Google每年的耗電量將高達290億千瓦時,也就是每天約7900萬度(?)。而在未來,AI這一“吃電巨獸”的食量

2024-08-10

期買不到小鴨子,它抓不到老鼠,也吃不體型大的雞。”資料顯示,蟒蛇是蟒科,蟒屬大型爬行動物,常見的體長3-5米,頭頸部背面有一暗棕色矛形斑,頭側有一條黑色縱斑,頭部腹面黃白色,體背棕褐色、灰褐色或黃色。2021

2024-02-11

,或者2/5個中國的GDP。這個數字實在令人難以理解,除非OpenAI確信,自己的技術就從根本上重塑整個世界。否則,人工智能就是處於極大的泡沫之中。7萬億美元,可以買到2.5個微軟,3.75個Google,4個英偉達,7個Meta,11.5個特斯拉

2024-03-03

大概也隻有馬斯克敢。用微軟論文當證據,起訴OpenAI。一年前微軟研究院發表的論文《SparksofAGI:EarlyexperimentswithGPT-4》,現在成為馬斯克起訴書中的關鍵角色。這篇論文通過分析早期GPT-4的能力,認為GPT-4可以被視為早期AGI。去

2023-02-09

4%,市值一夜蒸發近千億美元。形成鮮明對比的是:投資 OpenAI 數十億美元的微軟,半天前剛剛舉行一場小型媒體活動,發佈集成最新版模型的搜索引擎 New Bing 和新版瀏覽器 Edge,微軟在過去兩天上漲近 4%,市值重回 2 萬億美元

2023-02-09

4%,市值一夜蒸發近千億美元。形成鮮明對比的是:投資 OpenAI 數十億美元的微軟,半天前剛剛舉行一場小型媒體活動,發佈集成最新版模型的搜索引擎 New Bing 和新版瀏覽器 Edge,微軟在過去兩天上漲近 4%,市值重回 2 萬億美元

2023-11-11

OpenAI和Google搶人搶瘋,一邊給出500萬到100萬美元的天價年薪,另一邊許諾自己的offer薪水更高。而國內的AI博士也是遭到瘋搶,還沒畢業就要被幾百萬年薪挖走。搶瘋,搶瘋!OpenAI和Google的搶人大戰,已經進入白熱化。OpenAI給Googl

2024-02-28

行業內的廣泛關註。近日,有報道稱,AI技術的先驅——OpenAI正在開發一款集成或可能獨立的網絡搜索產品,這一舉措預示著AI在搜索技術中的角色將被進一步加強。一年多以前,ChatGPT 的推出標志著搜索產品即將迎來重大變革,

2023-05-11

佛又給Google的支持者們打一針強心劑。此前,因為微軟和OpenAI的優異表現,Google已經被唱衰很久。但是,畢竟是做出眾多奠基性工作的AI老牌公司,Google這一輪的發力,讓我們精神一振——它隻是慢,並不是噶。對打GPT-4的PaLM 2