微軟向公眾發佈內部生成式AI紅隊工具


盡管生成式人工智能(GenAI)模型具有先進的功能,但我們也看到過許多模型失控、產生幻覺或被惡意行為者利用的漏洞。為幫助緩解這一問題,微軟推出一款工具,可以幫助識別生成式人工智能系統中的風險。

Picture1-1.jpg

本周四,微軟發佈用於生成式人工智能的 Python 風險識別工具包(PyRIT),微軟的人工智能紅隊一直在使用該工具檢查包括Copilot 在內的基因人工智能系統的風險。

博文稱,在過去的一年中,微軟與 60 多個高價值的基因人工智能系統進行紅組,從中解到這些系統的紅組過程與經典人工智能或傳統軟件有很大不同。

這一過程看起來有所不同,因為微軟除要考慮通常的安全風險外,還要考慮負責任的人工智能風險,例如確保不會故意生成有害內容,或確保模型不會輸出虛假信息。

screenshot-2024-02-22-at-11-02-50am.webp

此外,基因人工智能模型的架構千差萬別,同樣的輸入可能產生不同的結果,因此很難找到一個適合所有模型的簡化流程。

因此,手動探測所有這些不同的風險最終會成為一個耗時、乏味和緩慢的過程。微軟分享說,自動化可以幫助紅色團隊識別需要更多關註的風險領域,並將常規任務自動化,這正是 PyRIT 的用武之地。

Picture3-2.webp

該工具包"經過微軟人工智能團隊的實戰檢驗",它向生成式人工智能系統發送惡意提示,一旦收到回應,其評分代理就會給系統打分,然後根據之前的評分反饋發送新的提示。

微軟表示,PyRIT 的最大優勢在於它幫助微軟紅人團隊提高工作效率,大大縮短任務所需的時間。

微軟在新聞稿中說:"例如,在我們對 Copilot 系統進行的一次紅隊演習中,我們能夠選擇一個危害類別,生成幾千個惡意提示,並使用 PyRIT 的評分引擎來評估 Copilot 系統的輸出,這一切隻需要幾個小時而不是幾周的時間。"

該工具包即日起可供訪問,其中包括一系列演示,幫助用戶熟悉該工具:

https://www.microsoft.com/en-us/security/blog/2024/02/22/announcing-microsofts-open-automation-framework-to-red-team-generative-ai-systems/

微軟還將舉辦一場關於 PyRIT的網絡研討會,演示如何在紅隊生成式人工智能系統中使用 PyRIT。


相關推薦

2023-01-29

1月29日消息,谷歌、Facebook和微軟幫助構建人工智能的框架,但規模較小的初創公司正在將其推向大眾,這迫使科技巨頭們加快AI開發速度。據消息人士透露,由於圍繞ChatGPT的關註激增,Meta和谷歌內部壓力也在增大,甚至可能為

2024-05-02

在向公眾發佈之前對其進行廣泛的紅隊測試。一些公司如微軟已經創建一些工具,幫助人工智能項目更容易地添加安全防護措施。《人工智能安全法案》在提交給更大范圍的參議院審議之前,必須經過一個委員會的審議。

2024-03-14

新文本轉視頻工具Sora,這款產品預計將於今年晚些時候向公眾發佈,同時還會添加語音功能;此外在發佈前,團隊將對其進行優化,以降低計算資源消耗。以下為翻譯全文:某個清晨醒來時,你是否曾幻想過一頭公牛在精致的

2023-02-25

不及,並在矽谷引發一場激烈的軍備競賽。短短幾周內,微軟和Google已改變整個企業戰略,為的就是搶占最新人工智能帶來的先機。微軟給OpenAI投資數十億美元,並宣佈將生成式AI整合到其Office軟件和搜索引擎必應中。作為回應

2024-03-20

選的外部人員會以各種方式對該工具進行挑戰,以便在其向公眾發佈之前發現問題。知情人士指出,目前還沒有GPT-5完成安全測試的具體時間表,所以該模型的發佈日期可能會因為這一過程而推遲。GPT-4退化一年前,OpenAI針對ChatG

2024-02-23

工具的輸入和輸出數據的所有權表示擔憂,特別是考慮到微軟對OpenAI的重大投資。 亞馬遜在最近的一封電子郵件中警告員工:“雖然我們可能會發現自己在使用生成式AI工具,尤其是當它似乎讓生活更輕松的時候,但我們應該確

2023-02-01

或演示文稿,抑或為Meet用戶提供視頻聊天摘要。OpenAI與微軟合作直到最近,OpenAI和谷歌之間的競爭看起來還像是大衛與巨人歌利亞的戰鬥:一個靈活的小公司用新穎的顛覆性技術威脅著長期存在的科技巨頭。OpenAI可能已經決定

2023-04-14

這一令人擔憂的發現使得OpenAI能夠確保在上個月更廣泛地向公眾發佈GPT-4時,不會出現上述危險結果。紅隊演練紅隊演練旨在解決人們對於在社會中部署強大AI系統所產生危險的普遍擔憂。該團隊的工作是提出探索性或危險的問

2023-03-24

口,甚至卷到中國互聯網創投圈。另一方面,互聯網巨頭微軟不斷加碼戰略投資OpenAI,將其牢牢綁在自己的Azure雲平臺上,在ChatGPT大火之後順勢接入自己的辦公組件以及必應搜索,將AI定為自己產品的核心競爭力,又一次向占據

2023-02-07

些AI功能。更多重頭戲還在後頭!2月8日,也就是明天,微軟與Google分別將舉辦重大新聞活動,宣佈關於AI的最新進展。北京時間2月8日凌晨,微軟將介紹把AI融入其全線產品的進展,微軟CEO納德拉和OpenAI CEO Sam Altman均會出席。Sam A

2023-01-22

紅,任何人都可以用它們來生成文本或藝術圖像。現在,微軟正在AI領域押下重註,這可能有助於ChatGPT等聊天機器人更快普及。多年來,微軟始終在AI競賽中追趕谷歌,這傢軟件巨頭希望通過對OpenAI的大筆投資,實現跨步前進。O

2023-07-20

架將用於打造可與OpenAI旗下人工智能聊天機器人ChatGPT和微軟必應相媲美的大語言模型(LLM)。據報道,Ajax是去年基於谷歌Jax開源技術創建的,並在谷歌雲上運行,目的是“統一蘋果的各種機器學習開發計劃”,而Apple GPT似乎是

2023-01-24

機器人將如何改變我們的日常生活。美國當地時間周一,微軟宣佈將向ChatGPT的開發商投資數十億美元,而谷歌則在發佈“紅色代碼”以應對ChatGPT的增長後,宣佈計劃將AI聊天機器人功能整合到谷歌搜索中。阿達尼將ChatGPT的變革

2024-02-14

偽造圖片充斥互聯網。一些報道稱,這些圖片是有人使用微軟Designer制作的。微軟官方表示沒有看到這方面的證據,但補充說已經對產品設計進行修改,"以加強我們的文本過濾提示,並解決濫用我們服務的問題&qu