微軟的新安全系統可捕捉客戶人工智能應用程序中的幻覺


微軟負責人工智能的首席產品官莎拉-伯德(SarahBird)表示,她的團隊設計幾項新的安全功能,對於那些沒有雇傭紅隊來測試他們構建的人工智能服務的Azure客戶來說,這些功能將非常容易使用。微軟表示,這些由LLM驅動的工具可以檢測潛在漏洞,監控"可信但不支持"的幻覺,並為使用托管在平臺上的任何模型的AzureAI客戶實時阻止惡意提示。

"我們知道客戶並不都精通提示註入攻擊或仇恨內容,因此評估系統會生成模擬這些類型攻擊所需的提示。然後,客戶可以獲得評分並看到結果,"她說。

這有助於避免人工智能生成器因不良或意外反應而引發的爭議,比如最近出現的明顯偽造名人(微軟的 Designer 圖像生成器)、歷史上不準確的圖像(Google Gemini)或馬裡奧駕駛飛機撞向雙子塔(Bing)等事件。

三項功能:提示屏蔽(Prompt Shields)可阻止提示註入或來自外部文檔的惡意提示,這些提示會指示模型違背其訓練;基礎檢測(Groundedness Detection)可發現並阻止幻覺;安全評估(Safety evaluations)可評估模型的漏洞。用於引導模型實現安全輸出和跟蹤提示以標記潛在問題用戶的其他兩項功能即將推出。

無論是用戶輸入的提示信息,還是模型正在處理的第三方數據,監控系統都會對其進行評估,看是否會觸發任何禁用詞或有隱藏提示,然後再決定是否將其發送給模型回答。之後,系統會查看模型的回答,並檢查模型是否幻覺文件或提示中沒有的信息。

videoframe_77964.jpeg

在Google Gemini圖片的案例中,為減少偏見而制作的過濾器產生意想不到的效果,微軟表示,在這一領域,其 Azure AI 工具將允許更多的定制控制。伯德承認,有人擔心微軟和其他公司可能會決定什麼適合或不適合人工智能模型,因此她的團隊為Azure客戶添加一種方法,可以切換過濾模型看到並阻止的仇恨言論或暴力。

未來,Azure 用戶還可以獲得試圖觸發不安全輸出的用戶報告。伯德說,這可以讓系統管理員找出哪些用戶是自己的紅隊成員,哪些可能是懷有更多惡意的人。

伯德說,這些安全功能會立即"附加"到 GPT-4 和其他流行的模型(如 Llama 2)上。 不過,由於 Azure 的模型花園包含許多人工智能模型,使用較小、較少使用的開源系統的用戶可能需要手動將安全功能指向這些模型。

微軟一直在利用人工智能來加強其軟件的安全性,尤其是隨著越來越多的客戶開始對使用 Azure 訪問人工智能模型感興趣。該公司還努力擴大其提供的強大人工智能模型的數量,最近與法國人工智能公司 Mistral 簽訂獨傢協議,在 Azure 上提供 Mistral Large 模型。


相關推薦

2023-11-17

微軟剛剛宣佈計劃對Windows1123H2和Windows1022H2進行一些修改,以便這兩個版本都能符合歐盟的《數字市場法案》(DigitalMarketAct)。微軟在一篇博文中稱,這些更改將被納入WindowsInsiderProgramReleasePreview頻道中即將發佈的Windows1123H2版本

2024-04-18

個人數據,這些弱點都會給LLM提供商和用戶帶來風險。在人工智能安全公司DeepKeep 最近進行的第三方評估中,Meta 的Llama LLM表現不佳。研究人員在 13 個風險評估類別中對該模型進行測試,但它隻通過 4 個類別。其表現的嚴重程度

2023-04-14

的幻覺是指對環境中實際不存在的東西的感知;類似地,人工智能的“幻覺”,指的是 AI 生成的文本中的錯誤,這些錯誤在語義或句法上是合理的,但實際上是不正確或無意義的。AI 的“幻覺”是普遍存在的,可以發生在各種

2024-03-11

常在構建時的目的就是讓用戶沉迷其中。“我們希望利用人工智能來做完全相反的事情——讓人類成為技術的中心。你不去應用程序,應用程序來找你。我們想把權力交還給人們。”樂聖說。德國電信和 Brain.ai 預計,十年後,

2022-10-12

體帖子、邀請函、數字明信片,它將由OpenAI的DALL.E 2提供人工智能繪圖支持。除此之外,基本上,該公司說Designer就像是一個人工智能加強版的PowerPoint,由AI完成大部分繁重的工作。在它的幫助下,用戶可以期待超過80億種AI生成

2023-05-11

會,仿佛又給Google的支持者們打一針強心劑。此前,因為微軟和OpenAI的優異表現,Google已經被唱衰很久。但是,畢竟是做出眾多奠基性工作的AI老牌公司,Google這一輪的發力,讓我們精神一振——它隻是慢,並不是噶。對打GPT-4

2023-02-28

微軟今天發佈Windows11的一個大更新,將該公司新的人工智能驅動的必應搜索添加到任務欄。新的Windows11更新將提供對新的必應聊天功能的快速訪問,以及一堆新功能。Windows11還對小工具進行改進,有更好的觸摸模式,有屏幕錄制

2023-03-16

微軟今天晚些時候將舉行一次大型人工智能活動,但其中一組內容似乎剛剛泄露。Twitter用戶h0x0d公佈PowerPointCopilot功能的細節,該功能似乎包括類似ChatGPT的人工智能,將為用戶創建演示文稿。Copilot出現在在線版PowerPoint的一個側

2022-10-11

;quot;的節目中,下一個登場的是WindowsHello認證系統。根據微軟的最新公告,用戶在使用WindowsHello登錄時可能會遇到問題,如人臉識別、指紋或普通PIN碼驗證過程中。微軟表示,這個錯誤影響到在安裝Windows 11 2022更新(或22H2)之

2023-02-11

據報道,十多年前三位人工智能研究人員取得的一項突破,永久性地改變人工智能領域。他們創造一個名為“AlexNet”的卷積神經網絡系統,並采用120萬張網絡圖片來訓練這個系統。最終,該系統成功地識別諸如貨櫃船、美洲豹

2024-02-14

AI領域,但Copilot似乎反響平平。據媒體報道,微軟旗下的人工智能助手Copilot已經進入試用階段六個多月,試用者評價稱:有用,但不盡如人意。報道援引觀點稱,集成Copilot服務的Excel、PowerPoint軟件存在一些缺陷並十分容易出錯

2022-11-10

微軟已經讓IE瀏覽器退役,現在這個軟件巨頭正在為這個經典瀏覽器消亡的下一步做準備。該公司已經發出新的警告,InternetExplorer將在明年2月被徹底關閉,因此再次建議用戶放棄該瀏覽器,轉而使用現代的替代品。毫無疑問,

2023-11-13

音重的人更容易聽懂。當然挑戰不止於這些,還有成本、人工智能幻覺、數據隱私等等,都是需要考慮的問題。但不論如何,眼下AI Agent漸行漸近,在接下來的幾年內,其有望徹底改變我們的生活方式,包括網絡世界與現實生活

2023-11-16

在雲計算基礎設施、 模型即服務 MaaS 、數據平臺、Copilot 人工智能助手等方方面面的新產品和新功能。薩提亞展示 Azure Cobalt CPU 芯片|Microsoft其中,既有 Azure Cobalt、Azure Maia 這樣專門為 AI 打造的 ARM 架構 CPU 和 AI 加速芯片,也有