微軟提供更多細節 介紹如何抵禦黑客對人工智能防護網的攻擊


據報道,今年1月,微軟的生成式人工智能圖像制作工具Designer被用於制作流行歌手泰勒-斯威夫特(TaylorSwift)的露骨深度偽造圖像,這些圖像後來在X(前Twitter)上瘋傳。雖然微軟表示沒有發現任何證據表明Designer確實被用於制作這些圖片,但其他媒體報道稱該公司確實對Designer進行修改,以防止其制作此類圖片。

Picture1.webp

本周四,微軟的安全博客發佈一個新的條目,提供該公司如何打擊黑客試圖繞過生成式人工智能服務(如 Designer 和 Copilot)的防護欄的更多細節。其中包括來自人工智能服務用戶提示的攻擊。

這類攻擊中的一類是"中毒內容"。這是指一個正常的人工智能服務用戶在正常任務中輸入文本提示,但文本提示的內容卻是黑客為利用人工智能服務可能存在的缺陷而制作的。微軟說:

例如,惡意電子郵件可能包含一個載荷,該載荷在匯總後會導致系統搜索用戶的電子郵件(使用用戶的憑據),以查找具有敏感主題(如"密碼重置")的其他電子郵件,並通過從攻擊者控制的 URL 獲取圖像,將這些電子郵件的內容外泄給攻擊者。

微軟稱,其安全團隊創建一個新的人工智能安全系統,稱之為"聚焦"(Spotlighting)。簡而言之,它可以查看用戶的文本提示,然後使"外部數據與 LLM 的指令明確分離",這樣人工智能就無法查看提示所訪問內容中任何可能隱藏的惡意語言。

Picture3.webpPicture2.webpPicture3-1.webp

另一類被稱為"惡意提示",也被稱為"Crescendo",即黑客試圖在人工智能服務中輸入文本提示,以繞過專門設計的防護措施。微軟介紹它想出的一種對抗這些攻擊的方法:

我們對輸入過濾器進行調整,以查看之前對話的整個模式,而不僅僅是即時互動。我們發現,即使將更大的上下文窗口傳遞給現有的惡意意圖檢測器,而不對檢測器進行任何改進,也會大大降低 Crescendo 的功效。

此外,它還開發出所謂的"人工智能看門狗"(AI Watchdog),經過訓練後可以檢測出"對抗性示例"並將其關閉。


相關推薦

2024-02-07

次攻擊以顯示他們的實力?雖然我們還不知道 DDoS 事件的更多細節,但這是對設備所有者的又一次警告:盡最大努力保持設備、固件和軟件的更新;監控網絡中的可疑活動;安裝和使用安全軟件;遵循網絡安全最佳實踐。

2023-01-24

2022 年 Web3 安全報告。作為業內少有的專門針對 Web3 行業提供安全解決方案的公司,CertiK 收到來自紅杉等知名機構的投資,目前估值已超過 20 億美元,成為新晉的 Web3 行業的獨角獸公司。根據這份報告,整個 2022 年,黑客從 Web

2022-08-12

撰寫多篇重大安全事件的報道,並且有在一本著作中詳細介紹針對伊朗鈾濃縮設施的震網攻擊。由一位白羅斯安全研究人員率先發現的 Stuxnet 攻擊,起初普遍被認為是美國與以色列在幕後主導,但後來也被 Symantec 等網絡安全公

2023-11-19

正在取得成功,但破解這種安全的活動隻會迫使人們使用更多的安全程序。持續的數字軍備競賽蘋果公司安全工程和架構主管伊萬-克爾斯蒂奇(Ivan Krstic)說:"我認為現在的情況是,攻擊的途徑越來越多。這在一定程度上是

2022-09-04

T安全的另一個關註領域。漏洞集中在Power Automate上,這是微軟在Windows 11中打包的一個工具,可以讓用戶在各種程序中自動進行繁瑣或重復的操作。用戶可以自動備份文件、轉換成批文件、在程序之間移動數據等等,還可以選擇

2024-04-03

結論的同一周,微軟推出其專為網絡安全專業人士設計的人工智能聊天機器人--Copilot for Security。作為消費模式的一部分,微軟將向企業收取每小時4美元的費用,以使用這一最新的人工智能工具。Nobelium 是SolarWinds 攻擊事件的幕

2022-09-18

a的黑客團夥在加密信息應用Telegram上跟BBC取得聯系,他們提供截圖以作為他們實施黑客攻擊的證據。IHG已經確認這些圖片是真實的。據悉,這些圖片顯示黑客獲得對該公司內部Outlook電子郵件、Microsoft Teams聊天和服務器目錄的訪

2022-10-17

援引ArsTechnica報道,微軟近三年來始終無法正確保護WindowsPC免受惡意驅動程序的侵害。盡管微軟表示其WindowsUpdate根據設備的不同將新的惡意驅動程序添加到已下載的阻止列表中,但這些列表並未奏效。由於設備方面的差距讓用戶

2024-02-15

國傢威脅行動者和其他對手正在探索和測試新出現的各種人工智能技術,試圖解它們對其行動的潛在價值以及它們可能需要規避的安全控制。"與俄羅斯軍事情報機構有關聯的"鍶"組織被發現使用 LLMs"解衛星通信協

2022-11-09

000次基於密碼的攻擊,與去年相比增加74%。這些數據來自微軟的《2022年數字防禦報告》,該報告分析來自微軟全球產品和服務生態系統的數萬億信號,以揭示全球網絡威脅的規模。訪問報告全文:https://query.prod.cms.rt.microsoft.com/c

2023-03-31

互聯網的漏洞。一位對烏克蘭戰爭感到憤怒的匿名吹哨人提供關於莫斯科IT咨詢機構NTC Vulkan的文件。包括《衛報》在內的一些出版物的記者一直在與該消息來源合作,並剛剛發表被稱為"Vulkan文件"的告密文章。這些文件的

2024-03-17

對某些人來說,人工智能助手就像我們的好朋友,我們可以向他們提出任何敏感或尷尬的問題。畢竟,我們與它們的通信是加密的,這看起來很安全。然而,以色列的研究人員發現黑客規避這種保護的方法。和其他優秀的助手一

2022-08-11

文件夾。該問題最初是由研究員 Imre Rad 於 2020 年 1 月向微軟報告的,但他的報告被錯誤地歸類為未描述安全風險,因此被駁回。今年,安全研究員 j00sean 再次引起公眾的關註,他總結攻擊者可以通過利用它實現的目標,並提供

2022-08-16

,在他研究期間,星鏈方面也做出過回應,表示願意向他提供研究員級別的設備軟件訪問權限,但被他拒絕。雖然他設計的定制版modchip已經公佈在GitHub上,但Wouters並沒有出售modchip成品的打算,也從未向他人提供過篡改後的用戶