美情報界希望開發出可揭示匿名作者身份的AI

2022-09-29 發表於業界精選

外媒報道稱，美國情報界已經啟動一項AI開發計劃，希望能夠有效地推斷出匿名寫手的身份、或通過巧妙改變文字來偽裝其身份。美國國傢情報局局長辦公室ODNI表示，在情報高級研究項目活動（IARPA）基礎結構上使用的“人類可解文本歸因”（HIATUS）計劃，旨在構建可執行“語言指紋識別”的軟件。

IARPA 在一份 PDF 文檔中指出：“每一天，人類和機器都會生成大量的文本內容，而其中就包含可揭示作者身份的語言特征”。

ONDI 表示，有正確的模型，IARPA 相信它能夠識別不同樣本中的作者風格一致性。
當然這項技術也能夠通過修飾語言模式，使之以新手能夠解釋的方式來完成相關工作，但 HIATUS AI 必須是與語言無關的。

HIATUS 項目經理 Timothy Mckinnon 博士稱：

我們很有希望達成這一目標，為情報界提供急需的能力，並借助計算語言學和深度學習的最新進步，大幅擴展我們對人類語言演變的理解。

為開發強大的模型，HIATUS 將著重於對抗性 AI 研究 —— 作者與匿名文本，與問題是一體兩面。

IARPA 認為，歸因系統的評估，主要根據統一作者在大型收藏中匹配項目的能力。
而隱私系統的評估，則是根據阻止歸因系統的能力。
此外該機構表示，其計劃為 HIATUS AI 制定可解釋性的標準。

Timothy Mckinnon 補充道，HIATUS 正在從事的部分工作，是試圖揭開圍繞神經語言模型的某些未知因素。

他表示這些模型的運作良好，但其本質上仍是一個黑匣子，開發人員並不知曉它們是如何做出具體判斷的的。

理想情況下，系統會在我們執行時切實理解為何要這麼做，並且能夠驗證其沒有接收到虛假的東西、及其正在做哪些正確的事情。
若順利走到這一步，從打擊境外影響活動、到識別反情報風險，HIATUS 都有可能產生深遠的影響。
此外 HIATUS AI 能夠識別文本是否由機器生成、而不是真人創作出來的。

最後，在 IARPA 完成的研究中，約有 70% 會交給其它政府合作夥伴去實施 —— 前者隻負責技術的開發，而不會參與到具體的實施。

目前 HIATUS 研究項目已經開拔，但鑒於距離實驗結束還有 42 個月（三年半）的時間，所以不要指望這項技術會很快以完整形態出現。

相關推薦