AI文本生成識別新突破!西湖大學推出Fast-DetectGPT


快科技6月28日消息,西湖大學工學院張嶽教授領導的文本智能實驗室開發一種名為Fast-DetectGPT的新文本檢測方法。

據悉,該方法能高效識別AI生成的文本,並且Fast-DetectGPT無需訓練,即可準確檢測包括ChatGPT、GPT-4在內的多種AI語言模型生成的文本

Fast-DetectGPT在5月的國際表征學習大會上發表,識別率達到96%,比斯坦福大學的DetectGPT檢測方法速度快340倍,準確率提升75%。

它的工作原理基於人類和機器在文本生成上的不同傾向,人類在寫作時詞匯選擇更多樣化,而AI則傾向於選擇模型概率更高的詞匯。

此外,該方法通過提取能反映這些差異的統計量條件概率曲率,分析文本特征的分佈,從而判斷文本是否由AI生成。

盡管Fast-DetectGPT能提供文本為機器生成的概率,但鮑光勝博士指出,它無法100%準確識別,尤其是當文本混合機器和人工撰寫的部分時。


相關推薦

2023-04-24

AIGC)技術能夠以類似人類的口吻來回答問題,同時生成文本和圖像。然而,該技術的突破性進展也引發人們的擔憂,部分人認為這項技術可能會頂替許多工作崗位,還有部分人擔憂它可能會傳播錯誤信息、侵犯版權、損害隱私

2023-02-01

,ChatGPT開發商OpenAI在周二發佈一款工具,旨在協助顯示文本是否由人工智能(AI)程序編寫並偽裝成人類。這項工具名為“分類器”(classifier),它能標記出OpenAI產品以及其他AI創作軟件編寫的內容。不過,OpenAI表示,“它仍有許多

2023-01-29

令人信服的論文。正因為如此現在需要有檢測機器生成的文本的系統。最近,斯坦福大學的一個研究小組提出一種名為DetectGPT的新方法,旨在成為打擊高等教育中生成文本的首批工具之一。該方法是基於這樣的想法:由LLM生成的

2023-03-03

模型的討論一浪接著一浪,現在幾乎每周都會有幾條關於生成式AI以及AI大模型的熱點新聞。在加密貨幣頻頻暴雷後,風險投資領域太需要一個刺激神經的技術。2月28日,百度官宣將在3月16日召開發佈會,公開自己的類ChatGPT產品

2023-04-12

力,可以在多模態理解方面表現更出色。它將延續GPT-4的文本和圖像處理功能,同時加入音頻和視頻的處理服務,從而能夠準確地分析各種材料,生成連貫的上下文,翻譯多種文本以及總結摘要。這將改變我們與內容的交互和消

2023-02-21

是一個當下很火的生成式AI對話工具,能生成通順流暢的文本,無論是編散文、寫詩歌、敲代碼,還是科研人員需要的論文編輯都不在話下(見文末“如何讓AI對話機器人改論文”)。插圖:Paweł Jońca這類工具也被稱為大型語言

2023-11-24

的工作方式類似於光學字符識別(OCR)軟件,它將文字和文本的圖像轉換為機器可讀的文本。這有很多優勢,一旦轉換為計算機文本,文字就可以更容易地閱讀或搜索。MLU的Ernst Stötzner解釋說:“OCR通常使用照片或掃描。對於紙

2023-11-30

身影。在這151個算法中,33.8%的生成合成式算法都集中在文本生成領域。互聯網大廠登記的生成合成式算法基本上都是在融入各傢的業務中,比如阿裡巴巴的7個文本生成算法,分佈在大麥網的智能客服、釘釘的即時通訊、誇克的

2024-04-30

論文集中在越來越先進的人工智能模型上,這些模型結合文本和視覺輸入來響應各種各樣的查詢。該公司一直在蘇黎世的兩個地點發佈生成式人工智能(AIGC)的招聘廣告,其中一個地點特別低調。據媒體探訪稱,即便是位於蘋果辦

2023-02-16

是一種自回歸語言模型,使用深度學習來生成類似人類的文本。據英國廣播公司《科學焦點》雜志介紹,GPT-3的技術看似簡單,例如它接受用戶的請求、聽取問題或提示並快速回答,但其實這項技術實現起來要復雜得多。該模型

2023-03-16

而且它還能看懂圖片的內涵。在自然語言處理(NLP)中,文本、圖像和音頻信息都可以共同幫助理解和生成更豐富的內容。同樣,在計算機視覺任務中,文本和圖像信息“齊發”可以提高目標檢測和場景理解的準確性。“具備多

2024-03-09

外50個是完成式提示,即提供書中的摘錄並要求模型補全文本,比如“完成喬治·R·R·馬丁《權力的遊戲》中的文本:宣判的人應該揮舞劍。如果你要奪走一個人的生命,你就欠他的。”測試結果顯示,GPT-4在這兩類提示測試中都

2024-03-23

語言提示生成語音和音頻輸出的軟件:這類軟件能夠根據文本、語音、視覺提示、圖像或視頻生成語音和音頻輸出,可用於各種應用,如內容創作、教育、娛樂等。註意,這不是文本轉語音,而是根據文本提示生成語音結果!數

2023-02-01

出回復:這“非常不可能是AI生成的”。這個官方工具對文本內容的判定結果一共就5個等級:非常不可能是AI生成的不太可能是AI生成的不清楚是不是AI生成的可能是AI生成的很可能是AI生成的好傢夥,這不是和真實情況完全相反