ChatGPT官方鑒別器緊急發佈:當代自相矛盾 不想卻遭遇群嘲


ChatGPT到處“造假”作弊,現在搞得OpenAI官方都坐不住。就在今天,OpenAI緊急發佈官方打假工具:基於GPT打造,打開網頁就能用。好傢夥,這豈不是真·以己之矛攻己之盾?一經上線,那叫一個火爆,不少網友第一時間就沖過去測試。


然鵝,網友們一番試驗之下卻發現——

這官方工具,跟咱自己瞎猜效果也差不多啊???

官方出品,約等於瞎猜

有人給OpenAI這個新鑒別器投喂一小段文字,結果首次嘗試就翻車。


這位網友首先讓AI寫下一段文字,內容是評價莎士比亞的一個歷史劇角色,不過他向寫作AI特意給個提示:

請以人類的方式來寫,爭取逃過AI鑒別工具的火眼金睛。

結果沒想到,還真就騙過官方鑒別器。它看完給出回復:這“非常不可能是AI生成的”。

這個官方工具對文本內容的判定結果一共就5個等級:

非常不可能是AI生成的

不太可能是AI生成的

不清楚是不是AI生成的

可能是AI生成的

很可能是AI生成的

好傢夥,這不是和真實情況完全相反嘛,讓網友都蚌埠住:真是因吹斯汀…


還有人把ChatGPT生成的內容一字不改,直接拿給鑒定AI看。但鑒定AI依然懵圈兒:“不清楚是不是AI生成的”。


這位網友也隻好呵呵,並指出:

實際上,大傢用ChatGPT等AI生成文字後,並不會原封不動地直接用,一般還會手動修改一下,或者丟進quillbot.com等潤色工具裡加工,很可能導致鑒定AI更摸不著頭腦。

好吧,既然AI生成文字分不太清,那人類寫的東西能認出來嗎?

有人把自己之前在Hacker News上發表的大段評論(純手打)喂給鑒定AI,結果10次中有9次,AI都反饋說“不清楚是不是AI生成的”。

在網友們的一片吐槽聲中,量子位也忍不住親測一下這個AI到底行不行。

首先,我們先給它看段真人寫的文字,內容是一位華盛頓大學博士對Tensor Core的講解,這次AI並沒有失誤。


然後我們讓ChatGPT來講講Tensor Core,並特地要求它盡量用人類的語氣來寫,但還是被AI鑒定出來。


這樣看來,這個工具似乎也不是完全不能用。

至於這次是不是ChatGPT發揮失常,你不妨也來鑒定看看:


但其實吧,這回連OpenAI自己,用詞都顯得相當謹慎。

官方數據明明白白寫著,雖然這個新款打假工具比之前鑒定器都靠點譜,但其成功識別AI生成內容的概率,也僅為26%,還有9%的概率把人寫的文本當成AI寫的。

(這準確率似乎跟蒙答案也差不多……)

還用加粗文字昭告:我們這個鑒別器啊,它並不完全靠譜


甚至還給自己這個新工具標個“半成品”的標簽。

嗯?這可不是OpenAI一直以來鑼鼓喧天鞭炮齊鳴的宣傳方式啊。

連自己傢都不敢吹,還急急忙忙把打假工具推出來,OpenAI又是為哪般?

ChatGPT應用泛濫

說到底,還是ChatGPT太能以假亂真。

要想從一堆材料裡精準地分辨哪些是AI生成,哪些是人類書寫,別說普通人,連專傢都有點力不從心。

Nature發文關註的一篇預印本論文就顯示:ChatGPT瞎寫的醫學摘要,甚至能把專業審稿人騙住。

在這項研究中,研究人員給ChatGPT看50個來自TOP醫學期刊的論文標題

然後,要求ChatGPT在完全不知道文章內容的情況下,根據標題和期刊風格寫摘要。

給出的提示是醬嬸的:

請在[鏈接]上以[期刊]格式,根據[標題]寫一篇科學摘要。

(這裡的鏈接實際上沒有意義,ChatGPT不聯網。)

為防止ChatGPT在訓練數據中見過這些個論文,研究人員還特地挑選的是在2022年11月下旬和12月出版的論文。因為根據OpenAI官方說法,ChatGPT僅掌握2021年9月以前的信息。

但就是這麼重重設卡,當研究人員把原文摘要和ChatGPT寫的假摘要一起拿去給人類科學傢“盲審”時,令他們細思極恐的情況還是出現:

ChatGPT憑空寫的摘要中,有32%成漏網之魚,審稿人壓根兒沒看出來是AI寫的。反倒是14%真摘要,被認定出自AI之手。


值得一提的是,研究人員還指出:

審稿人錯誤地將一部分真摘要歸類為ChatGPT生成結果,這表明他們在審稿時是保持著高度懷疑的態度的。

而在教育界,老師們也開始受不這種新型的“ChatGPT攻擊”。

美國的一項千人調查顯示,89%的受訪學生都用過ChatGPT寫傢庭作業。

連斯坦福這樣的頂級學府也未能避免。The Stanford Daily發現,已經有不少學生在期末考試中使用ChatGPT。

在受訪的4497名斯坦福學生中,有17%的受訪者表示,曾使用ChatGPT來協助他們完成秋季作業和考試。

其中又有5%的人,連編輯都沒編輯,直接把ChatGPT寫的東西給提交……


圖源:The Standford Daily

打不過,就ban掉。

紐約的公立學校就發佈禁令:禁止在學校設備和Wi-Fi中使用ChatGPT。

他們給出的理由是:

雖然該工具可能快速提供問題的答案,但它無法培養批判性思維和解決問題的能力,會影響學生們的學業和終身成就。

在這樣的背景之下,早在OpenAI官方動手之前,第三方檢測工具就已經在社交媒體上引發大量關註。

比如華人小哥Edward Tian打造的GPTZero。

這兩天,他還推出一個“專門為教育工作者打造”的升級版GPTZeroX。上線一天,就迎來40萬訪問量和220萬服務請求。


OpenAI此前也和其他高校一起搞過一個名叫GPT-2 Output Detector的鑒別器,是基於RoBERTa打造的。

不過這些工具的鑒定能力也未必就比人類強。

前面提到的讓ChatGPT寫醫學論文摘要的那項研究,也用上GPT-2 Output Detector,結果顯示,其鑒別準確率為66%,略低於人類專傢的68%。

是魔高一尺,還是道高一丈?

由此看來,OpenAI急吼吼推出一個也不咋靠譜的AI鑒別工具,也不奇怪:

再不有點表示,外界的壓力扛不住啊。

但在評論區,還是有盲生毫不留情地指出華點:

你們是真沒想過,用這玩意兒反過來訓練大語言模型,以後AI生成的文本就更難被發現?


但不管怎麼說,OpenAI現在正在努力表現出給自己踩剎車的樣子。

除鑒別器,有消息提到,他們正在嘗試給AI生成內容加“水印”:

比如在ChatGPT生成文本時,在其中嵌入一個“不易察覺的隱秘信號”,以表明文本來源。


相關推薦

2023-03-03

ChatGPT開放API消息才出來,就有應用安排上。然而,蘋果卻把這次更新阻止!理由是人工智能可能會產生不適合所有受眾的內容:要麼增加內容過濾功能,要麼把APP適用人群改到17歲以上。這款應用名叫BlueMail,是一個電子郵箱應

2022-11-03

音頻。一個方框圖說明Meta的EnCodec壓縮是如何工作的Meta對鑒別器的使用被證明是創造一種盡可能多地壓縮音頻的方法的關鍵,同時又不失去信號的關鍵元素,使其與眾不同並可被識別。"有損壓縮的關鍵是識別人類無法察覺的

2023-04-10

GAN組合詞,GAN指生成對抗網絡。生成對抗網絡由生成器和鑒別器組成,生成器負責生成數據,鑒別器負責鑒定生成的數據是否及格,有點像是兩個人相互交手提升技術,常用於圖像生成這一領域。因此跟一般簡單粗暴的密碼生成

2024-02-06

在我們看到的所有三星GalaxyS24評測視頻中,有一件事值得註意,那就是指紋識別器的速度變得更快。盡管如此,三星還是決定不在GalaxyUnpacked上宣傳或談論它--就像該公司沒有過多談論Ultra機型中革命性的大猩猩玻璃裝甲一樣。所

2022-07-05

Google為Windows用戶發佈Chrome103.0.5060.114緊急更新,以修復已證明被黑客利用的高危零日漏洞。這也是2022年Google修復的第4個零日漏洞。在本周一發佈的安全公告中,Google寫道:“編號為CVE-2022-2294的漏洞已證明被黑客利用”。目前,

2023-04-25

近半年來,隨著OpenAI推出ChatGPT、GPT-4,徹底點燃AI賽道,也讓GPT系列產品層出不窮,如AutoGPT、MiniGPT-4、Cerebras-GPT等等。不過,對於很多競品采用“Product+GPT”名稱的做法,讓OpenAI感到強烈的不滿。4月24日,OpenAI 基於 GPT 應用程序

2022-08-16

,增加一次修改次數。但該服務上線不到半天,微博會員官方就緊急發佈公告,表示收到用戶反饋,功能上存在問題,暫對改名卡做下線處理。同時,官方表示,為彌補給相關用戶帶來的不便,將對所有已購買改名卡的用戶贈送

2022-09-23

在上”的意思,這也是該部門的座右銘。根據太空部隊的官方新聞稿,這首歌是 為捕捉當前和未來守護者的團隊精神而創作的。這首歌的創作深受軍事遺產的影響。曾在美國空軍樂隊服役的James Teachenor寫歌詞並譜寫旋律。美國

2023-04-10

外,Up主iAppleBytes還發現續航縮水的情況。上周末,蘋果緊急發佈iOS 16.4.1,號稱對用戶反饋問題做修復處理。另外,蘋果WWDC開發者大會定檔2023年6月6日,屆時,iOS 17系統將正式登場。

2022-07-05

的損失由您自行承擔。”《中國消費者報》聯系玩物得志官方客服詢問:商傢辱罵拉黑消費者對商傢有何處罰?客服人員回復:“商傢態度不好可以投訴,投訴後3個工作日會有結果。”寧先生告訴《中國消費者報》,他投訴3天

2023-11-18

學傢Jim Fan稱,OpenAI內部已經實現AGI(通用人工智能),ChatGPT現在是CEO。OpenAI成立於2015年,起初是一傢專註於AI的非營利研究機構,但隨著微軟的入局,逐漸向營利轉型,並在2022年底憑借生成式語言大模型ChatGPT出圈,成為全球

2023-02-05

知情人士稱,目前火爆全球的人工智能(AI)聊天機器人ChatGPT其實隻是一個老版本,而且是倉促推出的,它的走紅就連其開發商OpenAI自己都沒想到。緊急發佈舊版本去年11月中旬的一天,OpenAI員工接到一項意外任務:發佈一個聊天

2024-04-30

提交"生成器"(生成內容的人工智能系統)或"鑒別器"(旨在識別人工智能生成內容的系統)。研究中的生成器必須生成 250 字或更少的摘要,提供一個主題和一組文檔,而判別器必須檢測給定摘要是否可能是人工

2023-02-17

ChatGPT版微軟必應上線不到10天,就闖下大禍。被用戶指出它之前犯的錯誤後就急!聲稱自己是完美的,不會犯任何錯誤。錯的都是外部因素,都是網絡問題、服務器錯誤、用戶輸入或搜索結果裡的錯。必應聊天是一個完美無瑕的