實測:神乎其神的ChatGPT能否取代新聞工作者?


春節期間,一部《流浪地球2》點燃全民的科幻熱情,影片中的數字生命“圖丫丫”就仿佛是人工智能的投射,集中人們對人工智能的所有期待。而OpenAI去年年底發佈的ChatGPT則讓不少國內投資人的科幻熱情得到寄托,帶動人工智能一詞在A股市場持續刷屏。

很多人體驗完ChatGPT之後,將其誇的神乎其神,例如體驗感很真實,比目前通用的人工智能客服都更會“講人話”,邏輯暢通,思路清晰……仿佛是電影中數字生命的現實版本。

還有人更是憂心忡忡,ChatGPT可以模仿人類寫詩甚至寫歌,用不多久,人類大規模失業可能就會出現!

然而,多位人工智能界專傢及其相關研究報告都在強調ChatGPT技術上所存在的壁壘,例如這一語言模型很難應用於精確或可信度要求高的工作之中。

這一缺點並不難在實探中得到印證。這既是該項技術未來可能進步的方向,也可能為商業化設想提供“負面清單”。

假如你是一名財經編輯

財聯社編輯在親身試用ChatGPT之後,讓她大舒一口氣的是:財經新聞還是得靠人來寫。

2020年,OpenAI曾在一篇論文中表示,其GPT-3生成的新聞文章樣本,讓人類很難識破是由機器生產的文章。


這一點讓人感到好奇,於是在近日實探中,我們向ChatGPT發送如下指令:請以一名專業的財經類主編身份點評一則報道。隨之附上的是去年財聯社關於全球富豪排行變動的一條新聞。


不難發現,ChatGPT的回答雖然有條有理,但頗為死板,像是高中語文的閱讀理解。

此外,ChatGPT還在另一次測試中出現張冠李戴的問題,當輸入一篇短篇報道並要求ChatGPT進行擴寫時,不僅出現原文中從未有過的材料,更是出現數字謬誤。


文中紅線標劃之處都是ChatGPT的即興發揮,有關比爾蓋茨、李嘉誠包括此後對歐洲、亞洲富豪的敘述都是新產生的文本。而據調查,所謂比爾蓋茨在2022年減少350億美元身價,實際上應該為290億美元,350億美元應該為他截至2019年累計捐贈的數額。

在另一個問題的測試中,ChatGPT也坦誠自己的局限。由於其儲存資料的時間限制在2021年前,所有2022年以後發生的事情其實在它的“大腦”裡都無法正確處理。


人工智能確實能夠生成一些幾能亂真的新聞報道,但背後卻仍需要人工對事實進行不斷的核查。僅從這個角度來看,ChatGPT並沒有解放多少生產力。

而從其行文來看,其中並不帶很多的感染力,這也讓它在藝術創作方面無法與人類媲美。

這就讓這款人工智能有些進退兩難:若從事專業寫作,讀者不得不質疑其準確性;而從事藝術創作,它又沒有豐富的表現力。

一致性問題

ChatGPT是建立在Instruction GPT(GPT-3的分支模型)上的語言模型,依托於Transformer模型,與上一代RNN模型相比,在處理速度和多任務處理上實現革新。

ChatGPT的語言模型在預訓練階段,被填鴨式塞進過濾前容量達45TB的壓縮文本,且過濾後也有570GB的海量數據,然後再通過多次的舉一反三來增加準確率。

在ChatGPT的邏輯裡,“你”後面可以跟的字有不同的概率,可以是“你好”,也可以是“你們”等等,它需要做的是,就是回溯上文來推導下一個字最可能跟哪一個字。

而以前的RNN模型則是通過標記海量的數據集,先教會人工智能什麼是對的,再讓其進行判斷。如果說RNN模型是嚴格按照原文做閱讀理解,那麼GPT則做到完形填空

這就使得以Transformer為基礎的人工智能可以通過旁征博引來跳出“輸入”的前提,這大大緩解“教學壓力”。

當然,帶來的後果也已經顯現:“跳脫”的人工智能很可能用一個詞改變整個語境。

就如試驗中出現的馬斯克反轉。在原文隻給出馬斯克因收購Twitter而導致特斯拉股票暴跌,並讓他自己財富縮水的線索時,ChatGPT神來一筆地表示:馬斯克對此並不悔恨,甚至很有信心。

啼笑皆非的是,馬斯克本人可能並沒有這樣想。

而將這一問題深入思考,如果人們以後要求ChatGPT處理其它問題時,也出現這樣的情況怎麼辦?

比如,相親網站的智能客服回答客戶時,AI突然來一句離婚率連年上漲的話怎麼辦?或是在合同撰寫中,AI標註錯誤的金額怎麼辦?

被“玩壞”的ChatGPT未來在何處?

大火之後,流量明星ChatGPT現在終於不得不陷入尷尬的境地:問的人太多,它回答不過來。


其團隊苦心孤詣簡化邏輯,提高計算速度仍難以滿足人類的好奇心,此刻的ChatGPT如同被問煩的人類,陷入“自閉”之中。

拋開它被吹捧的外衣,ChatGPT實際上依靠的仍是人工智能領域十分底層的技術,算法雖然有所改進,但其本身依舊受制於程序員圈定的邏輯和硬件支持之中。

而ChatGpt本身也可能隻是一個半成品,其在網上試用的最主要目的在於進行更多的測試訓練,以便產生更多的有效標註數據。

換句話說,你我現在都是ChatGPT的免費教練。

值得期待的是,種種跡象表明,OpenAI很有可能在2023年推出GPT-4技術,將在GPT-3模型基礎上繼續優化。

在獲得全球免費教練的“貼心指導”後,我們有理由相信OpenAI將會打造一個更具人性化,更智能的ChatGPT 2.0,並在商業中落地。甚至,我們也可以期待有一天ChatGPT可以真正從事需要高可信度的工作,而不會無辜地去捏造事實。

但僅就ChatGPT而言,這頭“新貴豬”可能還需要在風口再等一等。


相關推薦

2023-02-21

ChatGPT發佈以來,基於指令學習技術的類ChatGPT模型在我國能否開發成功,成為業界關註的一個焦點。今天,解放日報·上觀新聞記者從復旦大學自然語言處理實驗室獲悉,國內第一個對話式大型語言模型MOSS已由邱錫鵬教授團隊發

2023-11-30

來。一年前的今天,人工智能公司OpenAI發佈AI聊天機器人ChatGPT,科技界、投資界開始瘋狂追捧這類生成式AI——“AI的iPhone時刻”“互聯網的誕生”“新一輪工業革命”。但不到一年時間,OpenAI內部就因AI進步過快而陷入巨大的分

2023-01-26

追加投資100億美元,或許你沒聽過這傢公司的名字,但是ChatGPT的名字大傢應該不陌生,作為前段時間的網絡熱門話題,ChatGPT的公佈使得人們意識到人工智能或許真的不再是“人工智障”。圖源:OpenAIChatGPT不僅能讓人感覺在和一

2023-02-16

目前,ChatGPT還沒有通過圖靈測試的評估。其實,迄今為止,還沒有人工智能模型能真正通過圖靈測試。去年11月,美國人工智能研究公司OpenAI發佈一款名為ChatGPT的聊天機器人,其在推出後的幾周內就風靡全球,甚至引發一場新

2023-03-24

hapGPT施加重壓過去三個多月,科技行業最火的產品無疑是ChatGPT。OpenAI打造的這款生成式AI產品發佈之後火遍全球,讓用戶感受到前所未有的智能體驗,更直接帶動下一個科技風口,甚至卷到中國互聯網創投圈。另一方面,互聯網

2023-04-06

自從ChatGPT掀起浪潮,不少人都在擔心AI快要搶人類飯碗。然鵝,現實可能更殘酷QAQ......據就業服務平臺ResumeBuilder調查統計,在1000多傢受訪美國企業中,用ChatGPT取代部分員工的,比例已達到驚人的48%。在這些企業中,有 49% 已經

2023-02-16

在美國《科學公共圖書館·數字健康》的一篇文章提到,ChatGPT參加美國執業醫師資格考試。這項以高難度著稱的考試中,共350道題,內容涵蓋基礎科學、生物化學、診斷推理和生物道德學。ChatGPT未經專門的培訓或強化,經過兩

2022-12-23

ChatGPT的橫空出世,讓Pichai真的怕。沒有大力發展聊天機器人,是Google的戰略性失誤嗎?這個月,OpenAI的ChatGPT橫空出世,立刻在AI圈掀起一股大風暴。清晰、智能、循循善誘,甚至能包辦論文和代碼。當時許多人就預言:Google恐

2023-02-08

名為Bard的人工智能聊天機器人技術,以此與OpenAI旗下的ChatGPT展開競爭。後者的爆紅令不少分析師警告稱,谷歌的核心產品,即在線搜索功能,恐面臨多年來最重大的風險,甚至遭遇徹底顛覆。Wedbush分析師丹尼爾·艾夫斯(Daniel

2023-02-09

GPT XX”公眾號問答產品為例,該產品通過公眾號稱為科技工作者嘗鮮使用,每個用戶僅提供5次免費問答服務,之後想再次提問的開通會員獲取權益。其中,月度會員售價199元,季度會員399元,年度會員9999元。三類會員有效期內

2023-02-14

而且它這個正確率逼近人類九歲孩子的成績,這才有網上神乎其神的解讀。圖註:不同人工智能正確率比較,GPT-3.5遙遙領先理解心智理論的概念,也看論文的方法,咱們再來說說網上的解讀。九歲的“心智理論” “同理心

2023-02-17

江之聲報道,真相是:16日下午,杭州某小區業主群討論ChatGPT,一位業主開玩笑說嘗試用它寫篇杭州取消限行的新聞稿,隨後在群裡直播使用ChatGPT的寫作過程,還把文章發在群裡。有些業主不明就裡,截圖轉發,導致失實信息

2024-02-22

ma2或Mistreal模型在計算和響應速度上遠超基於NVIDIA AI GPU的ChatGPT,其每秒可以生成高達500個 token。相比之下,目前ChatGPT-3.5的公開版本每秒隻能生成大約40個token。由於ChatGPT-3.5主要是基於NVIDIA的GPU,也就是說,Groq LPU芯片的響應速

2023-04-07

引擎中添加對話式人工智能功能,這將引導公司應對來自ChatGPT等聊天機器人的競爭和更廣泛的業務壓力。”谷歌首席執行官SundarPichai在近日的一次采訪中表示,AI並不會對谷歌的搜索業務構成威脅,相反,人工智能的進步會增強