未來已來?GPT-4剛上線就引發馬斯克焦慮 一文梳理其與3.5版本區別


ChatGPT公司OpenAI隔夜上線其最新人工智能模型GPT-4,轟動整個科技界。據OpenAI自己稱,GPT-4將是該公司裡程碑式的模型。在其概念視頻中,OpenAI介紹新模型可以解決更復雜的問題、編寫更大型的代碼,並通過圖片產生文字。此外,Ope

nAI還承諾GPT-4相比之前的模型,包括ChatGPT此前應用的GPT-3.5,將更加安全且具協調性。

用簡單的話說,GPT-4模型改變此前ChatGPT等歷史人工智能的單一、文本短小等缺點,變身為一個能看圖說話的高級“解語花”。

然而,這朵“解語花”也點燃不少人的焦慮,比如矽谷最著名的企業傢馬斯克。

他在Twitter平臺上發文稱:人類還能做什麼?我們最好使用Neuralink(來對抗人工智能)!


此外,他還回復網友關於GPT-4內測的帖子,稱他個人十分關切這個新模型,也認為這個新的人工智能看起來很有意思。

但馬斯克關於GPT-4和Neuralink的評論還是讓不少網友覺得尷尬,不少人嘲諷他的腦機廣告聽起來並不吸引人。相比於人工智能機器人取代人類,在大腦裡植入設備似乎更讓人頭皮發麻。

不過,網友們關於GPT-4領導機器人占領世界的想法也是過於杞人憂天。

正如OpenAI強調的那樣,GPT-4目前仍是並不完美的模型,其能力遠不如人類。GPT-4仍有許多局限性,如社會偏見、幻覺和對抗性提示。

矽谷做題傢

GPT-4現在最熱門的話題莫過於它強大的應試能力。根據OpenAI的評估,GPT-4已經能輕松通過美國的律師考試,且考進前10%的排名。相比之下,它的上一代模型GPT-3.5隻能吊個車尾。

除律師考試,GPT-4還在美國大學入學測試SAT中考到710分,雖然分數不高,但已經夠上美國大學錄取水平。更重要的是,GPT-4能在大學的基礎微積分課程中獲得4的成績(5分為滿分),這證明該模型已經掌握高等數學大部分的概念。

網友也對它的這些做題能力進行進一步的測試。

比如讓它分析柱狀圖,並回答圖形背後的統計學意義,或者出一道用法語描述的物理題。令人欣慰的是,它竟然沒有胡言亂語,而是有條有理地給出正確答案。



另一方面,已經升級為GPT-4模型的ChatGPT,現在已經可以通過用戶的簡單需求直接生成代碼,甚至網站。即便用戶隻是在餐巾紙上畫個簡單界面,GPT-4都能直接搞出一個可運行的網站。


如此好用不廢話的程序員,大概是每一個產品經理心中永遠的神。

量子波動速讀?

更讓人嫉妒的是,曾經中國爆火的“量子波動速讀”竟然也在GPT-4上獲得重現。這種被機構濫用的反人類教育噱頭,在非人類的人工智能上卻得到完美的詮釋。

有網友將一整篇論文上傳給GPT-4,然後,GPT-4就在極短時間內完成閱讀,並給出清晰的總結摘要。



甚至,如果有人問它某個圖是什麼意思,代表什麼意義,GPT-4也能像模像樣地給出解答。


與GPT-3.5相比,GPT-4將文字輸入限制提升至2.5萬字,這讓其閱讀體量大大增加,也讓用戶的文書處理工作變得更加簡潔。

此外,強大的識圖能力和顯著提高的回答準確性,也保證GPT-4在文字處理上的優越性,相較於GPT-3.5的答不上來就亂編,已經出現長足的進步。

破解冷笑話

如果說昨天的ChatGPT還是一個不解人意的“老古董”,那麼今天的ChatGPT就已經可以輕松理解網友心照不宣的冷笑話,即便是表情包,它也能說個子醜寅卯來。

比如雞米花拼成的世界地圖,ChatGPT就輕松回答出網友想要的答案:這是個玩笑,用雞米花和世界地圖兩個不相幹的東西形成一種幽默。


雖然識圖這一功能在人工智能領域並不罕見,Google搜索甚至連淘寶都具備識圖功能,但這一功能還是首次亮相於ChatGPT。

而除簡單的識圖之外,更可貴的是,ChatGPT現在還能解釋圖像的具體意義,並理解圖像背後的隱喻含義,這在其他識圖人工智能上仍十分罕見。

可惜的是,目前圖像輸入的功能仍隻是預覽階段,還不能使用,即便是氪金玩傢現在也隻能按捺住好奇心。

Cosplay“受害者”

早在ChatGPT出來的時候,網友們就熱衷於讓人工智能玩角色扮演的遊戲。什麼假設你是一個財經編輯啦,假設你是一個程序員啦,假設你是小說傢啦……總之,網友想到什麼,ChatGPT就被迫成為什麼。

而現在,這樣的花活居然被OpenAI官方帶頭認可。

相比於GPT-3.5時期,現在鳥槍換炮的ChatGPT不再用一本正經的語氣規勸網友,類似於“我隻是個人工智能,我無法……”的表達,現在都用更具個性化的話替代。


OpenAI要求GPT-4拿出服務精神。既然用戶希望得到一個定制的GPT-4,那麼GPT-4就要表現出相應的人物性格和態度。

缺憾仍在

根據OpenAI的內部測試,GPT-4仍有GPT-3.5的老毛病,就是胡言亂語。專業地講,GPT-4仍會產生幻覺,生產錯誤答案,並出現推理錯誤。

總的來說,GPT-4已經顯著減輕幻覺問題,在這一項上,GPT-4的分數比GPT-3.5要高出40%。但這可能也意味著GPT-4的亂講話可能更隱蔽,更難以被用戶察覺。

另一方面,GPT-4仍缺乏對數據截至日期後新進展的解能力,即其無法在訓練學習後,追蹤新的信息來補足對某件事認知。此外,它也無法從經驗中學習,並可能一直輕信人類。

在安全邊界上面,GPT-4也得到相應的加強,與GPT-3.5相比,它對違禁內容的回復率下降82%,對敏感內容(如醫療建議)的響應率則提高29%。

還有一個不太友好的地方在於,GPT-4的使用目前僅對ChatGPT Plus玩傢開放,換句話說,需要付費。

目前OpenAI對GPT-4的訓練規模、硬件、算力等一切保持緘默,隻說會在未來陸續公佈,可謂是吊足外部觀眾的胃口。

不過,瑕不掩瑜,截至目前,科技人士對GPT-4的評估仍持正面態度。更多的人則在說:未來已來,迎接新世界吧。


相關推薦

2023-11-18

匆忙部署產品。11月6日:OpenAI開發日進展順利,他們將在未來幾天推出之前發佈的產品。在開發日之後,Greg和Altman完全處於籌資模式。他們的目標是900億的估值,是300億的3倍。OpenAl的招聘人員打電話給谷歌員工,承諾如果他們

2023-03-16

反饋,告訴學習者其回答的準確性和復雜性如何,還會對未來的對話予以提示。另一款產品BeMyEyes也將搭載GPT-4,而且側重的是其圖像識別和解讀的能力。BeMyEyes不是一款新應用,它推出於2015年,為視障人士服務:沒有視力障礙

2024-03-21

部署高效的AI模型。這不僅提高AI技術的普及率,也為Meta未來在各種應用和用例上的廣泛部署提供可能。有分析人士認為,基於Meta的業務范圍,從聊天機器人到遊戲,再到未來的生產力軟件,生成式AI預計將帶動一個價值超過500

2023-11-14

從網友們的作品中,咱們已經能一窺 GPTs 的潛力和活力,剛上線各種五花八門的 GPT 就已經出來。這裡面有做數據分析、醫療助手等等,各種垂類領域的 GPT 也都被 “ 煉 ” 出來,包括這次的差評頭圖生成等等,都隱隱約約有點

2024-03-03

PT-4的能力,認為GPT-4可以被視為早期AGI。去年論文發表時就引發不小關註,1年時間裡被引次數已經高達1500次。馬斯克的起訴書裡寫道,微軟自己的科學傢自己都承認。這麼看,OpenAI最新的一通回應不是啪啪自己打臉?還真不一

2023-03-19

期工作,並不完善。測試流程有無數可以改善之處。結論未來隨時可能被修正、被推翻。各位讀者請理解。現在,讓我們來詳細看看測試結果。分項測試結果語義錯覺類任務在語義錯覺類任務這裡,我們挑選 4 個任務。測試結果

2023-04-15

品時,都會更保密一些,但你們卻為何如此坦誠呢?你們未來還會繼續保持這種坦誠嗎?Altman回答說,我們當然會一直保持坦誠。因為OpenAI堅信,ChatGPT技術會影響所有人,所以他們大膽地選擇把一個還不完美的AI系統公之於眾,

2023-10-31

速追趕GPT-4。當天,通義千問APP在各大手機應用市場正式上線,所有人都可通過APP直接體驗最新模型能力。通義千問2.0發佈周靖人介紹,過去6個月,通義千問2.0在性能上取得巨大飛躍,相比4月發佈的1.0版本,通義千問2.0在復雜

2023-04-16

型平臺,整合百度全套文心大模型、相應的開發工具鏈,未來還會支持第三方的開源大模型。在現場實時演示中,文心千帆可實現三分鐘做ppt、數字人直播帶貨、訂機票和酒店等操作。4月3日,百度地圖V18版本發佈。該版本由文

2023-03-15

型預訓練變換模型)-3(生成型預訓練變換模型),並將其與GPT-3.5分別用於創建Dall-E和聊天機器人ChatGPT,這兩款產品極大地吸引公眾的關註,並刺激其他科技公司更積極地追求人工智能(AI)。OpenAI周二表示,在內部評估中,相

2023-03-15

完善方法,以幫助其實現更強大的提前預測性能和 規劃未來的能力,這對安全至關重要。OpenAI 正在通過 ChatGPT 和 API(有候補名單)發佈 GPT-4 的文本輸入功能。圖像輸入功能方面,為獲得更廣泛的可用性,OpenAI 正在與其他公司

2024-03-02

將其用於增強個人能力,即創建一個看似最安全的分佈式未來版本。更廣泛地說,安全性應該是我們的首要考慮。2. 我認為我們最好從一個7到10人的小團隊開始,並計劃從此基礎上擴大。我們在Mountain View有一座額外的建築,可

2023-01-31

子嚴重受傷。周一,該名司機被控謀殺未遂。這一事件曾引發特斯拉CEO馬斯克的關註,稱車上乘客全部生還是“好消息”。但當地警方調查後認為,這起所謂的交通“事故”很可能是一起蓄意謀殺(未遂)事件,並逮捕這名司機

2023-11-07

年後,GPT 的知識庫終於更新到 2023 年 4 月。Sam Altman 承諾未來還將繼續更新其知識庫,不使其落伍。“對於 GPT 的知識停留在 2021 年,我們和你們一樣,甚至比你們更惱火。”Sam Altman 表示。GPT 內部知識庫終於升級到 2023 年 4 月