ChatGPT公司OpenAI隔夜上線其最新人工智能模型GPT-4,轟動整個科技界。據OpenAI自己稱,GPT-4將是該公司裡程碑式的模型。在其概念視頻中,OpenAI介紹新模型可以解決更復雜的問題、編寫更大型的代碼,並通過圖片產生文字。此外,Ope
nAI還承諾GPT-4相比之前的模型,包括ChatGPT此前應用的GPT-3.5,將更加安全且具協調性。
用簡單的話說,GPT-4模型改變此前ChatGPT等歷史人工智能的單一、文本短小等缺點,變身為一個能看圖說話的高級“解語花”。
然而,這朵“解語花”也點燃不少人的焦慮,比如矽谷最著名的企業傢馬斯克。
他在Twitter平臺上發文稱:人類還能做什麼?我們最好使用Neuralink(來對抗人工智能)!
此外,他還回復網友關於GPT-4內測的帖子,稱他個人十分關切這個新模型,也認為這個新的人工智能看起來很有意思。
但馬斯克關於GPT-4和Neuralink的評論還是讓不少網友覺得尷尬,不少人嘲諷他的腦機廣告聽起來並不吸引人。相比於人工智能機器人取代人類,在大腦裡植入設備似乎更讓人頭皮發麻。
不過,網友們關於GPT-4領導機器人占領世界的想法也是過於杞人憂天。
正如OpenAI強調的那樣,GPT-4目前仍是並不完美的模型,其能力遠不如人類。GPT-4仍有許多局限性,如社會偏見、幻覺和對抗性提示。
矽谷做題傢
GPT-4現在最熱門的話題莫過於它強大的應試能力。根據OpenAI的評估,GPT-4已經能輕松通過美國的律師考試,且考進前10%的排名。相比之下,它的上一代模型GPT-3.5隻能吊個車尾。
除律師考試,GPT-4還在美國大學入學測試SAT中考到710分,雖然分數不高,但已經夠上美國大學錄取水平。更重要的是,GPT-4能在大學的基礎微積分課程中獲得4的成績(5分為滿分),這證明該模型已經掌握高等數學大部分的概念。
網友也對它的這些做題能力進行進一步的測試。
比如讓它分析柱狀圖,並回答圖形背後的統計學意義,或者出一道用法語描述的物理題。令人欣慰的是,它竟然沒有胡言亂語,而是有條有理地給出正確答案。
另一方面,已經升級為GPT-4模型的ChatGPT,現在已經可以通過用戶的簡單需求直接生成代碼,甚至網站。即便用戶隻是在餐巾紙上畫個簡單界面,GPT-4都能直接搞出一個可運行的網站。
如此好用不廢話的程序員,大概是每一個產品經理心中永遠的神。
量子波動速讀?
更讓人嫉妒的是,曾經中國爆火的“量子波動速讀”竟然也在GPT-4上獲得重現。這種被機構濫用的反人類教育噱頭,在非人類的人工智能上卻得到完美的詮釋。
有網友將一整篇論文上傳給GPT-4,然後,GPT-4就在極短時間內完成閱讀,並給出清晰的總結摘要。
甚至,如果有人問它某個圖是什麼意思,代表什麼意義,GPT-4也能像模像樣地給出解答。
與GPT-3.5相比,GPT-4將文字輸入限制提升至2.5萬字,這讓其閱讀體量大大增加,也讓用戶的文書處理工作變得更加簡潔。
此外,強大的識圖能力和顯著提高的回答準確性,也保證GPT-4在文字處理上的優越性,相較於GPT-3.5的答不上來就亂編,已經出現長足的進步。
破解冷笑話
如果說昨天的ChatGPT還是一個不解人意的“老古董”,那麼今天的ChatGPT就已經可以輕松理解網友心照不宣的冷笑話,即便是表情包,它也能說個子醜寅卯來。
比如雞米花拼成的世界地圖,ChatGPT就輕松回答出網友想要的答案:這是個玩笑,用雞米花和世界地圖兩個不相幹的東西形成一種幽默。
雖然識圖這一功能在人工智能領域並不罕見,Google搜索甚至連淘寶都具備識圖功能,但這一功能還是首次亮相於ChatGPT。
而除簡單的識圖之外,更可貴的是,ChatGPT現在還能解釋圖像的具體意義,並理解圖像背後的隱喻含義,這在其他識圖人工智能上仍十分罕見。
可惜的是,目前圖像輸入的功能仍隻是預覽階段,還不能使用,即便是氪金玩傢現在也隻能按捺住好奇心。
Cosplay“受害者”
早在ChatGPT出來的時候,網友們就熱衷於讓人工智能玩角色扮演的遊戲。什麼假設你是一個財經編輯啦,假設你是一個程序員啦,假設你是小說傢啦……總之,網友想到什麼,ChatGPT就被迫成為什麼。
而現在,這樣的花活居然被OpenAI官方帶頭認可。
相比於GPT-3.5時期,現在鳥槍換炮的ChatGPT不再用一本正經的語氣規勸網友,類似於“我隻是個人工智能,我無法……”的表達,現在都用更具個性化的話替代。
OpenAI要求GPT-4拿出服務精神。既然用戶希望得到一個定制的GPT-4,那麼GPT-4就要表現出相應的人物性格和態度。
缺憾仍在
根據OpenAI的內部測試,GPT-4仍有GPT-3.5的老毛病,就是胡言亂語。專業地講,GPT-4仍會產生幻覺,生產錯誤答案,並出現推理錯誤。
總的來說,GPT-4已經顯著減輕幻覺問題,在這一項上,GPT-4的分數比GPT-3.5要高出40%。但這可能也意味著GPT-4的亂講話可能更隱蔽,更難以被用戶察覺。
另一方面,GPT-4仍缺乏對數據截至日期後新進展的解能力,即其無法在訓練學習後,追蹤新的信息來補足對某件事認知。此外,它也無法從經驗中學習,並可能一直輕信人類。
在安全邊界上面,GPT-4也得到相應的加強,與GPT-3.5相比,它對違禁內容的回復率下降82%,對敏感內容(如醫療建議)的響應率則提高29%。
還有一個不太友好的地方在於,GPT-4的使用目前僅對ChatGPT Plus玩傢開放,換句話說,需要付費。
目前OpenAI對GPT-4的訓練規模、硬件、算力等一切保持緘默,隻說會在未來陸續公佈,可謂是吊足外部觀眾的胃口。
不過,瑕不掩瑜,截至目前,科技人士對GPT-4的評估仍持正面態度。更多的人則在說:未來已來,迎接新世界吧。