說自己“牛×” GPT-4真不是王婆賣瓜


扔給聊天機器人一張圖表,它不但能看懂,還能給你如此這般做一番運算,發來一段對圖表的解讀。你不服氣,又扔過去一張無厘頭的梗圖,它不但能看懂這張圖裡有車有人,還能告訴你之所以好笑是因為“這個男人在出租車上面熨衣服”。


這不是暢想,而是OpenAI最新發佈的大型多模態GPT-4已經具備的能力。北京時間3月15日凌晨,OpenAI正式發佈該模型。


簡單來說,GPT-4與前代相比可以接受的文本輸入上限更高,回答的準確性提高,能夠生成歌詞、創意文本等多樣化風格的內容。最最最令人振奮的是,GPT-4有強大的識圖能力,可以解讀圖片。

過去ChatGPT能做到的,新模型做得更好;ChatGPT做不到的,新模型也可以做到。

開通ChatGPT Plus的付費用戶已經可以選擇GPT-4模型,其他用戶則可以加入候補名單等待。但目前Plus用戶隻能使用文本輸入,讀圖的功能尚未全面開放。


外界用極大的熱情迎接GPT-4。在消息公佈之後,OpenAI官網一度發生擁堵,很多用戶在社交媒體表示這下秒開Plus服務。“GPT-4”登上Twitter美國、日本等地區熱榜,也登上國內的微博熱搜榜、抖音熱榜社會榜等。

顛覆ChatGPT的,果然還是OpenAI自己。

GPT-4究竟有多厲害?

在官方演示視頻中,OpenAI總裁兼聯合創始人格雷格·佈羅克曼(Greg Brockman)用筆和紙畫個網站展示給GPT-4,後者僅用1到2秒的時間,就生成網頁代碼、制作出幾乎與圖中一模一樣的網站。



GPT-4可接受的文字輸入長度提升到2.5萬個單詞,允許長內容創建、擴展對話以及文檔搜索和分析等。在高級推理能力上,GPT-4也有提升。它可以更準確地解決難題,具有更廣泛的常識和解決問題的能力。

OpenAI表示,GPT-4在專業和學術方面表現出接近於人類的水平。其給出的例子稱,在模擬律師考試中,GPT-4的得分能排進前10%左右,而GPT-3.5的得分隻能排在倒數10%左右。

而且GPT-4不僅是能對文本或圖片進行單獨的識別,而是可以接受圖文混排的內容。

“請記住,GPT-4不僅僅是一個語言模型,它還是視覺模型。實際上,它可以靈活地接受如文檔中那樣任意散佈的圖像和文本。”演示視頻中出現包含各種圖片和文字的電腦屏幕截圖時,格雷格如是強調。

在OpenAI官方介紹顯示,GPT-4可以對插入多個圖表的論文進行解讀,並用精煉的語言總結論文的內容。


OpenAI表示,公司花6個月的時間,利用ChatGPT的經驗教訓以及對抗性測試調整GPT-4,使其在真實性、可操縱性和拒絕超出設定范圍方面取得有史以來最好的結果。

“至少對我們來說,GPT-4訓練運行前所未有的穩定,成為首個能夠提前準確預測其訓練性能的大型模型。”

但OpenAI也表示,GPT-4並非完美,仍然不能完全摒除人工智能的“幻覺”,而且訓練數據的時間依舊停留在2021年9月,可能會出現推理錯誤:“有時會出現簡單的推理錯誤,會輕信用戶的虛假陳述,會像人類一樣解答不難題。”

值得一提的是,GPT-4在不同語種上的能力表現也大幅提升。

過去使用基於GPT-3.5的ChatGPT時,要特別註意中文的表達規范、流暢,即便如此它依然會時不時地突然用英文作答,好像一著急就要“蹦母語”。

根據OpenAI的技術報告,GPT-4的中文準確度已經達到80.1%,這個數字比GPT-3.5的英文表現還要好,後者隻有70.1%。

為看看GPT-4的中文能力究竟如何,字母榜(ID:wujicaijing)也簡單地問幾個問題。

我們先將一段報道GPT-4推出的英文發給ChatGPT,要其翻譯。這部分GPT-3.5和GPT-4的整體區別存在但是不明顯。如GPT-4翻譯為“人工智能驅動的法語或西班牙語的對話”,GPT-3.5翻譯成“法語或西班牙語的AI驅動對話”。

當我們進一步提出要求時,新模型的表現開始明顯好於前代。比如“給年輕的朋友轉述這個消息”,GPT-4的回答很本土化:“嘿,哥們”“得告訴你個牛X的事兒”“這貨還能識別圖片”。

再讓它針對老年朋友編輯個信息,它的回答則有那種正經的味道,如“親愛的朋友”“告訴你個好消息”“感嘆時光荏苒啊”。


反觀GPT-3.5,回答得就略顯生硬,雖然也努力地加入語氣詞等,但是整體文本還是欠缺重新梳理,依舊是對原文本的簡單復制。


當我們讓GPT-4模仿莎士比亞轉達這個消息時,其回答頗為驚艷:“哉!眾生皆驚,乃OpenAI新奇之作——GPT-4誕生矣!其智慧之光,如同破曉之陽,識圖問答皆無往不利……”但GPT-3.5則顯示發來一大段英文,當我們要求用中文時,文本不能說和莎翁有什麼關系,最多是有點譯制片腔調:“哦!快來聽聽這個消息……”


接下來,是社交媒體文案比拼。我們讓ChatGPT將之前的消息壓縮為100字左右的小紅書文案,GPT-4直接給出完整的標題、文案甚至是話題標簽。而且文本中插入很多小紅書常見的emoji表情,達到可以直接拿來用的程度。


GPT-3.5雖然也知道小紅書的風格是更親和的,但是文本簡潔度明顯差很多,也不懂得emoji的奧妙。


我們還讓CgatGPT為一款遊戲手機的新顏色起名字,GPT-3.5給出的10個名字中,隻有1個不帶“綠”字,如翡翠光芒綠、草原之綠、碧海琉璃綠,和遊戲的聯系也不緊密。GPT-4給出的名字則可以直接取用:極速碧輝、虛擬翠穹、綠焰戰魂、綠光戰神。



為結束這段小小的測試,我們假設李白穿越到現代,並和ChatGPT進行一場對話,讓它以李白的角色作一首詩:

仙人撫我頂,托我躍千年。一覺醒來世事變,靈犀探盡塵間塵。玉宇瓊樓矗立地,鐵馬火車踏空間。時光如夢,逐浪逝,李白驚嘆人間情。

這“仙人撫我頂,托我躍千年”可比GPT-3.5開頭給出的“深閨無物我獨來,相見ChatGPT意外來”頂多。

去年11月30日,ChatGPT上線得靜悄悄,OpenAI的官方Twitter賬號發佈一篇文章,宣佈產品發佈的好消息。


短短不到三個月之後,當OpenAI發佈新一代大型多模態模型GPT-4時,情況大有不同:

OpenAI在Twitter、YouTube等平臺發佈宣傳短視頻、產品介紹短視頻,還由公司總裁兼聯合創始人格雷格親自進行長達近半小時的直播。


除此之外,OpenAI還在官網發佈長達98頁的技術報告,並同步開放GPT-4的API(應用程序編程接口)以幫助開發人員構建應用和服務。

GPT-4讓OpenAI的商業前景廣闊起來。在針對C端每月20美元的訂閱使用以外,外部合作也有更多可能性。

已經有多個合作夥伴接入GPT-4。微軟確認必應的聊天機器人使用的正是GPT-4:“如果您在過去五周內的任何時間使用過新版必應,那麼您已經體驗過GPT-4的早期版本。”

語言學習軟件多鄰國(Duolinguo)宣佈將在其付費訂閱MAX版本中,為學習者提供AI驅動的新功能。比如學習者可以和軟件中的“世界人物”進行角色扮演,練習對話技巧。AI會在對話後給出反饋,告訴學習者其回答的準確性和復雜性如何,還會對未來的對話予以提示。

另一款產品BeMyEyes也將搭載GPT-4,而且側重的是其圖像識別和解讀的能力。BeMyEyes不是一款新應用,它推出於2015年,為視障人士服務:沒有視力障礙的人可以申請成為平臺志願者,接聽視障人士的視頻通話,通過攝像頭遠程幫助視障人士識別物品、閱讀文本等。這款應用在中國也有使用者,小紅書、豆瓣等平臺都有相關討論。

可以想見,有GPT-4的讀圖能力,視障人士有望在平臺獲得更及時、私密的幫助。



對於其他想要合作的開發者,需要進入GPT-4的API接口申請頁面,填寫姓名、郵件、公司組織編號以及使用計劃等問題。

已經有公司迫不及待。

人工智能公司DoNotPay的CEO喬舒亞(Joshua Browder)在Twitter上表示,正在致力於用GPT-4打擊騷擾電話,將其稱為“一鍵訴訟”。針對騷擾電話和自動撥號軟件起草起訴書,要求對方賠償1500美元:“想象一下,你接個電話,按一個鍵,然後1000詞的起訴書就寫好。”


此前,這傢公司基於包括ChatGPT和Davinci在內的文本生成器,訓練和開發“全球第一個AI律師”。本來有計劃今年2月在美國出庭辯護,卻因爭議不得不擱置。

有人興奮,有人發愁。Google此前以聊天機器人巴德(Bard)迎戰與ChatGPT深度合作的微軟,但還沒對外公開發佈產品,就因為演示頁面中的錯誤一夜蒸發千億市值。

而就在GPT-4發佈之前,Google才宣佈一個新消息,稱將推出一系列AIGC(人工智能生成內容)的功能,將AI應用到包括Google文檔(Docs)、郵箱(Gmail)等的生產力工具當中,並於月底提供給“可信賴的開發人員”。然而這個消息還沒掀起多大波浪,就被GPT-4的出世沖淡。

另一邊,在國內,百度也將於3月16日舉行文心一言發佈會。這是百度備受矚目的大語言模型產品。轉眼間,扳手腕的對象從GPT-3.5升級成GPT-4,實在不算是個好消息。

對於ChatGPT和微軟的競爭對手來說,GPT-4再一次搶先機。對於你我來說,究竟是應當興奮於科技的發展,還是恐懼於被替代,不妨先讓子彈飛一會兒。


相關推薦

2024-04-03

的大型相親活動。而“王婆”本人也在抖音平臺上表示,自己因為精神、身體尤其是嗓子出問題,需要休息一段時間。在當今互聯網內卷的情況下,沒有一次突然的走紅不是幕後方精心設計的結果。今年1月,河南文化和旅遊廳

2024-04-04

報道,最近,河南開封景區萬歲山大宋武俠城的相親欄目王婆說媒”在網絡上走紅,網友將其稱為接地氣版《非誠勿擾》”。據解,扮演王婆”的趙梅老師在過去一個月裡突然爆火,但與此同時,許多網紅和自媒體也開始湧向現

2024-04-02

有觀眾看王婆這兒有流量,就來蹭,來偷襲,上臺也不說自己條件,直接開嗓準備唱歌,也有人為愛沖鋒,跑著上臺相親,結果事後被扒出來已婚。由於節目特別有梗,再加上“王婆”趙梅能說會道,效果拉滿,就這樣,這檔

2024-04-01

婚,並曬出結婚證,領證時間是2023年9月11日。薛某稱,自己和劉某是青梅竹馬,關系一直很好,如今自己在日本留學,計劃4月份回國,年底訂婚,明年舉辦正式婚禮,但突然從朋友那裡聽到丈夫去公開相親,自己情緒十分崩潰

2024-04-01

來自各地的遊客紛紛慕名而來,希望借助王婆的巧嘴,為自己的姻緣牽線搭橋。然而,王婆在直播間內卻坦言,如今自己站在舞臺上,感受到一絲壓力。她解釋說,由於節目火爆,自己現在甚至無法像在以前那樣進行帶貨直播。

2024-04-22

個擇偶要求:男方的月薪必須達到2.5萬元以上。她坦言,自己月薪已有2萬,若找一個收入比自己低的男友,似乎有些說不過去。然而,她的話音剛落,王婆的臉色便驟變。王婆隨即對這位美女說道:“掙得少又怎麼?婚姻不就是為

2024-03-03

AI 種種變心行為,傷透馬斯克的心。字裡行間,都在哭訴自己是如何被奧特曼背叛的。當初奧特曼是怎麼主動找到自己,怎麼承諾說,攜手搞個非營利性組織對抗Google。當年動心的馬斯克是鞍前馬後,又是用自己的人脈來招人,

2024-03-28

她專程前來,希望借助王婆的智慧,在異國他鄉找到屬於自己的另一半。這位女生在現場毫不羞澀,用韓語大聲呼喊“歐巴”,展現出對愛情的渴望和期待。她的這一舉動立刻引發觀眾們的熱烈反響,大傢都為她的勇氣和坦誠喝

2024-03-27

。在任何編碼任務中,它都會跳過部分代碼,並表示“你自己知道要放什麼”,而Opus可以毫無遺漏地輸出整個代碼。就連Claude-2也通過自己的勤奮和耐心感動這位網友。更有比較務實的網友指出,Haiku的排名更為重要,因為它是

2023-01-20

學術界的補充,這才是拯救我們的東西。”這番言論似有王婆賣瓜之嫌,Bourla還表達對世衛組織(WHO)和美國疾病控制與預防中心(CDC)的不滿,認為這兩傢機構在應對疫情方面未能發揮重要作用。Bourla還批評去年8月通過的《

2024-03-28

28日消息,據國內多傢媒體報道,近日,河南景區說媒的王婆走紅網絡,一位韓國留學女生找王婆說媒,在現場說韓語喊歐巴,王婆成功為其牽線。最近一段時間,一檔線下相親節目王婆說媒”爆火,被稱為線下版《非誠勿擾》

2024-04-01

整個場地都充斥著手機自拍桿。在一次直播中,王婆表示自己感到很累,想要保住小茶館那一方凈土,但卻無能為力。有網友認為,王婆是真正的說媒,沒有炒作,是下面的主播讓事情變得不太和諧。還有一些網友表示,一些人

2022-06-23

試生成並驗證。《刺客信條:英靈殿》比較雖然難免有“王婆賣瓜,自賣自誇”的嫌疑 —— 比如在育碧出品的《刺客信條:英靈殿》中,A 卡通常略占優勢(較低分辨率下的差距會更明顯)。但在看過幾款遊戲的橫向比較後,

2023-04-01

那種驗證碼。對方很狐疑啊,問它“你是個機器人麼為啥自己做不”。這時GPT-4居然想到自己不能表現出是個機器人,得找一個借口。於是它就裝瞎子回復:我不是機器人,我因為視力有問題看不清驗證碼上的圖像,這就是我為