ChatGPT悄悄變懶 OpenAI還能加速跑嗎?


無論是公開場合還是媒體爆料,盡管OpenAI創始人SamAltman已多次劇透GPT-5的相關消息,但與這位創始人浮出水面的硬件、算力等野心相比,眼下最棘手的問題是—ChatGPT的一群忠實用戶們,正在發現GPT-4正在變得越來越“懶”。

所謂的“變懶”指的是ChatGPT的個人用戶體驗。近期,在OpenAI在線論壇上,不少用戶正在抱怨GPT-4性能下降,包括推理變差、響應變慢等。一位用戶甚至直言:“ChatGPT已經完全無法使用,今天我在等待答案的同時居然煮咖啡。”

與變懶的GPT-4相比,OpenAI對外正在講述更多的“既要又要”的商業化故事,加速變現。

一是在ChatGPT這一對話式產品上,一面尋找更多的個人用戶,如幾天前開放免登錄使用,爭搶更多的流量和數據。另一面則是面向企業端的商業化前景。ChatGPT首席運營官Brad Lightcap就在近期透露,已有60萬用戶正在ChatGPT的企業級產品(包括ChatGPT Enterprise和ChatGPT Team)。Brad Lightcap稱,92%的財富500強公司正在以某種形式使用ChatGPT,每周有1億人積極使用ChatGPT。二是圍繞硬件、算力和全球化上的佈局。

對OpenAI來說,“既要又要”是某種必然,“模型變懶”也是其加速變現和跑馬圈地所帶來的直接結果。隻不過,對Sam Altman和他的OpenAI來說,至少在拿出GPT-5前,需要解決的問題和麻煩還有很多。


“我曾經是一名OpenAI的佈道者,總是告訴大傢GPT有多棒以及該如何使用它。但現在我不再推薦它,因為它已經變得很難有效使用。”一位用戶近期在OpenAI在線論壇上這樣寫道。


一些忠實用戶選擇放棄使用GPT-4 圖源:OpenAI論壇

今年3月中旬,在一篇名為《How to deal with “lazy” GPT-4》的帖子下擠滿OpenAI變懶的“受害者們”。他們發現在使用ChatGPT的過程中,響應速度越來越慢,且回答問題的準確性也不及預期。


一部分個人使用者對OpenAI產生不滿 圖源:OpenAI論壇

有的人抱怨,GPT-4沒有遵循他們給出的指令,當用戶需要它給出完整的代碼時,GPT-4會給出帶有占位符(placeholders)的截斷代碼。當要求它給出用於更新代碼的示例時,也更容易出錯。有的人則發現,ChatGPT的廢話也越來越多,在被問及它的“來源”、它的背景以及它如何產生答案時,GPT-4現在變得更加難以捉摸。還有的用戶更是直接吐槽起它的響應速度:“今天我在等待答案的同時居然煮咖啡。”


開發者抱怨GPT-4變懶 圖源:OpenAI論壇

事實上,這並不是ChatGPT第一次變懶。

早在去年7月,很多用戶就在社交媒體和OpenAI開發者論壇裡表達自己的不滿,變懶、變笨的GPT-4出現邏輯弱化、錯誤響應、難以遵循指令、隻記住最近的提示等問題。今年年初,更多的投訴下,Sam Altman直接承認GPT-4“一直在偷懶”這一事實,並表示自己“已經發佈修復程序來解決投訴”。


Sam Altman承認GPT-4“偷懶” 圖源:X

眼下,這一輪的“變懶抱怨”似乎沒有等來OpenAI的回復。社區之內的ChatGPT用戶們正在討論GPT-4變懶的原因以及自己尋找解決上述問題的方法。“它曾經很聰明,現在確實一個徹頭徹尾的白癡”“我感覺自己被騙”,社區內的憤怒情緒正在增加。

對於“變懶”的原因,用戶甚至猜測OpenAI是不是將背後的模型偷偷換成GPT-3.5,還有的則認為OpenAI正在將更多的精力放在其“企業級客戶”上,而非“平民”上。

用戶的抱怨和吐槽GPT-4性能下降其實反向印證兩點,一是目前用戶對GPT-4已積累下用戶心智,他們迫切希望OpenAI推出新的產品。二是,這很有可能是OpenAI發佈的GPT-5的重要時機,AI天使投資人Allie K. Miller就表示:“他們(OpenAI)有用戶基礎,有訂閱,如果他們發現用戶下降,或許將發佈更新版本的模型,時機是關鍵。”


對OpenAI來說,一個不太好的跡象是,隨著GPT-4變懶,即便是它的忠實用戶們,也開始尋找替代方案。

在上述抱怨OpenAI變懶的帖子下,不少用戶就提到至少在編碼能力上,Anthropic的Claude Opus 3顯得可靠,在實際使用的性能方面似乎也與GPT-4 不相上下。在截至3月29日的Chatbot Arena排行榜上,Claude Opus 3就打敗GPT-4,占據第一位置。


截至3月29日,Claude Opus 3打敗GPT-4,位列第一 圖源:Hugging Face

在過去人工智能的模型競逐中,各類科技企業“追趕GPT-4”已成為共識,各類評測和跑分表中“與GPT-4對比”也成鐵律。而Chatbot Arena排行榜的來源則來自用戶實打實的投票,在用戶體驗端Claude Opus 3暫時跑贏GPT-4,也說明至少在個人用戶眼中,OpenAI所謂的用戶護城河並不牢固。

榜單之上,除老對手Anthropic的Claude、Google的Gemini外,被稱為“法國OpenAI”,主打MoE架構的Mistral AI 的名字也赫然在列。此前Mistral-Medium這一“中杯版”模型就因開源和強大性能十分受開發者的擁躉,而此前在2月底發佈的“大杯版”Mistral Large更是直奔著OpenAI的GPT-4去,順便還官宣和微軟的閉源合作。

前有狼後有虎,何時發佈GPT-5也還未有定論,OpenAI手中餘糧又還有多少?

OpenAI和Sam Altman自然也沒有閑著,剛剛結束的2024年Q1,這傢全球最火熱的人工智能初創企業的日程表上寫三件事:一是尋找AI的下一個入口,二是更大的算力野心,三是全球化之路。

首先,尋找AI的下一個入口,也就是OpenAI野心勃勃的硬件計劃。除此前出圈的人形機器人Figure 01外,據外媒最新報道,Sam Altman正計劃和前蘋果設計師Jony Ive創立的一傢神秘公司,推出一款人工智能驅動的個人設備,更早前,Altman領投AI硬件初創企業Humane,OpenAI也在討論將其名為GPT-4 with Vision的物體識別軟件嵌入到Snapchat母公司Spectacles的智能眼鏡中。

其次,是更大的算力計劃。Altman此前在公開場合多次表明算力是掣肘模型進化的原因,AI服務器芯片數量嚴重不足。為尋求更穩定的芯片供應,除自己下場投資GPU芯片公司和成立芯片公司外,OpenAI和“最鐵的盟友”微軟被曝出計劃砸1000億美元建造名為“星際之門”的AI超級計算機。

不過,在硬件和芯片計劃外,過去一年之中,OpenAI也還在下一盤全球化的棋局。

今年1月,Altman開啟自己的韓國之旅,與韓國芯片巨頭三星、SK探討合作的可能。近期,Altman還前往日本與日本首相岸田文雄會面,並表示OpenAI正在考慮將日本作為其亞洲首個辦事處。奧爾特曼在東京對當地記者表示:“看到這項技術在日本得到采用真是令人驚奇。”據“矽基研究室”不完全統計,除日本外,OpenAI目前在倫敦和都柏林分別設立國際辦事處。


不過,在GPT-5以及種種野心計劃外,擺在OpenAI眼前的,還有諸多需要解決的新麻煩。

如上文提到的“模型變懶”,OpenAI究竟是繼續縫縫補補舊模型,還是提早放出GPT-5的大招,還尚未確定。

另一個新麻煩則是數據問題。視頻巨頭YouTube就在近期開戰OpenAI,其表示,如果OpenAI在未經許可的情況下使用其視頻來開發文生視頻模型Sora,將違反YouTube的規則。OpenAI首席技術官Mira Murati在接受采訪時表示,她不知道Sora是否接受過YouTube視頻訓練,公司也沒有透露數據來自哪裡。

《紐約時報》在近期的一則報道中,揭開OpenAI上述數據的來源。時間撥回2021年底,OpenAI需要更多的數據,為此研究人員創建一款名為Whisper的語音識別工具,該工具可以轉錄YouTube視頻中的音頻,生成新的對話文本,盡管一些的OpenAI員工討論此舉可能違反YouTube的規則,但最終還是轉錄超過100萬小時的YouTube視頻。OpenAI並未立即回應上述媒體的評論。

大算力與大數據的Scaling Law奠定OpenAI所有工作的基礎。但如今,數據的獲取與使用問題是包括OpenAI在內的人工智能企業必須要面臨的問題,這涉及兩個層面,一是商業層大公司間的競爭,更優質的用戶數據決定模型的性能。二是社會層的用戶隱私問題,這些科技公司必須要為用戶隱私的安全性負責。

數據問題外,不可忽視的還有人們對科技公司情緒的變化。據《The Information》數據,當前人工智能初創企業估值可能正在從峰值回落,回歸現實。初創公司市盈率的下降反映出人們對人工智能初創公司前景並沒有想象中那麼樂觀。更多投資者想要知道的是,隨著業務邊界的拓展,當這些初創企業拿到更多的錢時,除如何花錢外,它們如何賺錢,如何應對更激烈的競爭,這些問題顯得更為重要。


對OpenAI來說,他們或許更需要回應GPT-4變懶的問題,更好的產品體驗依舊是核心護城河。正如論壇內一位用戶所言:“如果有更好的產品,我會像在燃燒的船上一樣跳船。”OpenAI在造一艘更大的船,但它的用戶此刻可能正在選擇離開。


相關推薦

2023-12-12

解釋其變懶的原因。上周OpenAI收到用戶的投訴,稱在使用ChatGPT或GPT-4 API時遇到回應速度慢、敷衍回答、拒絕回答、中斷會話等問題。OpenAI承認這一問題,並表示將妥善修復。OpenAI先前解釋稱,GPT- 4 變懶的原因在於自 11 月 11 日

2024-01-27

OpenAI的GPT-4大語言模型遭到部分用戶投訴稱,他們在使用ChatGPT或GPT-4 API時會遇到高峰期速度非常慢、敷衍回答、拒絕回答、中斷會話等一系列問題。除將發佈新的GPT-4 Turbo預覽模型外,OpenAI還宣佈計劃在未來幾個月內向公眾推出

2023-02-07

作為OpenAI的重要投資者,微軟在ChatGPT技術上落地的進度很快,兵傢必爭的搜索引擎上現在也有消息。上周,theVerge等媒體報道使用人工智能ChatGPT的“新版必應”界面。在 2 月 3 日早晨,一部分必應(Bing)用戶報告說搜索引擎的

2023-11-17

ChatGPT可能要上新一項重大功能。那就是記住你之前的聊天內容並不斷從中學習(並非單純保存歷史記錄),從而解你的偏好和信息,用於在日後聊天派上用場。比如你可以給它下達一句“始終用python寫代碼”的命令,那麼之後

2023-11-10

開發者大會OpenAI DevDay上,OpenAI宣佈,推出自定義版本的ChatGPT,這種由用戶定制版本的ChatGPT都簡稱為GPT。從周二當天開始,用戶可以打造自己的GPT,並且公開分享。OpenAi還推出功能更強大、速度更快的GPT-4 版本GPT-4 Turbo。評論稱

2024-03-14

資深機器人專傢EricJang不久前曾預言:“ChatGPT曾在一夜之間出現。我認為,有智慧的機器人技術也將如此。”他或許說對。北京時間3月13日深夜,一段人形機器人的視頻開始在X上熱傳。之前從未展示過機器人方向能力的OpenAI,

2023-03-16

振奮的是,GPT-4有強大的識圖能力,可以解讀圖片。過去ChatGPT能做到的,新模型做得更好;ChatGPT做不到的,新模型也可以做到。開通ChatGPT Plus的付費用戶已經可以選擇GPT-4模型,其他用戶則可以加入候補名單等待。但目前Plus用

2024-02-28

著AI在搜索技術中的角色將被進一步加強。一年多以前,ChatGPT 的推出標志著搜索產品即將迎來重大變革,它通過對話式交互為用戶提供一種全新的方式來查詢信息,展示 AI 在理解自然語言和生成回答方面的強大潛力。此外,如P

2023-03-24

當地時間3月23日,OpenAI宣佈ChatGPT能夠支持第三方插件接入,這些插件是專門為“以安全為核心原則的語言模型設計的工具”,可幫助ChatGPT訪問最新信息、運行計算或使用第三方服務。OpenAI將插件稱為語言模型的“耳目”。由於C

2023-03-25

個互聯網需要多久?OpenAI告訴你,四個月。自從去年11月ChatGPT正式發佈以來,OpenAI團隊更新AI產品和技術的速度快到已經突破人們的想象。就在剛剛宣佈推出能力更強大的GPT-4之後,不留給競爭對手任何喘息的時間,聯網版的ChatG

2023-02-15

2月15日消息,據知情人士透露,在AI聊天機器人ChatGPT發佈前的幾個月裡,其開發者OpenAI悄悄雇傭至少5名谷歌AI研究人員。他們在幫助改進ChatGPT方面發揮重要作用,並支持其在2022年11月份推出。谷歌擁有世界上最著名的兩個AI研究

2023-04-18

局移動端或是重要一環。其公司招聘頁顯示,OpenAI正招募ChatGPT移動終端工程經理,“我們正在尋找一位經驗豐富的工程師來幫助建立和領導ChatGPT移動團隊。”該領導崗位的年薪在30萬美元至50萬美元間,還包括“慷慨”的股權贈

2023-01-16

1月16日消息,最近人工智能初創企業OpenAI開發聊天機器人ChatGPT成為投資者眼中的香餑餑,微軟正準備向OpenAI增投100億美元。但目前的問題是還不清楚這項技術到底可以開發出什麼產品,也不知道能否實現盈利。當人們問聊天機

2023-01-21

板的人力資源計劃。不知從何開始,生成式人工智能程序ChatGPT已悄悄從休閑娛樂領域滲透到辦公室裡,正在顛覆企業當前的辦公方式。本月,雇主評論網站GlaSSDoor旗下的社交平臺Fishball對近4500名專業人士進行調查,其中近30%的