無論是公開場合還是媒體爆料,盡管OpenAI創始人SamAltman已多次劇透GPT-5的相關消息,但與這位創始人浮出水面的硬件、算力等野心相比,眼下最棘手的問題是—ChatGPT的一群忠實用戶們,正在發現GPT-4正在變得越來越“懶”。
所謂的“變懶”指的是ChatGPT的個人用戶體驗。近期,在OpenAI在線論壇上,不少用戶正在抱怨GPT-4性能下降,包括推理變差、響應變慢等。一位用戶甚至直言:“ChatGPT已經完全無法使用,今天我在等待答案的同時居然煮咖啡。”
與變懶的GPT-4相比,OpenAI對外正在講述更多的“既要又要”的商業化故事,加速變現。
一是在ChatGPT這一對話式產品上,一面尋找更多的個人用戶,如幾天前開放免登錄使用,爭搶更多的流量和數據。另一面則是面向企業端的商業化前景。ChatGPT首席運營官Brad Lightcap就在近期透露,已有60萬用戶正在ChatGPT的企業級產品(包括ChatGPT Enterprise和ChatGPT Team)。Brad Lightcap稱,92%的財富500強公司正在以某種形式使用ChatGPT,每周有1億人積極使用ChatGPT。二是圍繞硬件、算力和全球化上的佈局。
對OpenAI來說,“既要又要”是某種必然,“模型變懶”也是其加速變現和跑馬圈地所帶來的直接結果。隻不過,對Sam Altman和他的OpenAI來說,至少在拿出GPT-5前,需要解決的問題和麻煩還有很多。
“我曾經是一名OpenAI的佈道者,總是告訴大傢GPT有多棒以及該如何使用它。但現在我不再推薦它,因為它已經變得很難有效使用。”一位用戶近期在OpenAI在線論壇上這樣寫道。
一些忠實用戶選擇放棄使用GPT-4 圖源:OpenAI論壇
今年3月中旬,在一篇名為《How to deal with “lazy” GPT-4》的帖子下擠滿OpenAI變懶的“受害者們”。他們發現在使用ChatGPT的過程中,響應速度越來越慢,且回答問題的準確性也不及預期。
一部分個人使用者對OpenAI產生不滿 圖源:OpenAI論壇
有的人抱怨,GPT-4沒有遵循他們給出的指令,當用戶需要它給出完整的代碼時,GPT-4會給出帶有占位符(placeholders)的截斷代碼。當要求它給出用於更新代碼的示例時,也更容易出錯。有的人則發現,ChatGPT的廢話也越來越多,在被問及它的“來源”、它的背景以及它如何產生答案時,GPT-4現在變得更加難以捉摸。還有的用戶更是直接吐槽起它的響應速度:“今天我在等待答案的同時居然煮咖啡。”
開發者抱怨GPT-4變懶 圖源:OpenAI論壇
事實上,這並不是ChatGPT第一次變懶。
早在去年7月,很多用戶就在社交媒體和OpenAI開發者論壇裡表達自己的不滿,變懶、變笨的GPT-4出現邏輯弱化、錯誤響應、難以遵循指令、隻記住最近的提示等問題。今年年初,更多的投訴下,Sam Altman直接承認GPT-4“一直在偷懶”這一事實,並表示自己“已經發佈修復程序來解決投訴”。
Sam Altman承認GPT-4“偷懶” 圖源:X
眼下,這一輪的“變懶抱怨”似乎沒有等來OpenAI的回復。社區之內的ChatGPT用戶們正在討論GPT-4變懶的原因以及自己尋找解決上述問題的方法。“它曾經很聰明,現在確實一個徹頭徹尾的白癡”“我感覺自己被騙”,社區內的憤怒情緒正在增加。
對於“變懶”的原因,用戶甚至猜測OpenAI是不是將背後的模型偷偷換成GPT-3.5,還有的則認為OpenAI正在將更多的精力放在其“企業級客戶”上,而非“平民”上。
用戶的抱怨和吐槽GPT-4性能下降其實反向印證兩點,一是目前用戶對GPT-4已積累下用戶心智,他們迫切希望OpenAI推出新的產品。二是,這很有可能是OpenAI發佈的GPT-5的重要時機,AI天使投資人Allie K. Miller就表示:“他們(OpenAI)有用戶基礎,有訂閱,如果他們發現用戶下降,或許將發佈更新版本的模型,時機是關鍵。”
對OpenAI來說,一個不太好的跡象是,隨著GPT-4變懶,即便是它的忠實用戶們,也開始尋找替代方案。
在上述抱怨OpenAI變懶的帖子下,不少用戶就提到至少在編碼能力上,Anthropic的Claude Opus 3顯得可靠,在實際使用的性能方面似乎也與GPT-4 不相上下。在截至3月29日的Chatbot Arena排行榜上,Claude Opus 3就打敗GPT-4,占據第一位置。
截至3月29日,Claude Opus 3打敗GPT-4,位列第一 圖源:Hugging Face
在過去人工智能的模型競逐中,各類科技企業“追趕GPT-4”已成為共識,各類評測和跑分表中“與GPT-4對比”也成鐵律。而Chatbot Arena排行榜的來源則來自用戶實打實的投票,在用戶體驗端Claude Opus 3暫時跑贏GPT-4,也說明至少在個人用戶眼中,OpenAI所謂的用戶護城河並不牢固。
榜單之上,除老對手Anthropic的Claude、Google的Gemini外,被稱為“法國OpenAI”,主打MoE架構的Mistral AI 的名字也赫然在列。此前Mistral-Medium這一“中杯版”模型就因開源和強大性能十分受開發者的擁躉,而此前在2月底發佈的“大杯版”Mistral Large更是直奔著OpenAI的GPT-4去,順便還官宣和微軟的閉源合作。
前有狼後有虎,何時發佈GPT-5也還未有定論,OpenAI手中餘糧又還有多少?
OpenAI和Sam Altman自然也沒有閑著,剛剛結束的2024年Q1,這傢全球最火熱的人工智能初創企業的日程表上寫三件事:一是尋找AI的下一個入口,二是更大的算力野心,三是全球化之路。
首先,尋找AI的下一個入口,也就是OpenAI野心勃勃的硬件計劃。除此前出圈的人形機器人Figure 01外,據外媒最新報道,Sam Altman正計劃和前蘋果設計師Jony Ive創立的一傢神秘公司,推出一款人工智能驅動的個人設備,更早前,Altman領投AI硬件初創企業Humane,OpenAI也在討論將其名為GPT-4 with Vision的物體識別軟件嵌入到Snapchat母公司Spectacles的智能眼鏡中。
其次,是更大的算力計劃。Altman此前在公開場合多次表明算力是掣肘模型進化的原因,AI服務器芯片數量嚴重不足。為尋求更穩定的芯片供應,除自己下場投資GPU芯片公司和成立芯片公司外,OpenAI和“最鐵的盟友”微軟被曝出計劃砸1000億美元建造名為“星際之門”的AI超級計算機。
不過,在硬件和芯片計劃外,過去一年之中,OpenAI也還在下一盤全球化的棋局。
今年1月,Altman開啟自己的韓國之旅,與韓國芯片巨頭三星、SK探討合作的可能。近期,Altman還前往日本與日本首相岸田文雄會面,並表示OpenAI正在考慮將日本作為其亞洲首個辦事處。奧爾特曼在東京對當地記者表示:“看到這項技術在日本得到采用真是令人驚奇。”據“矽基研究室”不完全統計,除日本外,OpenAI目前在倫敦和都柏林分別設立國際辦事處。
不過,在GPT-5以及種種野心計劃外,擺在OpenAI眼前的,還有諸多需要解決的新麻煩。
如上文提到的“模型變懶”,OpenAI究竟是繼續縫縫補補舊模型,還是提早放出GPT-5的大招,還尚未確定。
另一個新麻煩則是數據問題。視頻巨頭YouTube就在近期開戰OpenAI,其表示,如果OpenAI在未經許可的情況下使用其視頻來開發文生視頻模型Sora,將違反YouTube的規則。OpenAI首席技術官Mira Murati在接受采訪時表示,她不知道Sora是否接受過YouTube視頻訓練,公司也沒有透露數據來自哪裡。
《紐約時報》在近期的一則報道中,揭開OpenAI上述數據的來源。時間撥回2021年底,OpenAI需要更多的數據,為此研究人員創建一款名為Whisper的語音識別工具,該工具可以轉錄YouTube視頻中的音頻,生成新的對話文本,盡管一些的OpenAI員工討論此舉可能違反YouTube的規則,但最終還是轉錄超過100萬小時的YouTube視頻。OpenAI並未立即回應上述媒體的評論。
大算力與大數據的Scaling Law奠定OpenAI所有工作的基礎。但如今,數據的獲取與使用問題是包括OpenAI在內的人工智能企業必須要面臨的問題,這涉及兩個層面,一是商業層大公司間的競爭,更優質的用戶數據決定模型的性能。二是社會層的用戶隱私問題,這些科技公司必須要為用戶隱私的安全性負責。
數據問題外,不可忽視的還有人們對科技公司情緒的變化。據《The Information》數據,當前人工智能初創企業估值可能正在從峰值回落,回歸現實。初創公司市盈率的下降反映出人們對人工智能初創公司前景並沒有想象中那麼樂觀。更多投資者想要知道的是,隨著業務邊界的拓展,當這些初創企業拿到更多的錢時,除如何花錢外,它們如何賺錢,如何應對更激烈的競爭,這些問題顯得更為重要。
對OpenAI來說,他們或許更需要回應GPT-4變懶的問題,更好的產品體驗依舊是核心護城河。正如論壇內一位用戶所言:“如果有更好的產品,我會像在燃燒的船上一樣跳船。”OpenAI在造一艘更大的船,但它的用戶此刻可能正在選擇離開。