GPT-4慘遭削弱 偷懶摸魚絕不多寫一行代碼 OpenAI已介入調查


GPT-4再次遭網友“群攻”,原因是“懶”得離譜!有網友想在Android系統開發一個能夠與OpenAIAPI實時交互的應用。於是把方法示例鏈接發給GPT-4,讓它參考用Kotlin語言編寫代碼:


沒成想,和GPT-4一來二去溝通半天,GPT-4死活給不出一個能正常運行的完整代碼。

反而解釋一通“應該怎麼做”。

這讓網友著實惱火,發推文吐槽“兩周前能寫好的代碼,現在卻不行”。


結果一下子炸出來更多網友:

終於有人調查這事兒。


大夥兒連連表示遇到類似問題:


據網友所述,似乎從11月6日GPT-4大更新起,就開始出現這種情況。

目前有OpenAI員工出面回應,表示已將問題反饋給團隊。

隻要代碼,完整代碼!

也難怪網友會“破防”,就說上面網友把方法示例鏈接發給GPT-4,讓它用Kotlin語言編寫代碼之後。

GPT-4給出的回復是這樣嬸兒的,足足列7條步驟,都在解釋“應該怎麼做”:


直到最後才給出代碼,但隻是一個基礎“模版”:


網友起初還比較有耐心,告訴它“不需要解釋,隻要給我代碼,完整的代碼,能100%正常運行的代碼”:


結果GPT-4張口又在解釋、舉例子:


網友氣不打一處來,直接打斷它,並再次強調“不要解釋,給我代碼”:


GPT-4這下可是真真明白,把上面那個模版稍微改動一下,就發出來:


這才有開頭的一幕,網友無奈發帖吐槽。


對於GPT-4的回復,網友“怒吼”一句:他們都對你做什麼?抱歉你被削弱。


GPT-4此刻也是一臉無辜。

陸陸續續出來吐槽的網友中,更有甚者表示已經不用ChatGPT。


AI圖像編輯器dingboard CEO@kache (yacine)在前一天也發帖吐槽,瀏覽量達157000+:

在過去的一個半星期裡,我一直在編寫“幼稚”的代碼,因為GPT-4不那麼遵循指令。


巧不是,如果按網友所說的“一個半星期”來算,時間還和奧特曼·真還傳事件吻合。

kache (yacine)還有一條帖子滿滿都是情緒,“請把舊的GPT-4還給我”:


這位網友表示“我懂你”:

以前它能做出很好的猜測,現在它會給我十個理由解釋為什麼它不能做出好的猜測。

上周,我對著聊天框大喊“f*ing do it!!”的次數創下歷史新高。


一時間,GPT-4的“懶惰”成為眾多網友“討伐”對象。

沃頓商學院教授Ethan Mollick也看不下去,親自上手測試一下,結果似乎表明這是真的。


Ethan Mollick重復一系列之前用代碼解釋器(Code Interpreter)做過的分析。


GPT-4雖然知道該怎麼做,但會一直提示“去完成工作”。導致原本的一個步驟變成許多步驟,而且有些步驟很奇怪。


這下Ethan Mollick也是無語住。

GPT-4到底是怎麼?背後原因還不得而知,網友們也是紛紛猜測起來。

OpenAI員工:已反饋給團隊

Ethan Mollick還是很嚴謹,認為即便如此也不足以證明GPT-4變得越來越笨,他推測這可能是系統負載過高的暫時問題。


如果你是在手機(移動設備)上遇到這種問題,那可能是因為手機版系統提示的原因,會指示ChatGPT生成更簡短精要的答案。

我的測試是在網頁版進行的。


Reddit上也有人發文討論,其中有一篇帖子指出“並不是新版GPT-4懶,隻是我們用錯”:


文中指出,GPT-4自本月6號進行一次大更新後,基礎版本沒有自定義提示,這就導致GPT-4沒有預定義的“路徑”來指導其行為。

這讓它非常通用,但默認設置下它的輸出也有些“無方向”。

解決辦法之一,就是使用更新後提供的自定義GPT新功能(GPTs),為每項工作設置一個專門的GPT。

也相繼有網友分享“小妙招”:

新版GPT-4改變遊戲規則的一點是它能一次性解釋的代碼量。明確地說出類似“請完整地寫出這個測試”的指令,可能會有用。

同時,明確指出“不要重寫已經寫過的代碼”也很有幫助,這樣可以節省token,讓模型專註於產生新的輸出。

我還發現,加入“一步一步思考”的提示會在開始時增加一些計劃性的文本,這有助於後續輸出更好地定位上下文。


但也有網友表示自己在用的時候,無論如何都會留下一些“待辦事項”:


這位網友更是直言GPT-4現在像是得老年癡呆:

OpenAI暗示的是新版GPT-4非常善於遵循指令,但事實並非如此。

我從一開始就一直在使用GPT-3、3.5再到後來的4,從未見過這種程度的阿爾茨海默癥。


在網友的激烈吐槽下,OpenAI員工也出面回應。

起初是讓網友們提供一些具體的例子,說是研究一下,很有可能在下次模型版本迭代中修補這些問題。


此話一出,炸出更多網友“上報故障”。


will depue再次回應:

感謝反饋,在這裡的所有示例都會幫助我們更快地解決這個問題。我剛剛將其轉發給團隊,後續消息會及時通知。


看來官方後續回應還要再等一波,傢人們最近有遇到類似情況嗎?

參考鏈接:

[1]https://twitter.com/erhartford/status/1729566883350012038

[2]https://chat.openai.com/share/38e5ec71-a155-4d92-a85c-4b9e598a07fb

[3]https://x.com/emollick/status/1729358803425001702?s=20


相關推薦

2024-04-08

今年年初,更多的投訴下,Sam Altman直接承認GPT-4“一直在偷懶”這一事實,並表示自己“已經發佈修復程序來解決投訴”。Sam Altman承認GPT-4“偷懶” 圖源:X眼下,這一輪的“變懶抱怨”似乎沒有等來OpenAI的回復。社區之內的Chat

2024-02-06

此前消息稱,ChatGPT的運行速度在2024年開局變得緩慢,但奧特曼表示,現在的AI模型已經度過冬季的低迷期。他在X上的一篇帖子中寫道:“GPT-4在新的一年裡步伐減緩,但現在應該不那麼“懶惰”。”一位開發者曾暗示,ChatGPT可

2023-03-31

中心”(CAIDP)今日要求美國聯邦貿易委員會(FTC)禁止OpenAI發佈新的商業版GPT-4。本月早些時候,OpenAI發佈最新的GPT-4生成式人工智能多模態模型,在各種專業和學術的標準測試中表現出人類水平的性能。但同時,GPT-4的強大也

2024-01-31

老板。未來人們的工作方式將被完全改變。讀論文+復現代碼一條龍已經用上新功能的網友們搭配不同GPTs玩出不同花樣。長期霸占“趨勢榜”前十的論文解讀工具Ai PDF和編碼工具Grimoire就擦出這樣的火花。先@Ai PDF解讀事先準備好

2023-03-03

。直到三個月後,OpenAI才在GitHub上發佈該模型,並表示這一行動是“負責任地發佈人工智能的一個重要基礎,特別是在強大的生成模型方面”。調查記者Karen Hao在2020年期間在公司內部待幾天,根據他的說法,OpenAI的內部文化開

2023-03-03

。直到三個月後,OpenAI才在GitHub上發佈該模型,並表示這一行動是“負責任地發佈人工智能的一個重要基礎,特別是在強大的生成模型方面”。調查記者Karen Hao在2020年期間在公司內部待幾天,根據他的說法,OpenAI的內部文化開

2023-03-03

。直到三個月後,OpenAI才在GitHub上發佈該模型,並表示這一行動是“負責任地發佈人工智能的一個重要基礎,特別是在強大的生成模型方面”。調查記者Karen Hao在2020年期間在公司內部待幾天,根據他的說法,OpenAI的內部文化開

2023-03-21

對此做出反應、如何監管、如何處理,留給全社會的時間不多。”在評論掌握人工智能技術就可能“統治世界”的觀點時,阿爾特曼說:“這肯定是一個讓人不寒而栗的說法。”“相反,我希望的是,我們不斷開發出越來越強大

2023-04-22

競品OpenAI的Bard人工智能,終於擁有幫助用戶生成並修正代碼的能力。谷歌生成式模型的首席產品經理PaigeBailey表示,自從Bard問世以來,用戶反饋中呼聲最高的功能就是“寫代碼”。這個願望在今天終於實現。(來源:谷歌Blog)B

2023-11-07

建一個這樣的 GPT,本質上,用戶能夠定制的功能其實並不多:指令(預設的 prompt),外設的知識庫和動作。但是,能把三者絲滑地結合起來,讓一個不懂代碼的人也能更簡單地創建應用,確實是此次 Open AI的創舉。GPT 發佈後,

2024-03-05

務上,誰寫的代碼好先不說,Claude 3至少不會像GPT-4一樣偷懶。還有體驗到Opus的玩傢,在線給模型挖坑,可opus硬是完美躲避不上當:初看這效果,感覺還行。這時候應該艾特OpenAI:GPT-5在哪裡?好,感興趣的朋友,可以戳下方鏈

2023-11-24

Szymon Sidor同樣參與過Dota 2項目,個人簡介是“正在造AGI,一行代碼接一行代碼”。在路透社的消息中,提到給Q*提供龐大的計算資源,能夠解決某些數學問題。雖然目前數學能力僅達到小學水平,但讓研究者對未來的成功非常樂

2024-04-22

描述後,學會利用漏洞攻擊,而其它模型成功率為0。91行代碼、1056個token,GPT-4化身黑客搞破壞!測試成功率達87%,單次成本僅8.8美元(折合人民幣約63元)。這就是來自伊利諾伊大學香檳分校研究團隊的最新研究。他們設計一

2023-11-14

世超平時會看的網站。有一說一,這都能當平時找選題時偷懶的工具,既能總結大新聞,還能學學 Rap 樂呵樂呵……當然,也有比較正經的實用工具,體驗一圈世超比較心水的有下面這個,直接輸入城市,就能生成一張這個城市