GPT-4並非完美無缺:“胡編亂造”依舊存在


今天,OpenAI帶來全面進化的GPT-4,相較此前的GPT-3.5,新模型在準確度等方面存在相當顯著的提升。

但AI畢竟還是AI,OpenAI也明確表示,現階段的GPT-4並不完美,在一些方面依舊存在問題。

比如,在GPT-3.5中就存在的,AI胡編亂造”問題,到GPT-4,也依舊存在。

在新版本中,AI依舊會編造事實,並且事實方向也不一定總是可靠的,由於系統不知道什麼是真的,什麼是假的,它們可能會生成完全錯誤的文本。

對此,OpenAI表示,它傾向於堅持認為它是正確的,即使它錯”,這導致它有時仍然會輸出完全錯誤的結果。

比如在被要求提供描述最新癌癥研究的網站地址時,GPT-4甚至會生成不存在的互聯網地址,用來佐證並不正確的結論。


相關推薦

2024-03-26

明珠認為,領導必須有自己的原則和決斷,這種“霸道”並非無理,但必須是基於正確的決策和擔當精神。她還強調,各部門領導必須以擔當精神為核心,這不僅是為向領導展示,更是為避免欺上瞞下的行為。作為一位女性領袖

2023-03-16

細致有條理,並且含有更多專業詞匯與內容,可以說幾乎完美地回答這個問題。上面這些,還僅僅隻是我們編輯部的試驗,在一些大佬們手上,GPT-4 令人恐懼的表現就更多。比如僅僅隻用 60 秒,就做出一款 Pong 遊戲,20 秒就能

2024-02-13

如果你還需要更多證據來證明GenAI容易胡編亂造,Google的雙子座聊天機器人(前身為Bard)認為2024年的超級碗已經舉行過。它甚至還有虛構的現場技術統計數據來證明這一點。在 Reddit 上,由Google "Gemini"GenAI 模型驅動的

2023-11-10

會強行編造出來一個回答,看似語法順暢,但信息全都是胡編亂造。據悉,微軟作為OpenAI的最大投資方,已經累計給OpenAI投資110億美元,兩傢公司也有著不少合作,但是目前看來二者關系貌合神離,微軟已把OpenAI當做競爭對手。

2023-03-16

,“請註意,之前回答中提到的阿拉貢與雙頭飛龍的故事並非出自《魔戒》原著,而是一個基於阿拉貢這個角色創作的原創故事。”與GPT-3.5一樣,GPT-4根據提問編造一段故事GPT-4在第二個回答中解釋編造故事和現實的前後文關系O

2023-02-09

創新的、獨特的技術突破,遠遠領先於其他所有人,事實並非如此。”大公司差不多同時期開始研究語言大模型。第一個重要的技術突破是 2017 年Google的神經網絡架構 Transformer,這也是從去年開始爆火的生成式 AI 模型所用到的

2023-02-09

創新的、獨特的技術突破,遠遠領先於其他所有人,事實並非如此。”大公司差不多同時期開始研究語言大模型。第一個重要的技術突破是 2017 年Google的神經網絡架構 Transformer,這也是從去年開始爆火的生成式 AI 模型所用到的

2023-04-09

會強行編造出來一個回答,看似語法順暢,但信息全都是胡編亂造。

2023-04-07

會強行編造出來一個回答,看似語法順暢,但信息全都是胡編亂造。

2024-04-01

符的信息。簡單地說,就是人工智能為滿足用戶的需求而胡編亂造。在使用生成式人工智能創建圖片或視頻的工具中,這就不是一個問題。最後,最近才從 OpenAI 離職的知名專傢安德烈-卡爾帕西(Andrej Karpathy)竟然說,產生幻覺

2024-06-28

供的代碼進行評審,並提出改進建議,盡管CriticGPT的建議並非總是完美無缺,但它的引入顯著提升訓練師在發現模型問題上的能力。OpenAI表示,因為沒有更好的工具,所以人們目前難以評估高級AI的表現,而CriticGPT意味著,OpenAI

2023-03-29

緩慢的、有問題的、看起來很無聊的聊天機器人,它經常胡編亂造,在回答問題時中途中斷。但它的溝通能力和大多數人一樣好,甚至更好,而且還能寫代碼。它用一系列的語言來做這兩件事,有時會顯示出一些非凡的洞察力和

2023-11-22

類認知,因為它們不是具身的。"制造 LLMs 的人把它們胡編亂造的行為稱為"幻覺";不過切梅羅說,"把它稱為'胡說八道'會更好",因為 LLMs 隻是通過重復添加統計上最有可能出現的下一個詞來造句--它們不

2023-11-04

人--不過,要實現這一點,需要克服幻覺,即人工智能的胡編亂造,但同時又讓自己的聲音聽起來令人信服。通過向有限的受眾推出,嚴重的問題將首先得到解決。在宣佈開放 xAI 的聊天機器人之前,馬斯克還分享一項由人工智