GPT-4並非完美無缺：“胡編亂造”依舊存在

2023-03-15 來自快科技發表於業界精選

今天，OpenAI帶來全面進化的GPT-4，相較此前的GPT-3.5，新模型在準確度等方面存在相當顯著的提升。

但AI畢竟還是AI，OpenAI也明確表示，現階段的GPT-4並不完美，在一些方面依舊存在問題。

比如，在GPT-3.5中就存在的，AI胡編亂造”問題，到GPT-4，也依舊存在。

在新版本中，AI依舊會編造事實，並且事實方向也不一定總是可靠的，由於系統不知道什麼是真的，什麼是假的，它們可能會生成完全錯誤的文本。

對此，OpenAI表示，它傾向於堅持認為它是正確的，即使它錯”，這導致它有時仍然會輸出完全錯誤的結果。

比如在被要求提供描述最新癌癥研究的網站地址時，GPT-4甚至會生成不存在的互聯網地址，用來佐證並不正確的結論。

相關推薦

董明珠：胡編亂造不嫌羞恥我當然要霸道但不無理

2024-03-26

明珠認為，領導必須有自己的原則和決斷，這種“霸道”並非無理，但必須是基於正確的決策和擔當精神。她還強調，各部門領導必須以擔當精神為核心，這不僅是為向領導展示，更是為避免欺上瞞下的行為。作為一位女性領袖

ChatGPT-4威力加強版上手：它很強但也有點拉

2023-03-16

細致有條理，並且含有更多專業詞匯與內容，可以說幾乎完美地回答這個問題。上面這些，還僅僅隻是我們編輯部的試驗，在一些大佬們手上，GPT-4 令人恐懼的表現就更多。比如僅僅隻用 60 秒，就做出一款 Pong 遊戲，20 秒就能

胡編賽事與技術數據 Google的微軟的AI聊天機器人在超級碗“大顯身手”

2024-02-13

如果你還需要更多證據來證明GenAI容易胡編亂造，Google的雙子座聊天機器人（前身為Bard）認為2024年的超級碗已經舉行過。它甚至還有虛構的現場技術統計數據來證明這一點。在 Reddit 上，由Google "Gemini"GenAI 模型驅動的

微軟禁止員工使用ChatGPT：擔心機密數據泄露推薦自傢Bing Chat

2023-11-10

會強行編造出來一個回答，看似語法順暢，但信息全都是胡編亂造。據悉，微軟作為OpenAI的最大投資方，已經累計給OpenAI投資110億美元，兩傢公司也有著不少合作，但是目前看來二者關系貌合神離，微軟已把OpenAI當做競爭對手。

GPT-4就是沖著賺錢來的

2023-03-16

，“請註意，之前回答中提到的阿拉貢與雙頭飛龍的故事並非出自《魔戒》原著，而是一個基於阿拉貢這個角色創作的原創故事。”與GPT-3.5一樣，GPT-4根據提問編造一段故事GPT-4在第二個回答中解釋編造故事和現實的前後文關系O

擁有一切的谷歌輸掉ChatGPT首戰

2023-02-09

創新的、獨特的技術突破，遠遠領先於其他所有人，事實並非如此。”大公司差不多同時期開始研究語言大模型。第一個重要的技術突破是 2017 年Google的神經網絡架構 Transformer，這也是從去年開始爆火的生成式 AI 模型所用到的

擁有一切的谷歌輸掉ChatGPT首戰

2023-02-09

創新的、獨特的技術突破，遠遠領先於其他所有人，事實並非如此。”大公司差不多同時期開始研究語言大模型。第一個重要的技術突破是 2017 年Google的神經網絡架構 Transformer，這也是從去年開始爆火的生成式 AI 模型所用到的

清華副教授：ChatGPT不能實現非0即1精確計算存在安全問題

2023-04-09

會強行編造出來一個回答，看似語法順暢，但信息全都是胡編亂造。

全球首例！澳洲地方市長或就誹謗信息起訴ChatGPT

2023-04-07

會強行編造出來一個回答，看似語法順暢，但信息全都是胡編亂造。

DeepMind為人工智能聊天機器人開發"事實核查器"以治愈幻覺

2024-04-01

符的信息。簡單地說，就是人工智能為滿足用戶的需求而胡編亂造。在使用生成式人工智能創建圖片或視頻的工具中，這就不是一個問題。最後，最近才從 OpenAI 離職的知名專傢安德烈-卡爾帕西（Andrej Karpathy）竟然說，產生幻覺

左腳踩右腳上天！OpenAI全新模型讓GPT-4訓練GPT-4

2024-06-28

供的代碼進行評審，並提出改進建議，盡管CriticGPT的建議並非總是完美無缺，但它的引入顯著提升訓練師在發現模型問題上的能力。OpenAI表示，因為沒有更好的工具，所以人們目前難以評估高級AI的表現，而CriticGPT意味著，OpenAI

哪些工作將被人工智能打擊得最嚴重哪些又更安全一些？

2023-03-29

緩慢的、有問題的、看起來很無聊的聊天機器人，它經常胡編亂造，在回答問題時中途中斷。但它的溝通能力和大多數人一樣好，甚至更好，而且還能寫代碼。它用一系列的語言來做這兩件事，有時會顯示出一些非凡的洞察力和

專傢答疑：為什麼ChatGPT不是真正的 "智能"？因為它不關心我們生活的世界

2023-11-22

類認知，因為它們不是具身的。"制造 LLMs 的人把它們胡編亂造的行為稱為"幻覺"；不過切梅羅說，"把它稱為'胡說八道'會更好"，因為 LLMs 隻是通過重復添加統計上最有可能出現的下一個詞來造句--它們不

xAI將於本周六向少數用戶展示其聊天機器人

2023-11-04

人--不過，要實現這一點，需要克服幻覺，即人工智能的胡編亂造，但同時又讓自己的聲音聽起來令人信服。通過向有限的受眾推出，嚴重的問題將首先得到解決。在宣佈開放 xAI 的聊天機器人之前，馬斯克還分享一項由人工智

熱門推薦