胡編賽事與技術數據 Google的微軟的AI聊天機器人在超級碗“大顯身手”


如果你還需要更多證據來證明GenAI容易胡編亂造,Google的雙子座聊天機器人(前身為Bard)認為2024年的超級碗已經舉行過。它甚至還有虛構的現場技術統計數據來證明這一點。

在 Reddit 上,由Google "Gemini"GenAI 模型驅動的正在回答粉絲們有關第 LVIII 屆超級碗的問題,就好像比賽是在昨天或幾周前結束的一樣。和許多博彩公司一樣,它似乎更看好酋長隊而不是 49 人隊(抱歉,舊金山的球迷們)。

Gemini的胡編亂造頗具創意,至少有一次給出的球員數據明細顯示,堪薩斯州首席四分衛帕特裡克-馬霍姆斯(Patrick Mahomes)跑 286 碼,達陣 2 次,攔截 1 次,而佈洛克-珀蒂(Brock Purdy)跑 253 碼,達陣 1 次。

wait-superbowl-2024-already-happened-v0-naqjhg7fm0ic1.jpg

圖片來源/r/smellymonster

不隻是Gemini。微軟的Copilot聊天機器人也堅稱遊戲已經結束,並提供錯誤的引文來支持這一說法。但是,也許是出於對舊金山的偏見,它說 49 人隊而不是酋長隊取得勝利!- 它說"最終比分為 24:21",獲勝的是 49 人隊,而不是酋長隊。

Screenshot-2024-02-11-at-7.29.40 PM.png

圖片來源:Kyle Wiggers / TechCrunch

Copilot采用的 GenAI 模型與 OpenAI 的 ChatGPT(GPT-4)模型相似,甚至完全相同。不過,ChatGPT 似乎要聰明點,沒有在同一個地點翻車兩次。

Screenshot-2024-02-11-at-7.56.28 PM.png

這一切都相當愚蠢,但這也說明當今 GenAI 的主要局限性,以及過於信任它的危險性。GenAI 模型沒有真正實現人工智能。這種文本模型通常從公共網絡上獲取大量的示例,根據這些示例的模式(包括周圍數據的上下文)來學習數據(如文本)出現的可能性。

這種基於概率的方法在一定范圍內效果顯著。不過,雖然單詞的范圍及其概率很可能會產生有意義的文本,但這還遠不確定。例如,LLM 可以生成語法正確但毫無意義的內容,也可能大放厥詞,傳播訓練數據中的錯誤。

超級碗賽事的虛假信息當然不是GenAI走火入魔的最有害的例子。這可能與支持酷刑、強化民族和種族成見或令人信服地撰寫陰謀論有關。不過,這也是一個有用的提醒,提醒我們仔細檢查 GenAI 機器人的言論。它們很有可能不是真的。


相關推薦

2023-02-09

規模發放到用戶手中體驗。之前人們所關心的問題,比如胡編亂造、大規模使用的成本問題,目前還隻停留在討論階段。成本是必然需要面對的因素。據解,Google未來會優先使用輕量級版本的 LamDA,就是出於計算成本的考慮。此

2023-02-09

規模發放到用戶手中體驗。之前人們所關心的問題,比如胡編亂造、大規模使用的成本問題,目前還隻停留在討論階段。成本是必然需要面對的因素。據解,Google未來會優先使用輕量級版本的 LamDA,就是出於計算成本的考慮。此

2023-03-10

於下周問世!果然,OpenAI的效率不會令人失望。盡管許多技術消息還在保密,但一個關鍵細節已經被透露:GPT-4將是多模態的。一個多模態的語言模型,這意味著什麼?微軟德國公司的技術總監Andreas Braun表示,“有GPT-4,AI就有

2023-02-18

微軟+OpenAI打來的一記組合拳。微軟最近官宣要把類ChatGPT技術嵌入必應搜索引擎和自傢的Edge瀏覽器中。因為展現形式可能被顛覆,搜索界要迎來代際變革已成共識。想想當年諾基亞是怎麼糊的,谷歌立刻拉響“紅色警戒”,火速

2023-02-23

軟也宣佈新的必應搜索,它自己的聊天機器人結合微軟的技術和OpenAI的技術,後者是ChatGPT背後的公司。然而,所有這些聊天機器人技術的一個重要方面,這些公司都沒有談及那麼多,那就是其運營成本。路透社的一份新報告就

2023-02-08

的“T”代表“Transformer”模型,這也是Google發明的一種AI技術。而且,Google已經迅速發佈自主聊天機器人“巴德”(Bard),並要求員工們要拿出在內部進行黑客馬拉松的精神來測試它。除Google,百度也確認正在研發一款AI對話式聊

2023-03-15

、Office和其他地方的人工智能功能方面可能的發展方向。Google剛剛宣佈自己的計劃,將類似ChatGPT的人工智能添加到Gmail和Google Docs中,允許Google Workspace用戶自動生成電子郵件、文檔等。微軟預計將在周四的工作用人工智能活動中

2023-04-11

工試圖阻止該公司推出自己的AI聊天機器人,他們認為該技術會產生“不準確和危險的陳述”。幾個月前,微軟的倫理學傢也提出類似的擔憂。他們認為,這種AI聊天機器人將令用戶批判性思維的退化,同時可能會充斥虛假信息

2023-02-20

關於傳統搜索引擎的回答。/鳴謝:Ivan可以預見,嵌入GPT技術的新式搜索引擎,將會直擊傳統搜索引擎的痛點,打破信息壁壘。私人AI助手幫助總結全網最有價值的信息,這很有可能解決當今信息爆炸時代“信息過多”與“註意

2023-03-14

的具體成本,但他說"可能會大於"幾億美元。這項技術讓OpenAI發佈ChatGPT,這一具有強大語言天賦的聊天機器人在11月上市後幾天內就吸引100多萬用戶,現在正被拉入其他公司的商業模式,從億萬富翁對沖基金創始人Ken Griff

2023-03-16

廣泛興趣,他們都希望將OpenAI的ChatGPT聊天機器人的底層技術整合到自傢產品中。但是微軟Azure OpenAI服務的新客戶卻要面臨很長的等待時間。硬件資源短缺的核心問題在於,GPT-4等新的AI大模型需要在GPU上運行,這種服務器芯片可

2023-02-13

30分(北京時間周一早7點30分),美國第57屆“超級碗”賽事正式開幕。在觀看當晚的開幕式和比賽之後,預計將有創紀錄的1880萬美國人在周一缺勤。這一現象已經被越來越多地稱作“超級病假星期一”人力資源組織UKG的勞動力

2023-10-26

僅130億美元的投資,與最具潛力、實力最強的AI初創公司技術和所有權的雙重深度綁定,五年時間將最先進的AI技術融入幾乎所有產品中,不費吹灰之力走在時代的最前端並取得統治地位,足以被載入企業轉型的教科書中。周三

2024-02-13

衛冕!超級碗多年來已經成為全美收視率最高的電視轉播賽事,其中廣告更是“寸秒寸金”。今年拼多多旗下跨境平臺Temu大手筆買兩個時段的超級碗廣告,廣告詞是“ShoplikeaBillionaire”(像億萬富豪一樣購物)。 去年的2月13日