翻車的不隻谷歌?微軟必應聊天演示被指同樣存在事實性錯誤


北京時間2月15日上午消息,幾天前,谷歌聊天機器人演示活動現場翻車導致其股價當天暴跌逾7%,但微軟的演示活動同樣出現事實性錯誤。在微軟進行演示時,這項嵌入在必應搜索中的類ChatGPT技術分析Gap和Lululemon的財報。但業內人士將其給出的答案與財報原文對比後卻發現,這款聊天機器人遺漏一些數據,甚至會杜撰一些內容。


“必應AI在演示過程中給出一些完全錯誤的答案,但卻沒人註意到。”獨立搜索引擎研究員德米特裡·佈裡爾頓(Dmitri Brereton)寫道,“相反,大傢都對必應的宣傳歡欣鼓舞。”

佈裡爾頓發現,除財務數據上的錯誤外,微軟在演示中針對吸塵器規格和墨西哥旅行計劃的回答可能存在事實性錯誤。佈裡爾頓最初並不是為給微軟“挑刺”,他隻是在細致對比微軟和谷歌的答案時意外發現這些問題。

人工智能專傢稱這一現象為“幻覺”,也就是說,基於大語言模型生成的工具有杜撰內容的傾向。上周,谷歌推出一款與之競爭的人工智能工具,演示過程中同樣存在事實性錯誤——但當時的錯誤很快就被人發現。

這兩傢公司都在加緊將新型生成式人工智能整合進搜索引擎,希望在ChatGPT引爆行業熱潮後向世人展示自己在這方面的優勢。ChatGPT是去年11月由創業公司OpenAI推出的,他們已經通過微軟融資百億美元,與之競爭的Stability AI和Hugging Face等創業公司也在融資中獲得數十億美元的估值。

谷歌與微軟對待這項技術的態度差異明顯:由於擔心聲譽風險和安全問題,谷歌遲遲不願將AIGC(人工智能生成內容)技術整合進搜索引擎,而微軟卻在上周強調,有可能在短期內向部分公眾開放這項技術。

“我認為不能讓這項技術躺在實驗室裡,”納德拉說,“應該安全地推廣出去。”

但在必應AI的演示過程中,的確在公司財報數據上出現一些問題。

微軟營銷高管約瑟夫·梅赫蒂(Yusuf Mehdi)在演示過程中訪問Gap的投資者關系網站,然後讓必應AI根據這傢零售商11月發佈的第三季財報總結出“要點”。

“很酷,節約大量時間。”梅赫蒂說。

下面是微軟演示過程的屏幕截圖:



以下是這份總結中存在的錯誤:

-Gap報告的毛利率為37.4%。但在去除與Yeezy有關的費用後,調整後毛利率為38.7%。

-Gap的運營利潤率為4.6%,而非5.9%。5.9%這個數據在該公司的財報中根本沒有出現。

-調整後攤薄每股收益為0.71美元,而非0.42美元,後者同樣在財報中無法找到。Gap的財報包含一個調整後所得稅收益,約為0.33美元。

-Gap去年8月下調全年預期,並在第三季度財報中表示,“第四季度銷售額可能同比下滑個位數左右”。由此看來,全年營收應該下滑,而非“較低的兩位數增長”。並沒有營業利潤率或每股收益預期。

Gap2022財年第三季度財報
Gap2022財年第三季度財報

微軟表示,該公司知道這些錯誤,他們也預計必應AI會犯一些錯誤。

“我們知道這份報告,並且已經通過分析這一問題來改善體驗。”微軟發言人說,“我們承認仍然有一些工作要做,並且預計到該系統可能會在預覽期間犯一些錯誤,正因如此,反饋才至關重要,這可以幫助我們學習和改進模型。”

微軟隨後讓必應AI對比Gap和Lululemon的財報。梅赫蒂希望必應能將兩份財報的數據提取出來,制作成一份表格。

“看看效果多麼驚人。”他說,“就像這樣,一張表格,這個問題的答案有。可以想象一下,用其他方法需要花多長時間。”

下面是必應AI的結果:



下面是表格中出現的幾項錯誤,從利潤率開始:

-Lululemon的毛利率是55.9%,不是58.7%。

-該公司的運營利潤率是19%,不是20.7%

-Lululemon的攤薄每股收益為2美元,調整後每股收益為1.62美元,必應顯示的攤薄每股收益為1.65美元。

-Gap現金及現金等價物為6790萬美元,不是14億美元。

-Gap庫存為30.4億美元,不是19億美元。


相關推薦

2023-02-13

這些天看下來,在與GoogleBard加持的搜索引擎較量中,微軟基於ChatGPT的新必應似乎完全占據上風。但仍不禁要問,新必應的搜索結果真的無懈可擊嗎?最近有來自新加坡南洋理工大學和新加坡技術設計大學的NLP研究者深扒微軟發

2023-02-18

誇張。而這些都運行在一個由微軟服務器和數據中心組成的不斷擴大的網絡上。它本質就是一臺巨大的超級計算機,幫助OpenAI的模型處理所有交互,並從中學習。如此大規模的消費者互動,能收集海量用戶數據,推動技術產品改

2023-02-09

人工智能(AI)聊天機器人巴德(Bard)回答錯誤,Google公司“被扣”1000億美元。Google似乎在與微軟的緊張競爭中失去自己的節奏,倉促推出類ChatGPT技術隻會增加錯誤風險。2月7日,Google在宣佈其類ChatGPT服務“巴德”時,在Twitter

2023-02-20

馬上意識到它的錯誤。別看Google聊天機器人在演示現場“翻車”,導致其股價當天暴跌超7%,其實微軟的演示也並不完美。新必應分析Gap和Lululemon的財報,看起來很像那麼回事,但有人較真去讀財報,發現它不僅遺漏一些數據,

2023-02-09

,大傢都極為關註GoogleBard的首秀。怎知近日曝出的Demo大翻車,導致股票一夜之間暴跌7000億人民幣。而看微軟那邊,風景獨好。前後腳發佈新一代 AI 搜索,人們的期待卻完全反過來,不知重新來過Google會不會還搶跑。昨晚,Googl

2023-02-17

自從微軟上周發佈其新型人工智能搜索引擎必應(Bing)的早期版本以來,已有超過100萬人註冊測試這款聊天機器人。但測試者很快就發現這款聊天機器人的問題。在聊天過程中,它有時候會威脅用戶,向用戶提供奇怪而無用的

2023-02-18

(AIGC)驅動,微軟正尋求與在搜索領域所占主導地位的谷歌抗衡。一位不願透露姓名的廣告高管表示,在本周與一傢大型廣告公司的會議上,微軟展示新必應的演示,並表示計劃在搜索結果的回應中允許付費鏈接。AIGC最近吸引

2023-02-09

軟在過去兩天上漲近 4%,市值重回 2 萬億美元,並在Google翻車、全球 ChatGPT 概念回調之際,盤後繼續微漲 0.5%。將Google卷入這場生成式 AI 大戰,微軟毫不掩飾自己的想法。“我們的創新,將讓Google come out and dance。我們想讓人們

2023-02-09

軟在過去兩天上漲近 4%,市值重回 2 萬億美元,並在Google翻車、全球 ChatGPT 概念回調之際,盤後繼續微漲 0.5%。將Google卷入這場生成式 AI 大戰,微軟毫不掩飾自己的想法。“我們的創新,將讓Google come out and dance。我們想讓人們

2023-04-27

。”這個解釋顯然讓納拉亞南的女兒感到很安心。微軟和谷歌正急於使用大型語言模型技術來強化搜索引擎。但有充分的理由認為,相比於提供事實性信息,這項技術更適合作為人們情感上的伴侶。聽起來可能很奇怪。但無論是

2023-02-20

軟在必應搜索中植入人工智能對話和應答技術,希望挑戰谷歌的行業主導權。知情人士稱,微軟已經和一些網絡廣告公司洽談,準備利用新版必應搜索獲得更多廣告收入。上周,微軟和多傢知名廣告代理公司進行會談。在會上,

2023-02-10

谷歌母公司Alphabet(GOOGL.US)股價周四下跌4.39%,這是通信服務類股票的一個負面例外,但這可能也體現微軟(MSFT.US)在人工智能(AI)領域似乎存在潛在的脆弱性。周三,谷歌的股價便已下跌7.7%,此前該公司在巴黎發佈的人工智能成果

2023-11-24

》報道,微軟的搜索引擎在回答關於這個世界第六大國傢的不尋常查詢時斷然說"不存在"。必應表示,這是根據多個消息來源得出的結論。據報道,關於澳大利亞不存在的陰謀論可以追溯到"平地協會"(Flat Earth Soci

2023-02-26

atGPT的流行而處於"紅色代碼"狀態,但微軟的必應人工智能正在獲得更強的勢頭,最近在科技界非常流行。你可能知道,必應搜索引擎現在使用ChatGPT背後的人工智能和微軟自己的技術來回答一些搜索查詢。微