傳聞OpenAI即將推出多模態人工智能數字助理

2024-05-12 發表於業界精選

據TheInformation最新報道，OpenAI已經向一些客戶展示一種新的多模態人工智能模型，它既能與人對話，又能識別物體。該媒體援引未具名消息人士的話稱，這可能是該公司計劃在周一展示的內容的一部分。

圖片.png

據報道，與現有的獨立轉錄和文本到語音模型相比，新模型能更快、更準確地解讀圖像和音頻。它可以幫助客服人員"更好地理解來電者聲音的語調或他們是否在諷刺"，而且"理論上"，該模型可以幫助學生學習數學或翻譯現實世界中的標志。

該媒體的消息來源稱，該模型在"回答某些類型的問題"方面可以超越 GPT-4 Turbo，但仍然容易十分自信地輸出錯誤答案。

據開發者 Ananay Arora 稱，OpenAI 可能還在準備新的內置 ChatGPT 電話功能，他發佈上述與通話相關的代碼截圖。阿羅拉還發現有證據表明，OpenAI 已經為實時音頻和視頻通信配置服務器。

公司首席執行官山姆-奧特曼（Sam Altman）明確否認即將發佈的消息與這款據稱比 GPT-4"更好"的模型有關，傳聞中的GPT-5 可能會在今年年底公開發佈。

奧特曼還表示，公司不會宣佈新的人工智能搜索引擎。但如果《The Information》所報道的內容屬實，那麼Google的 I/O 開發者大會仍有可能因此受到影響。Google一直在測試使用人工智能打電話。傳聞中的一個項目是多模態Google助手的替代品"Pixie"，它可以通過設備的攝像頭觀察物體，並提供購買建議或使用說明。

OpenAI 計劃於周一上午 10 點（太平洋時間）/下午 1 點（美國東部時間）在其網站上通過現場直播的方式發佈新服務。

傳聞OpenAI即將推出多模態人工智能數字助理

相關推薦

微軟表示即將推出帶有可視化功能的多模態GPT-4 Turbo

短短45分鐘發佈會 OpenAI如何再次讓AI圈一夜未眠

Google推出新人工智能模型雙子座(Gemini)1.0版性能甚至超越GPT-4

Gemini Ultra每月19.9刀，前兩月免費網友實測：GPT-4不香

微軟：多模態大模型GPT-4下周就出

GPT-4下周王者登基必應日活破億

ChatGPT又變強 OpenAI會變成下一個蘋果嗎？

北大發起復現Sora：框架已搭袁粒、田永鴻領銜 AnimateDiff大神響應

GPT-4發佈：ChatGPT大升級太太太太強

OpenAI可能會推出Jarvis一樣的個人助理新商標Voice Engine信息匯總

超越GPT4！谷歌大殺器終於來最大規模Gemini震撼發佈

文心一言來 ChatGPT的壓力李彥宏接住嗎

Sora概念股大漲！AI多模態應用助力內容消費市場增長

微軟德國CTO：將於下周推出GPT-4 為多模態模型