傳聞OpenAI即將推出多模態人工智能數字助理


據TheInformation最新報道,OpenAI已經向一些客戶展示一種新的多模態人工智能模型,它既能與人對話,又能識別物體。該媒體援引未具名消息人士的話稱,這可能是該公司計劃在周一展示的內容的一部分。

圖片.png

據報道,與現有的獨立轉錄和文本到語音模型相比,新模型能更快、更準確地解讀圖像和音頻。它可以幫助客服人員"更好地理解來電者聲音的語調或他們是否在諷刺",而且"理論上",該模型可以幫助學生學習數學或翻譯現實世界中的標志。

該媒體的消息來源稱,該模型在"回答某些類型的問題"方面可以超越 GPT-4 Turbo,但仍然容易十分自信地輸出錯誤答案。

據開發者 Ananay Arora 稱,OpenAI 可能還在準備新的內置 ChatGPT 電話功能,他發佈上述與通話相關的代碼截圖。阿羅拉還發現有證據表明,OpenAI 已經為實時音頻和視頻通信配置服務器。

公司首席執行官山姆-奧特曼(Sam Altman)明確否認即將發佈的消息與這款據稱比 GPT-4"更好"的模型有關,傳聞中的GPT-5 可能會在今年年底公開發佈。

奧特曼還表示,公司不會宣佈新的人工智能搜索引擎。但如果《The Information》所報道的內容屬實,那麼Google的 I/O 開發者大會仍有可能因此受到影響。Google一直在測試使用人工智能打電話。傳聞中的一個項目是多模態Google助手的替代品"Pixie",它可以通過設備的攝像頭觀察物體,並提供購買建議或使用說明。

OpenAI 計劃於周一上午 10 點(太平洋時間)/下午 1 點(美國東部時間)在其網站上通過現場直播的方式發佈新服務。


相關推薦

2023-11-16

功能,從而實現更大的可能性。多模態功能意味著微軟的人工智能將支持不同的輸入格式,包括文本、圖像等,使工具在更多應用中更加有用。此外,該公司還表示,它正在引入矢量搜索,這可以提高響應質量並減少延遲。微軟

2023-11-07

來說,剛剛可能是一夜未眠。北京時間11月7日凌晨,美國人工智能公司OpenAI的開發者大會正式開啟,創始人SamAltman在臺上和同事,隻用45分鐘時間,就“轟”出團隊最新的成果GPT-4Turbo,後者不僅更快、有更長的上下文、而且更好

2023-12-07

早前有消息稱Google下一代人工智能模型雙子座發佈時間被延遲到明年年初,原因是在非英語上的表現不太好,但現在Google還是推出雙子座1.0版,而且可能確實非英語水平不太好,因為初期僅支持英語。按照Google的說法雙子座人工

2024-02-09

場回饋,那些已經花錢訂閱GPT的用戶們會不會轉投Gemini,人工智能整合進Google生態的全新究極樣貌是什麼?這些都讓人期待。今年,註定繼續是高潮迭起的AI拉鋸戰。

2023-03-10

改變業界微軟德國公司首席執行官 Marianne Janik 全面談到人工智能對業界的顛覆性影響。Janik 強調人工智能的價值創造潛力,並表示,當前的人工智能發展和 ChatGPT 是“iPhone 發佈一樣的時刻”。她表示,這不是要代替人類工作,

2023-03-10

的東西對翻譯工具也會有很大的幫助。Braun將GPT-4描述為人工智能領域的遊戲規則改變者,它將向著擁有人類的解釋能力這一目標更進一步。顯然,網友對GPT-4的發佈充滿期待。有網友還做一張GPT-4和GPT-3參數對比圖。OpenAI創始人Sa

2023-11-07

更快。全新的Assistants API,使開發人員更容易構建自己的人工智能應用程序。新的多模態功能,包括視覺、圖像創建(DALL·E 3)和文本轉語音(TTS)。OpenAI開發者大會的發佈的重要更新長上下文長上下文正在成為百模大戰的“主

2024-03-03

博士生導師,IEEE、ACM等fellow,兼任鵬城實驗室(深圳)人工智能研究中心副主任,曾任中科院計算所助理研究員、美國明尼蘇達大學訪問教授。從目前公佈的團隊名單來看,其餘成員大部分為碩士生。包括袁粒課題組的林彬,

2023-03-15

參數量,會是這樣的:但無論如何,這一次,我們離真·人工智能,更近一步。

2024-03-23

OpenAI申請商標VoiceEngine,暗示著OpenAI可能即將推出圍繞語音引擎開發的產品或者服務,很有可能是類似Siri那樣的個人助理產品。OpenAI正在申請一個新商標VoiceEngine,商標的覆蓋范圍主要是圍繞語音識別、語音合成和語音生成幾個

2023-12-07

速人類進步和改善生活的機會。我相信我們現在所看到的人工智能轉變將是我們一生中最深刻的轉變,遠遠大於之前向移動或網絡的轉變。人工智能有潛力為世界各地的人們創造從日常生活到非凡的機會。它將帶來新一波的創新

2023-03-16

中,百度獨具的四層技術棧優勢占據重要地位。人類進入人工智能時代,IT技術的技術棧發生根本性變化,從過去三層到“芯片-框架-模型-應用”四層。“而當前,百度是全球為數不多、在這四層進行全棧佈局的人工智能公司。

2024-02-19

集等方面,有望帶來內容消費市場的發展。Sora是一種由OpenAI發佈的視頻生成模型。這種模型具有強大的視頻生成能力,可以將簡短的文本描述轉化成長達1分鐘的高清視頻。Sora模型具有三大突出亮點:能夠生成60秒長視頻並保持高

2023-03-10

全不同的可能性,例如視頻。據悉,ChatGPT背後的開發商OpenAI於2018年推出具有1.17億個參數的GPT-1模型,2019年推出具有15億個參數的GPT-2,2020年推出具有1750億個參數的GPT-3,2021年推出GPT-3.5。目前的ChatGPT就是OpenAI基於GPT-3.5模型開發