ChatGPT重磅更新:新增語音和圖像功能 可以看、聽、說


9月26日消息,據外媒報道,當地時間周一,美國人工智能研究公司OpenAI宣佈,其AI聊天機器人工具ChatGPT現在可以“看、聽、說”,這暗指這款廣受歡迎的聊天機器人可以同時接收圖像和語音輸入,並通過語音對話進行回復。

ChatGPT是OpenAI於2022年11月30日推出的一種新型AI聊天機器人工具,可根據用戶的要求快速生成文章、故事、歌詞、散文、笑話,甚至代碼,並回答各類疑問。

當地時間周一,OpenAI表示,將開始在ChatGPT中推出新的語音和圖像功能,新功能將於未來兩周內面向Plus和企業用戶推出。

該公司表示,新功能允許用戶進行語音對話或向ChatGPT展示其正在談論的內容。其中,語音功能將在iOS和Android平臺上推出,而圖像功能將在所有平臺上推出。不過,該公司將逐步部署語音和圖像功能。

在語音方面,新功能允許用戶進行語音對話,提供更直觀的交互方式。該功能由一個新的文本轉語音模型提供支持,能夠通過文本和幾秒鐘的語音樣本生成類似人類的音頻,且與專業配音演員合作,提供5種可供用戶自行選擇的聲音。此外,該功能還能使用開源語音識別系統Whisper,將用戶說的話轉錄成文本。

外媒報道稱,語音輸入和語音輸出功能使ChatGPT具有與亞馬遜Alexa等語音助手相同的功能。

在圖像方面,新功能允許用戶上傳圖像與ChatGPT交互,且支持上傳多張圖像。如果要聚焦圖像的特定部分,可以使用移動應用中的繪圖工具。

OpenAI表示,圖像理解由多模態GPT-3.5和GPT-4提供支持。這些模型將語言推理能力應用於各種圖像,如照片、屏幕截圖以及包含文字和圖像的文檔。

據悉,GPT-4是OpenAI在今年3月14日推出的最新一代大型語言模型。它是一個多模態大型語言模型,支持圖像和文本輸入,以文本形式輸出;擴寫能力增強,能處理超過25000個單詞的文本;更具創造力,並且能夠處理更細微的指令。(小狐貍)


相關推薦

2023-12-22

2月22日消息,據外媒報道,OpenAI宣佈向所有用戶免費開放ChatGPT語音功能。這意味著用戶可以與ChatGPT進行自然的語音對話,而無需支付任何費用。據悉,該功能於今年9月份推出,以前隻向使用iPhone或iPad的ChatGPT Plus和Enterprise用戶

2023-11-07

ChatGPT,今天裂變成無數個GPT。OpenAI在首屆開發者日上,正式公佈自定義GPT。還將上線“GPT商店”,與創作者分享收入。CEO山姆·奧特曼現場登臺演示,3分鐘不到,隻憑幾步操作做好一個“創業導師GPT”。接下來,“創業導師GPT

2023-09-26

快科技9月26日消息,OpenAI宣佈給聊天機器人ChatGPT增加語音交談的功能。這將給谷歌、蘋果等巨頭在智能語音助手領域帶來沖擊。據悉,ChatGPT可以用五個角色”來回答用戶的查詢,與Alexa和Siri等語音助手相比,它的語氣聽起來也

2023-11-22

ChatGPT的語音功能現已免費向所有用戶開放。OpenAI在X(前Twitter)上發佈一篇文章,宣佈用戶現在可以點擊耳機圖標,在移動應用中用語音與ChatGPT對話,並獲得聲音回應。今年 9 月,OpenAI 首次推出用語音和圖像提示 ChatGPT 的功能

2024-03-23

出,可能用於互動媒體、遊戲或其他應用中。這個目前在ChatGPT客戶端也有,就是用語音響應用戶輸入。機器學習基礎的自然語言和語音處理軟件:涉及使用機器學習技術進行自然語言和語音的處理、識別和分析的軟件。多語言

2023-03-15

道德邊界愈發變得不可忽視。OpenAI早期上線的聊天機器人ChatGPT用自動生成的流暢文字獲得大量關註,也讓公眾對其杜撰論文、虛構劇本的能力感到不安。要知道,ChatGPT用的還是一年多前就已經落伍的老一代技術GPT-3。相比之下

2024-02-03

廣受歡迎的生成式人工智能機器人ChatGPT現在可以在蘋果的空間計算設備VisionPro上使用。開發商OpenAI宣佈,你可以在visionOSAppStore上找到ChatGPT應用程序。該聊天機器人此前已經以應用程序形式提供給 iPhone 和 iPad,也可以通過網絡

2023-05-11

件等。在PaLM 2的加持下,此次Bard也開始真正的顯現出“ChatGPT殺手”的實力。此前Bard是基於LAMDA 開發,該模型擁有1370億種參數,但現在Bard已經全面轉用PaLM,在答案生成的數據組和更多元化的內容方面能力飛升。同時,Google將Bar

2022-10-18

三星即將正式推出的OneUI5系統更新中,將效仿Pixel新增無需聲音就能接聽電話的方式--BixbyTextCall。該功能支持通過文本來接聽來電,而Bixby助手在通話兩端的語音和文本之間進行轉錄。該功能在上線初期僅支持韓語版本,但三星

2023-09-26

快科技9月25日消息,近日OpenAI宣佈推出新版ChatGPT,增加兩項新功能:語音輸入和圖像輸入。據OpenAI稱,新功能將在未來兩周內向ChatGPT Plus訂閱用戶推出,其他人也將很快”能夠使用這些功能。語音輸入功能類似於手機上的語音

2023-09-29

快科技9月29日消息,ChatGPT在25日正式推出全新版本,現在可以看、聽、說”。新的版本支持語音進行操作和溝通,通過新型文本轉語音模型和語音識別系統實現,允許用戶進行語音對話,並且提供5種不同的語音選擇,iOS和安卓AP

2023-11-07

92%的財富500強公司正在使用我們的產品進行構建,而現在ChatGPT每周活躍用戶大約有1億。”北京時間11月7日凌晨,在OpenAI的首次開發者大會上,SamAltman公佈過去一年中OpenAI的驕人成績。“今天,有大約200萬開發者在使用我們的API

2023-01-17

和應用程序的類似競爭中,讓這傢軟件巨頭領先於谷歌。ChatGPT可以驚人地根據提示或查詢生成類似人類對話的文字,自去年11月底啟用以來,已在互聯網上引起轟動,不到一周時間就積累首個100萬用戶。它模仿真人說話和寫作的

2023-11-06

就在OpenAI為其首次開發者大會做準備之際,一個重要的ChatGPT進展泄露。據TheDecoder報道,泄露的截圖和視頻顯示,自定義聊天機器人創建器具有許多與使用GPT-4的ChatGPT相同的功能,如網頁瀏覽和數據分析。OpenAI顯然還將開辟一個