首個支持多模態交互的機器人平臺方案!科大訊飛機器人超腦平臺2.0發佈


快科技6月27日消息,科大訊飛在今天的訊飛星火V4.0發佈會上,還揭曉機器人超腦平臺2.0項目,將以視聽融合的多模感知交互和基於大模型的機器人大腦

通過軟硬件一體的方式構建機器人新交互,將訊飛星火大模型進一步賦能機器人領域。

據悉,訊飛機器人超腦平臺解決機器人在嘈雜環境下聽、說、理解和思考的難題。

借助這套系統,機器人不僅能實現語音識別、自然語言處理等基礎功能,還具備人像識別唇形識別等多種感知能力。

這套系統甚至還能夠在人流密集、環境嘈雜的服務場景中精準捕捉到用戶的聲音,並運用訊飛星火大模型深入分析客戶的自然語言語義,精確理解用戶意圖。

同時,訊飛擬人的語音技術使得機器人回復語言更具人性化,能夠與用戶進行更加親切自然的交流。

目前,科大訊飛的多模態交互系統已被廣泛應用於各種設備中,如數字人一體機、商用及傢用服務機器人等,尤其在智能傢居、智慧零售、教育等領域展現出強大的賦能作用。

隨著大模型技術的發展,訊飛機器人超腦平臺正從終端多模態交互和大模型理解決策兩個維度,構建全新的人形機器人交互方式,推動整個機器人產業的進步。

據解,訊飛星火已成為國傢能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、奇瑞汽車、中國一汽、大眾汽車、海爾集團、美的集團等多個重點行業頭部企業的大模型合作夥伴。


相關推薦

2022-11-19

,不但要以深度學習為代表的基礎算法的進展,還要研究多模態感知,多維表達以及深度理解技術。該計劃跨度長達10年,需要多個階段逐步完成,而2022年是該計劃第一階段的第一年,主要突破兩個關健算法:無監督學習和知識

2024-04-22

下星火大模型即將於4月26日推出V3.5的更新版本,將成為首個同時支持長文本、長圖文、長語音的大模型。不僅如此,此次更新還將首發星火圖文識別大模型、多情感超擬人合成、一句話復刻等功能。同時面向企業級應用市場,

2023-02-19

集度汽車宣佈將融合百度文心一言的全面能力,打造全球首個針對智能汽車場景的大模型人工智能交互體驗,證明此模式的可行性。此外,將自己最擅長的能力通過API開放給第三方,僅輸出自身最擅長的能力也不失為明智的選擇

2024-03-21

Blackwell GPU和36個Grace CPU,在NVIDIA BlueField-3數據處理單元的支持下,它能實現雲網絡加速、可組合存儲、零信任安全性以及在超大規模AI雲中的GPU計算彈性。這個系統可以被作為"單個GPU"工作,這時它能提供1.4 exaflops的AI性

2023-04-16

的。“知海圖AI”中文大模型已經運用進知乎熱榜,知乎首個大模型功能“熱榜摘要”上線並開啟內測,利用超強的語言理解能力對知乎熱榜上的問題回答進行抓取、整理和聚合,並把回答梗概展現給用戶。受此消息影響,知乎

2024-04-10

的效率水平可以延長各種Wi-Fi連接設備的電池續航。QCC730 支持Wi-Fi 6 標準,可提高傳輸距離和吞吐量。它還具有直接雲連接和與 Matter 智能傢居連接標準集成的功能。據該公司稱,這使得物聯網產品能夠與移動應用和雲服務連接

2024-03-19

的端到端平臺,用於開發、模擬和部署人工智能機器人,支持數千個機器人同步訓練與模擬。黃仁勛還表示,英偉達和比亞迪現在已經開始基於ISSAC,展開倉庫自動機器人研發方面的合作。

2024-04-03

人上不完全work,以 Transformer 為底座算法模型不能很好地支持因果關系的推理,而因果性在機器人所在的物理世界中大量出現,並在機器人操作中起關鍵作用。為處理因果性,目前有很多 world model 的嘗試。但當前的世界模型要麼

2024-04-03

人上不完全work,以 Transformer 為底座算法模型不能很好地支持因果關系的推理,而因果性在機器人所在的物理世界中大量出現,並在機器人操作中起關鍵作用。為處理因果性,目前有很多 world model 的嘗試。但當前的世界模型要麼

2023-12-07

區的英語用戶來說,Bard 現在由Google新的 Gemini 模型提供支持,Google稱該模型在很多方面都能與 OpenAI 的技術相媲美,甚至超過 OpenAI。(Google表示,"在不久的將來",Gemini 將在更多語言和國傢中使用。)Bard 現在運行的是 Gem

2023-04-08

維鏈推理,多角色多風格長文本生成,即時交互修正能力支持進化,程序代碼自動生成與輸入圖像的語義層理解。對於智能湧現背後的技術分析,劉聰提出三個判斷:第一,即使目前與世界頂尖水平有所差距,但我國有能力、可

2024-06-27

艙也同步迎來升級。據悉,升級後的星火汽車智能座艙,支持全雙工語音交互、多語種多方言免切自由交換、多情感多模態超擬人交互、多模狀態感知、內外部信源貫穿等能力。其座艙內的語音控制識別更精準,大模型業務貫穿

2023-04-12

們的功效,從而減少臨床試驗的時間和成本。GPT-5 還可以支持遠程會診和監控,改善遠程醫療的發展,讓醫療保健高效,價格也更便宜。在法律領域,GPT-5 可能會深刻的改變當前的法律應用的方向。在學習無數法律文本後,AI 可

2023-05-18

明顯提升、數學能力再升級;8月15日,代碼能力升級以及多模態交互能力提升,希望能幫助到更多的合作夥伴及開發者團隊;10月24日,將實現通用模型對標ChatGPT,中文超越ChatGPT的當前版本,英文能做到相當水平,並在教育、醫