[視頻]傢務機器人更進一步:Google讓其更理解你的自然語言命令


Google母公司Alphabet正嘗試將機器人和AI語言理解兩個方面的研究整合起來,從而讓“HelperRobot”更能理解人類的自然語言命令。早在2019年,Alphabet就開始研發機器人,讓其執行諸如拿起飲料和清潔臺面這樣簡單的任務。

不過,Everyday Robots 項目仍處於起步階段,機器人的反應緩慢且沒有準確執行人類的命令。但機器人現在通過 Google 的大型語言模型 (LLM) PaLM 提高語言理解能力。目前,大部分機器人隻能對一些簡短的話語做出響應,例如“給我一杯水”。不過像 GPT-3 和 Google 的 MuM 這樣的 LLM 模型能夠更好解析命令背後的意圖。

Google 的示例中,你可以向一臺 Everyday Robots 原型提問:“我的飲料灑,你能幫忙嗎?”機器人通過可能動作的內部列表過濾此指令,並將其解釋為“從廚房拿來抹佈”。

Google 將由此產生的系統命名為 PaLM-SayCan,這個名稱捕捉該模型如何將 LLM 的語言理解技能(“Say”)與其機器人的“能力基礎”(即“Can”——通過可能的動作過濾指令)結合起來。

Google 表示,機器人在整合 PaLM-SayCan 後,在對 101 條用戶指令的測試中正確響應率為 84%,正確執行率為 74%。雖然這個數字看起來很高,但是目前我們並不知道這 101 條指令的列表,因此不清楚這些指令的限制程度。


相關推薦

2024-04-03

ld model 的嘗試。但當前的世界模型要麼完全集中在圖像 / 視頻重建上(如 Sora),要麼完全集中在高層語義理解上,缺乏適合機器人的形態。”X Square 篤定機器人大模型這個方向,一方面是基於團隊成員親歷深度學習從被質疑到

2024-04-03

ld model 的嘗試。但當前的世界模型要麼完全集中在圖像 / 視頻重建上(如 Sora),要麼完全集中在高層語義理解上,缺乏適合機器人的形態。”X Square 篤定機器人大模型這個方向,一方面是基於團隊成員親歷深度學習從被質疑到

2024-04-12

ning,代號CS285)在學生中反響極為熱烈,很受歡迎。線上視頻在油管和B站都可以觀看,廣為傳播。在這次對於新公司Pi的“創業聲明”裡他說,希望為機器人領域帶來類似“大語言模型之於自然語言處理”那樣的通用解決方案。

2024-04-01

定表情的樣子。然後,研究小組為Emo播放人類面部表情的視頻,通過逐幀觀察並學習。經過幾個小時的訓練後,Emo可以通過觀察人們面部的微小變化,來預測他們的面部表情。這項研究主要作者Yuhang Hu表示,“我認為,準確預測

2024-06-27

廣泛應用於各種設備中,如數字人一體機、商用及傢用服務機器人等,尤其在智能傢居、智慧零售、教育等領域展現出強大的賦能作用。隨著大模型技術的發展,訊飛機器人超腦平臺正從終端多模態交互和大模型理解決策兩個維

2023-03-22

和翻譯語言的有用工具。”還有網友問Bard怎麼看Bing聊天機器人。這次Bard表達出對GPT-4驅動的聊天機器人的好感。它是這麼回復的:“我認為Bing的聊天機器人是對搜索引擎的一個很好的補充。它是一個有用的工具,可以回答問題

2024-03-27

比如一些預設的編程。尤其是傢用機器人,在面對復雜的傢務勞動時,如果“大腦”中沒有足夠多的常識,就很難滿足人類傢庭的日常需求。如今,在大型語言模型(LLMs)的驅動下,傢用機器人已經可以掌握“常識性知識”,

2023-12-05

務報表。獵戶星空是一傢以人工智能技術研發為核心的服務機器人提供商,總部位於北京,同樣是傅盛創建。2023年初,獵戶星空基於大模型技術推出大模型應用聚言”,為企業客戶提供大模型咨詢與AI服務一站式解決方案。同時

2023-12-05

料顯示,獵戶星空是一傢以人工智能技術研發為核心的服務機器人提供商,總部位於北京,由傅盛創建。自2016年起即大規模投入人工智能技術研發,自研包括語音識別、視覺識別、室內導航等在內的全鏈條人工智能技術,同時

2023-02-11

念。紅杉資本將生成式AI分為文本、代碼、圖片、語言、視頻、3D等數個應用場景。紅杉資本認為,生成式AI至少可以提高10%的效率或創造力,有潛力產生數萬億美元的經濟價值。圖片來自紅杉資本憑借生成式AI的風口,一些AI繪

2024-03-14

”他或許說對。北京時間3月13日深夜,一段人形機器人的視頻開始在X上熱傳。之前從未展示過機器人方向能力的OpenAI,在與投資公司的人形機器人的合作中,第一次展示自己的機器人智能能力。Figure,OpenAI 投資的機器人公司,

2024-02-09

斯坦福爆火全能傢務機器人大升級,發佈二代版本ALOHA2!這一回,不光是做傢務,連戴隱形眼鏡都敢挑戰。還能小心翼翼拿走人類口袋裡的錢包,從裡面抽出幾張鈔票,再原封不動放回去。開可樂平穩倒可樂都是小case:連不帶

2022-06-24

站。增強的翻譯功能。iOS上的Google瀏覽器將利用設備上的機器學習進行更好的網站翻譯。即將到來的更新將改進語言識別,使瀏覽器能夠更準確地檢測所需的語言,並弄清楚是否需要翻譯它。Chrome Actions。另一個來自桌面Chrome瀏

2022-08-17

留意到這項技術正在變得愈加智能。與此同時,近年來的機器人技術也在突飛猛進。以谷歌為例,該公司有在演示一款乒乓球機器人,旨在訓練其應對快速、自適應、且精確的任務挑戰。Google研究員接觸科學傢兼機器人技術負責