谷歌PaLM-SayCan模型可讓機器人更好地理解自然語言並執行復雜任務


長期使用Alexa、Siri、GoogleAssistant等數字助理的朋友,或許已留意到這項技術正在變得愈加智能。與此同時,近年來的機器人技術也在突飛猛進。以谷歌為例,該公司有在演示一款乒乓球機器人,旨在訓練其應對快速、自適應、且精確的任務挑戰。Google研究員接觸科學傢兼機器人技術負責人VincentVanhoucke表示:“在一鳴驚人之前,你必須勤學苦練”。

(圖 via Haje Kamps)

在速度和精度之外,Google 還希望通過實驗,攻克人類語言和機器人技術的交叉點。截至目前,這傢科技巨頭已在自然語言水平上取得讓人印象深刻的飛躍。

舉個例子,你可能會對一個人說 ——“有空幫我從櫃臺拿一杯飲料嗎?”

盡管對於人類來說,這句話的語境相當簡潔。但是對於一臺機器人來說,其中包含的信息量很可能將其絆倒。

因為‘有空’這詞語可能不包含任何意義,也可能是趁著機器人正在幹另一件時與之通過自然語言交互。

如果機器人過度理解字面含義,它可能會回答一句‘當然可以’—— 即便用戶並未明確要求它這麼做。

若機器人更加鉆牛角尖,它可能又會陷入該幫你拿哪一種飲料的糾結。

好消息是,Google 正在使用該公司的 NLP 系統拉解決一些問題。在 Pathways 語言模型(PaLM)的幫助下,機器人有望更準確地接收並理解人類的真實所想。

下一階段的挑戰,則是審視機器人能夠切實做到哪些事情。比如讓你讓機器人拾取冰箱頂部的一瓶清潔劑時,它是否會小心安全地擺放到兒童不易接觸到的地方。

不過在此之前,Google 還是會著眼於更加普適性的任務。簡單的有‘向前移動一米’,稍微高級點的可以是‘去廚房拿一罐可樂’。

然後才是復雜多步任務的拆解執行,比如 ——‘啊哦,我不小心將可樂撒地板上!能幫忙清理幹凈、並再給我拿一杯嗎?’

對此,Google 選擇的方案是利用語言“講述”(Say)模型中所包含的知識,來幫助機器人確定並評估哪些高級指令“可否”(Can)派上用場。

在融匯 PaLM 語言模型之後,Google 已將它重命名為 PaLM-SayCan,且正在自傢實驗室使用來自 Everyday Robots 的一些機器人(上圖展示其已學會何時去充電休息)。

當然,在投入實際商用之前,這項技術顯然還有相當多需要完善的地方,尤其是需要事先收集極其龐大的知識與技能數據集。


相關推薦

2024-03-19

英偉達正通過推出名為Project GR00T的新型人形機器人基礎模型,進一步進軍機器人領域。基礎模型是一種人工智能系統,它使用海量數據進行訓練,能夠用於各種各樣的任務,從生成句子到視頻、圖像等等。據Nvidia,Project GR00T將

2022-08-17

為“從廚房拿來抹佈”。Google 將由此產生的系統命名為 PaLM-SayCan,這個名稱捕捉該模型如何將 LLM 的語言理解技能(“Say”)與其機器人的“能力基礎”(即“Can”——通過可能的動作過濾指令)結合起來。Google 表示,機器人

2023-11-03

雜任務的規則也會耗費大量人力。Induced AI則借助大語言模型的能力,讓工具有邏輯推理和判斷的能力。用戶隻需要說出他的需求,比如“給我建個Jira的ticket”,或者“幫我篩選一波簡歷,給候選人發面試邀請”,Induced AI就可以

2024-03-27

識,就很難滿足人類傢庭的日常需求。如今,在大型語言模型(LLMs)的驅動下,傢用機器人已經可以掌握“常識性知識”,能夠在沒有人類的幫助下進行自我糾正,出色地完成復雜的傢務勞動。相關研究論文以“Grounding Language P

2023-04-12

完全顛覆影視行業、為機器人提供智慧大腦、人工智能模型自主開發、構建虛擬世界預測未來結果、接入手機等電子設備創建個人智能生態…….雖然GPT-5在官網寫的Q4左右會對外正式發佈,但根據微軟項目有關朋友的信息預測,

2024-03-14

器人界OpenAI”、明星初創公司Figure發佈自己第一個OpenAI大模型加持的機器人demo。僅僅是一個視頻,就驚艷全球科技界。而更讓人驚嘆的是,此時距離Figure宣佈和OpenAI在AI人形機器人領域合作才剛剛過去13天。Figure3月初宣佈,其已

2024-04-12

”,最終構建可以控制任何機器人執行任何任務的通用AI模型。Chelsea Finn解釋說,這其實極具挑戰性,需要整合機器人跨平臺策略、從視覺和語言模型中遷移學習、並通過模仿學習實現對靈活技能的掌握。聯合創始人兼CEO Karol Hau

2024-04-02

專業AI技術,蘋果的研究實驗室持續實現技術突破。面對谷歌、微軟、亞馬遜和OpenAI等公司的激烈競爭——這些公司已在搜索、辦公軟件、雲服務等領域推出先進的AI產品——作為一個以保密聞名的科技巨頭,蘋果正努力不落人

2023-03-10

為應對新一輪技術競賽,Google還在不斷出後手。這兩天,一個名叫PaLM-E的大模型在AI學術圈瘋狂刷屏。它能隻需一句話,就讓機器人去廚房抽屜裡拿薯片。即便是中途幹擾它,它也會堅持執行任務。PaLM-E擁有5620億參數,是GPT-3的

2023-02-08

當地時間周一,谷歌母公司Alphabet宣佈將推出名為Bard的人工智能聊天機器人技術,以此與OpenAI旗下的ChatGPT展開競爭。後者的爆紅令不少分析師警告稱,谷歌的核心產品,即在線搜索功能,恐面臨多年來最重大的風險,甚至遭遇

2022-09-16

時感知它應該笑。據悉,該團隊創建他們所謂的共享笑聲模型,它允許AI程序檢測人類的笑聲,然後在那個共享時刻加入笑聲。AI程序缺乏人類對話的細微差別如雙關語和隱藏的笑話,而訓練它們使用自然語言處理來掌握這些細

2022-08-03

像人一樣很多時候隻需小數據就可以進行預測。不久前,谷歌公司(以下簡稱谷歌)AI工程師萊莫因認為對話應用語言模型LAMDA“活”“其意識迎來覺醒”,並對此出具長達21頁的證據。他認為,LaMDA擁有七八歲孩童的智力,並相

2023-01-03

ChatGPT大火出圈的時候,人們就開始討論,它會不會顛覆搜索引擎。畢竟,它可以為各種問題提供高質量的回答,“智能”到不可思議。直到最近,Google內部啟動“RedCode(紅色警報)”,圍繞ChatGPT,全面調整明年在AI領域的工作

2022-11-02

重新編程的麻煩。該公司指出,現有的研究和訓練有素的模型可以有效地實現這一概念。所有這些工作都可以證明是開發系統的基礎,這些系統可以根據現實世界中遇到的對象和場景繼續生成自己的代碼。今天展示的新作品是代