谷歌PaLM-SayCan模型可讓機器人更好地理解自然語言並執行復雜任務

2022-08-17 發表於業界精選

長期使用Alexa、Siri、GoogleAssistant等數字助理的朋友，或許已留意到這項技術正在變得愈加智能。與此同時，近年來的機器人技術也在突飛猛進。以谷歌為例，該公司有在演示一款乒乓球機器人，旨在訓練其應對快速、自適應、且精確的任務挑戰。Google研究員接觸科學傢兼機器人技術負責人VincentVanhoucke表示：“在一鳴驚人之前，你必須勤學苦練”。

（圖 via Haje Kamps）

在速度和精度之外，Google 還希望通過實驗，攻克人類語言和機器人技術的交叉點。截至目前，這傢科技巨頭已在自然語言水平上取得讓人印象深刻的飛躍。

舉個例子，你可能會對一個人說 ——“有空幫我從櫃臺拿一杯飲料嗎？”

盡管對於人類來說，這句話的語境相當簡潔。但是對於一臺機器人來說，其中包含的信息量很可能將其絆倒。
因為‘有空’這詞語可能不包含任何意義，也可能是趁著機器人正在幹另一件時與之通過自然語言交互。
如果機器人過度理解字面含義，它可能會回答一句‘當然可以’—— 即便用戶並未明確要求它這麼做。
若機器人更加鉆牛角尖，它可能又會陷入該幫你拿哪一種飲料的糾結。

好消息是，Google 正在使用該公司的 NLP 系統拉解決一些問題。在 Pathways 語言模型（PaLM）的幫助下，機器人有望更準確地接收並理解人類的真實所想。

下一階段的挑戰，則是審視機器人能夠切實做到哪些事情。比如讓你讓機器人拾取冰箱頂部的一瓶清潔劑時，它是否會小心安全地擺放到兒童不易接觸到的地方。

不過在此之前，Google 還是會著眼於更加普適性的任務。簡單的有‘向前移動一米’，稍微高級點的可以是‘去廚房拿一罐可樂’。
然後才是復雜多步任務的拆解執行，比如 ——‘啊哦，我不小心將可樂撒地板上！能幫忙清理幹凈、並再給我拿一杯嗎？’

對此，Google 選擇的方案是利用語言“講述”（Say）模型中所包含的知識，來幫助機器人確定並評估哪些高級指令“可否”（Can）派上用場。

在融匯 PaLM 語言模型之後，Google 已將它重命名為 PaLM-SayCan，且正在自傢實驗室使用來自 Everyday Robots 的一些機器人（上圖展示其已學會何時去充電休息）。

當然，在投入實際商用之前，這項技術顯然還有相當多需要完善的地方，尤其是需要事先收集極其龐大的知識與技能數據集。

谷歌PaLM-SayCan模型可讓機器人更好地理解自然語言並執行復雜任務

相關推薦

英偉達進軍機器人領域發佈世界首款人形機器人通用基礎模型

[視頻]傢務機器人更進一步：Google讓其更理解你的自然語言命令

Sam Altman再出手投資兩個不到20歲的小創業者

MIT博士讓機器人自學“常識”：大模型加持可自主完成復雜傢務勞動

GPT-5七大震撼能力首次揭秘最快六月露面

Figure與OpenAI合作13天 AI機器人驚艷面世能對話、能思考、會學習

他們給機器人造大腦 OpenAI紅杉搶著投5億

蘋果開發出新款AI：能“看懂”屏幕上內容並用語音回復

谷歌砸出5620億參數大模型機器人都能用學術圈已刷屏

實測ChatGPT如何看待“競爭對手”谷歌的Bard

科學傢正在教機器人何時以及如何像人類一樣笑

谷歌工程師鬧場大烏龍人工智能還沒理解能力哪來的意識覺醒？

ChatGPT正在動搖谷歌的商業長城

Google希望機器人可以產生自己的代碼