麻省理工學院的一組研究人員利用人工智能來緩解交通擁堵,他們將這一領域的想法應用於解決倉庫中多個機器人的問題。通過將難以解決的問題分解成更小的塊,一種深度學習技術確定倉庫中疏導流量的最佳區域。
在一個巨大的機器人倉庫裡,數百個機器人在地面上來回穿梭,抓取物品並交付給人類工人進行包裝和運輸。這種倉庫正日益成為從電子商務到汽車生產等許多行業供應鏈的一部分。
然而,要讓 800 個機器人高效地往返於目的地,同時又要防止它們相互碰撞,並非易事。這個問題非常復雜,即使是最好的路徑搜索算法,也很難跟上電子商務或制造業的飛速發展。
人工智能驅動的高效解決方案
從某種意義上說,這些機器人就像試圖在擁擠的市中心穿梭的汽車。因此,一群利用人工智能緩解交通擁堵的麻省理工學院研究人員運用這一領域的理念來解決這一問題。
他們建立一個深度學習模型,對倉庫的重要信息(包括機器人、計劃路徑、任務和障礙物)進行編碼,並利用這些信息預測倉庫的最佳疏導區域,以提高整體效率。
他們的技術將倉庫中的機器人分成若幹組,因此這些較小的機器人組可以用協調機器人的傳統算法更快地消除擁堵。最終,與強隨機搜索法相比,他們的方法疏導機器人的速度快近四倍。
除簡化倉庫作業,這種深度學習方法還可用於其他復雜的規劃任務,如計算機芯片設計或大型建築的管道佈線。
尖端的神經網絡架構
"我們設計一種新的神經網絡架構,它實際上適用於這些倉庫這種規模和復雜程度的實時操作。它可以對數百個機器人的軌跡、出發地、目的地以及與其他機器人的關系進行編碼,而且能以一種高效的方式在各組機器人之間重復使用計算,"土木與環境工程(CEE)專業吉爾伯特-W-溫斯洛職業發展助理教授、信息與決策系統實驗室(LIDS)和數據、系統與社會研究所(IDSS)成員凱茜-吳(Cathy Wu)說。
該技術論文的資深作者 Wu 和第一作者、電子工程和計算機科學專業研究生 Zhongxia Yan 共同完成這項研究。這項研究成果將在學習表征國際會議(International Conference on Learning Representations)上發表。
機器人俄羅斯方塊
從鳥瞰圖上看,機器人電子商務倉庫的地面有點像快節奏的"俄羅斯方塊"遊戲。
當客戶下訂單時,機器人會前往倉庫的某一區域,抓起放置所需物品的貨架,然後將其交給人類操作員,由其揀選和包裝物品。數百個機器人同時進行這項工作,如果兩個機器人在穿過巨大的倉庫時發生路徑沖突,就可能會撞車。
傳統的搜索算法可以避免潛在的碰撞,方法是保持一個機器人的運行軌跡,並為另一個機器人重新規劃軌跡。但由於機器人數量眾多,可能發生碰撞,問題很快就會呈指數級增長。
"由於倉庫是在線運行的,機器人大約每 100 毫秒重新掃描一次。也就是說,每秒鐘,機器人要重新掃描 10 次。因此,這些操作必須非常快速,"Wu 說。
由於在重新規劃過程中時間非常關鍵,麻省理工學院的研究人員利用機器學習將重新規劃的重點放在最有可能減少機器人總行駛時間的擁堵區域。
Wu 和 Yan 建立的神經網絡架構可同時考慮較小的機器人群組。例如,在一個擁有 800 個機器人的倉庫中,網絡可能會將倉庫地面切割成更小的組,每組包含 40 個機器人。
然後,如果使用基於搜索的求解器來協調該組機器人的軌跡,它就會預測出哪一組最有可能改進整體解決方案。整個算法是一個迭代過程,先用神經網絡選出最有希望的機器人組,再用基於搜索的求解器解散機器人組,然後用神經網絡選出下一個最有希望的機器人組,依此類推。
簡化復雜系統
神經網絡能有效地推理機器人群,因為它能捕捉到單個機器人之間存在的復雜關系。例如,即使一個機器人一開始離另一個機器人很遠,它們在行進過程中的路徑仍有可能交叉。
該技術還能簡化計算,隻需對約束條件進行一次編碼,而無需對每個子問題重復編碼。例如,在一個擁有 800 個機器人的倉庫中,要消除一組 40 個機器人的擁堵,需要將其他 760 個機器人作為約束條件。其他方法則需要在每次迭代中對每組所有 800 個機器人推理一次。相反,研究人員的方法隻需要在每次迭代中對所有小組的 800 個機器人進行一次推理。
她補充說:"倉庫是一個大的環境,因此這些機器人群組中的很多都會在更大的問題上有一些共同點。我們設計的架構就是為利用這些共同的信息。"
研究人員在幾個模擬環境中測試他們的技術,包括一些像倉庫一樣的環境,一些帶有隨機障礙物的環境,甚至還有模擬建築物內部的迷宮設置。通過識別出更有效的疏導群組,他們基於學習的方法疏導倉庫的速度比強大的、非基於學習的方法快四倍。即使考慮到運行神經網絡的額外計算開銷,他們的方法解決問題的速度仍然快 3.5 倍。
未來方向與同行認可
未來,研究人員希望從他們的神經模型中獲得簡單、基於規則的見解,因為神經網絡的決策可能不透明,難以解讀。更簡單、基於規則的方法也更容易在實際機器人倉庫環境中實施和維護。
"這種方法基於一種新穎的架構,在這種架構中,卷積和註意力機制能夠有效地相互作用。令人印象深刻的是,它能夠考慮到所構建路徑的時空成分,而無需針對具體問題進行特征工程。結果非常出色。"康奈爾理工學院安德魯-H.和安-R.-蒂施教授 Andrea Lodi 說:"我們不僅能在求解質量和速度方面改進最先進的大型鄰域搜索方法,而且該模型還能很好地推廣到未見過的案例中。"
編譯來源:ScitechDaily