網路議題

新技術助力機器人將物品完美打包

新技術幫助機器人在狹小空間內打包物品撰文:亞當·澤維(Adam Zewe),麻省理工學院麻省理工學院的研究人員正在使用生成式人工智慧模型,幫助機器人更有效地解決複雜的物體操作問題,例如將不同的物品打包進箱子裡。許多人都知道,將一大堆行李塞進小轎車後車廂是一個困難的問題。機器人在密集打包任務中也會遇到 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

新技術助力機器人將物品完美打包

新技術幫助機器人在狹小空間內打包物品

撰文:亞當·澤維(Adam Zewe),麻省理工學院

麻省理工學院的研究人員正在使用生成式人工智慧模型,幫助機器人更有效地解決複雜的物體操作問題,例如將不同的物品打包進箱子裡。

許多人都知道,將一大堆行李塞進小轎車後車廂是一個困難的問題。機器人在密集打包任務中也會遇到困難。對於機器人而言,解決這個打包問題涉及滿足許多約束條件,例如將行李塞入行李箱時不讓行李箱倒下、避免將重物壓在輕物上、避免機械手臂與汽車保險槓碰撞等。一些傳統方法是按照線序解決這個問題,每次猜測滿足一個約束條件的部分解決方案,然後檢查是否違反了其他約束條件。由於需要採取長序列的操作並且有一堆行李需要打包,這個過程往往非常耗時。

麻省理工學院的研究人員使用一種名為擴散模型(diffusion model)的生成式人工智慧方法,更有效地解決了這個問題。他們的方法被描述在 arXiv 預印本伺服器上的一篇文章中。他們的方法使用一系列機器學習模型,每個模型都被訓練來表示一個特定型別的約束條件。這些模型被結合起來以同時滿足所有約束條件,生成打包問題的整體解決方案。他們的方法能夠比其他技術更快生成有效的解決方案,並在相同時間內產生更多的成功解決方案。重要的是,他們的技術還能夠解決具有新的約束條件組合和更多物品數量的問題,這些問題在訓練模型時並沒有出現。由於這種普適性,他們的技術可以用來教導機器人如何理解並滿足打包問題的整體約束,例如避免碰撞或希望一個物體靠近另一個物體。

解決連續約束滿足問題的困難

對於機器人而言,連續約束滿足問題尤其具有挑戰性。這些問題出現在多步驟的機器人操作任務中,例如物品打包或擺設餐桌。這些問題往往需要滿足多個約束條件,包括幾何約束(例如機器人手臂與環境碰撞)、物理約束(例如將物體堆疊在穩定的位置上)和質量約束(例如將湯匙放在刀的右邊)。可能有很多約束條件,它們會因問題和環境的不同而變化,取決於物體的幾何形狀和人為指定的要求。

為了有效解決這些問題,麻省理工學院的研究人員開發了一種名為 Diffusion-CCSP 的機器學習技術。擴散模型透過反復改進其輸出來學習生成與訓練資料集中樣本類似的新資料樣本的方法。為了做到這一點,擴散模型學習了一種對潛在解決方案進行微小改進的程式。然後,為理解決問題,它們從一個隨機、非常糟糕的解決方案開始,然後逐步改進它。例如,想像一下在模擬桌子上隨機放置盤子和餐具,允許它們相互重疊。物體之間的無碰撞約束將使它們相互挪動,而質量約束將將盤子拖到中心位置,使沙拉叉和晚餐叉對齊,等等。擴散模型非常適合這種連續約束滿足問題,因為多個模型對一個物體的姿態的影響可以組合起來以鼓勵滿足所有約束。透過每次從隨機初始猜測開始,模型可以獲得多樣化的優秀解決方案。

對於 Diffusion-CCSP,研究人員希望捕捉到約束條件之間的相互聯絡。例如,在物品打包中,一個約束條件可能要求特定物體靠近另一個物體,而另一個約束條件可能指定其中一個物體必須放在某個位置。Diffusion-CCSP 學習了一系列擴散模型(每個模型對應一種約束條件),這些模型共同訓練,分享一些知識,例如待打包物體的幾何形狀。然後,這些模型共同工作,尋找解決方案,例如物體應該放置的位置,以共同滿足所有約束條件。

她說:“我們並不總是在第一次猜測時得到解決方案。但是當你不斷改進解決方案並發生一些違反約束的事情時,它應該導致你獲得更好的解決方案。你可以從犯錯中獲得指引。”把每種約束型別的模型逐一訓練,然後結合它們進行預測,大大減少了所需的訓練資料量,相較於其他方法。然而訓練這些模型仍然需要大量的展示已解決問題的資料。楊表示用傳統的慢速方法來解決每個問題,以產生這樣的資料成本是令人望而生畏的。因此研究人員將過程反轉,先提供解決方案。他們使用快速算法生成分割的箱子,並將各種三維物體放入每個分割區域,確保緊湊的打包、穩定的位置和無碰撞的解決方案。她表示:“使用這個過程,在模擬中生成數以萬計的能夠解決問題的環境,幾乎是瞬時的。"透過這些資料對模型進行訓練,擴散模型可共同確保機器人夾爪應該放置物體的位置,以實現打包任務並滿足所有約束。研究人員進行了可行性研究,並使用真實機器人解決了一些困難的問題,包括將二維三角形放入盒子中、遵守空間關係約束的二維形狀、帶有穩定性約束的三維物體堆疊以及帶有機械手臂的三維物品打包。他們的方法在許多實驗中表現出色,生成了更多穩定且無碰撞的有效解決方案。

展望未來

楊和她的合作者希望在更複雜的情況下測試 Diffusion-CCSP,例如機器人能夠在房間中移動的情況。他們還希望使 Diffusion-CCSP 能夠解決不同領域的問題,而無需重新訓練。

喬治亞理工學院互動計算學院助理教授、NVIDIA AI 研究科學家丹飛·許(Danfei Xu)表示:“Diffusion-CCSP 是一種機器學習解決方案,建立在現有的強大生成模型的基礎上。它可以透過組合已知的個別約束模型,快速生成同時滿足多個約束的解決方案。儘管它仍然處於早期開發階段,但這種方法的持續進步有望實現在各種應用中更高效、安全和可靠的自主系統。”

RobotTechnology-新技術,機器人,物品打包,完美打包
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。