網路議題

嶄新的學習架構讓機器人能夠按照線序進行互動任務

新學習架構使機器人能夠依序執行互動任務喬治亞理工學院的新學習架構使機器人能夠依序執行越來越複雜的任務，同時不需重新學習運動，類似於人類的學習過程。由喬治亞理工學院的博士生 Niranjan Kumar 所創造的 Cascaded Compositional Residual Learning（CCR .... (往下繼續閱讀)

by 程宇肖
2023/8/22
4 分鐘閱讀時間

A- A A+

文章目錄

新學習架構使機器人能夠依序執行互動任務

喬治亞理工學院的新學習架構使機器人能夠依序執行越來越複雜的任務，同時不需重新學習運動，類似於人類的學習過程。

由喬治亞理工學院的博士生 Niranjan Kumar 所創造的 Cascaded Compositional Residual Learning（CCRL）架構，讓四足機器人能夠在執行簡單任務時記住所有學到的東西。這個架構使得機器人能夠依序執行越來越複雜的任務，而不需要重新學習動作。

新學習架構的執行方式

CCRL 透過建立一個「圖書館」的方式，讓機器人記住所有在執行簡單任務時學到的技能。每當學到一個新的技能，它都會被新增到圖書館中，並能夠在執行更複雜的任務時加以利用。

例如，當學習走路時，可以在此基礎上進一步學習轉向，而這個轉向技能又可以用來作為導航技能的基礎。Kumar 說，CCRL 在互動導航研究方面取得了突破性的進展。

互動導航的挑戰

互動導航是一種讓機器人在現實世界中導航的解決方案之一。這些解決方案包括點導航（Point Navigation），它訓練機器人到達地圖上的某個點以及物件導航（Object Navigation），讓機器人學習到達選定物件位置的能力。

而互動導航則要求機器人在過程中與障礙物進行互動，並達到目標位置，這對機器人學習來說是最困難的部分。

關鍵在於關節

Kumar 說，讓機器人從走路到推動物體的關鍵在於存取關節以及機器人發現其可以透過這些關節進行不同型別的運動。

當前為止，Kumar 的政策已經達到了機器人可以學習和應用的 10 個技能。而在一個政策中能夠學習的技能數量取決於程式設計師使用的硬體。他說：“隨著不斷新增更多技能，訓練所需的時間會更長，因為政策還需要找出如何在不同情況下結合這些技能。但從理論上講，只要有足夠強大的電腦執行政策，就可以無限新增更多技能。”

潛力應用領域

Kumar 表示他認為 CCRL 對於家庭助理機器人非常有用，這些機器人需要有靈活的身體，能夠在雜亂的家庭環境中導航。

他還表示 CCRL 還可能成為視覺受損人士的導盲犬。他說：“如果有障礙物擋在視覺受損人士面前，機器人可以在他們行走時清除障礙物，為他們開門等等。”

Robot-wordpress,學習架構,機器人,互動任務

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集