
新學習架構使機器人能夠依序執行互動任務
喬治亞理工學院的新學習架構使機器人能夠依序執行越來越複雜的任務,同時不需重新學習運動,類似於人類的學習過程。
由喬治亞理工學院的博士生 Niranjan Kumar 所創造的 Cascaded Compositional Residual Learning(CCRL)架構,讓四足機器人能夠在執行簡單任務時記住所有學到的東西。這個架構使得機器人能夠依序執行越來越複雜的任務,而不需要重新學習動作。
新學習架構的執行方式
CCRL 透過建立一個「圖書館」的方式,讓機器人記住所有在執行簡單任務時學到的技能。每當學到一個新的技能,它都會被新增到圖書館中,並能夠在執行更複雜的任務時加以利用。
例如,當學習走路時,可以在此基礎上進一步學習轉向,而這個轉向技能又可以用來作為導航技能的基礎。Kumar 說,CCRL 在互動導航研究方面取得了突破性的進展。
互動導航的挑戰
互動導航是一種讓機器人在現實世界中導航的解決方案之一。這些解決方案包括點導航(Point Navigation),它訓練機器人到達地圖上的某個點以及物件導航(Object Navigation),讓機器人學習到達選定物件位置的能力。
而互動導航則要求機器人在過程中與障礙物進行互動,並達到目標位置,這對機器人學習來說是最困難的部分。
關鍵在於關節
Kumar 說,讓機器人從走路到推動物體的關鍵在於存取關節以及機器人發現其可以透過這些關節進行不同型別的運動。
當前為止,Kumar 的政策已經達到了機器人可以學習和應用的 10 個技能。而在一個政策中能夠學習的技能數量取決於程式設計師使用的硬體。他說:“隨著不斷新增更多技能,訓練所需的時間會更長,因為政策還需要找出如何在不同情況下結合這些技能。但從理論上講,只要有足夠強大的電腦執行政策,就可以無限新增更多技能。”
潛力應用領域
Kumar 表示他認為 CCRL 對於家庭助理機器人非常有用,這些機器人需要有靈活的身體,能夠在雜亂的家庭環境中導航。
他還表示 CCRL 還可能成為視覺受損人士的導盲犬。他說:“如果有障礙物擋在視覺受損人士面前,機器人可以在他們行走時清除障礙物,為他們開門等等。”
延伸閱讀
- 《OpenAI 新職缺曝光,揭示未來機器人大計畫!》
- 《OpenAI 的機器人如同 DDoS 攻擊一般壓垮七人小公司網站!》
- 英偉達推出 Mega:智慧倉庫機器人管理新利器!
- RoboForce 融資 1000 萬美元,打造未來機器人工作團隊!
- 「機器人未來職場:55 家急徵人才的頂尖公司!」
- 突破極限!這款機器人「超人服」於體操槓上驚艷旋轉!
- 讓 AI 機器人墜入愛河,贏取數千美元的機會!
- 「超凡巧手!這款機器人成功完成洗碗機裝載任務」
- 「邁向未來!Serve Robotics 與 Wing 在達拉斯展開機器人與無人機交付試驗」
- 深度學習突破!Google DeepMind 教會機器人獨立綁鞋帶與修理同伴!