
Google DeepMind 與 33 個研究機構攜手,全球首創通用性 AI 系統,能讓機器人快速適應各種任務
機器人領域面臨的一大挑戰是每個機器人、任務和環境都需要投入大量的訓練機器學習模型的工作。如今 Google DeepMind 和其他 33 個研究機構聯手合作,希望建立一個通用性的 AI 系統,可以與不同型別的實體機器人一起工作,執行多種任務。
Google Robotics 的高級軟體工程師 Pannag Sanketi 表示:“我們觀察到,機器人非常擅長某個特定領域的專業技能,但在廣泛領域方面則不盡如人意。通常,你必須為每個任務、機器人和環境訓練一個模型。修改一個變數通常需要從頭開始。”為了克服這一難題,並使機器人的訓練和部署更加容易和快速,這個名為 Open-X Embodiment 的新專案引入了兩個關鍵元件:一個包含多種機器人型別資料的資料集以及一個能夠在各種任務之間轉移技能的模型家族。研究人員在機器人實驗室和不同型別的機器人上對這些模型進行了測試,結果優於當前常用的機器人訓練方法。
結合機器人資料
通常,每種不同型別的機器人,由於其獨特的感應器和執行器,都需要一個專門的軟體模型,就像每個生物的大腦和神經系統進化成與其軀體和環境相適應一樣。Open X-Embodiment 專案的靈感部分來自大型語言模型(LLM),當大型通用資料集作為訓練資料時,它們能夠媲美甚至超越在狹窄、任務特定的資料集上訓練的較小模型。令人驚訝的是,研究人員發現這一原則也適用於機器人領域。
研究團隊為 Open X-Embodiment 資料集從來自不同國家的 20 個機構的 22 種機器人製作了資料,包含了超過 500 個技能和 150,000 個任務的資料,涵蓋了超過 100 萬個情節(情節是指機器人每次嘗試完成任務時所執行的動作序列)。相應的模型基於 Transformer,這也是大型語言模型中使用的深度學習架構。RT-1-X 基於 Robotics Transformer 1(RT-1)構建,該模型是用於真實世界大規模機器人任務的多工模型。RT-2-X 則基於 RT-1 的後繼模型 RT-2,RT-2 獲取了來自機器人和網路資料的學習能力,並能對自然語言命令做出反應。研究人員在五個不同的研究實驗室和五種常用機器人上測試了 RT-1-X 的各種任務。相對於為每個機器人開發的專門模型,RT-1-X 在拾取和移動物體、開門等任務上的成功率高出 50%。與適用於特定視覺環境的專門模型相比,RT-1-X 還能將其技能應用於不同的環境。這表明,透過在多樣的範例集上訓練的模型在大多數任務上優於專門模型。根據論文,該模型適用於機器人臂到四足機器人等各種機器人型別。
對於未來機器人研究的展望
展望未來,科學家們正考慮將這些進展與 DeepMind 開發的自我改進模型 RoboCat 的見解相結合。RoboCat 學習在不同的機械臂上執行各種任務,然後自動生成新的訓練資料以提高其效能。Sanketi 表示另一個潛在方向可能是進一步研究不同資料集組合如何影響跨範式泛化和改進的正確泛化。團隊已經將 Open X-Embodiment 資料集和 RT-1-X 模型的小版本開源,但沒有開源 RT-2-X 模型。Sanketi 表示:“我們相信這些工具將改變機器人的學習方式,加速研究領域的發展。我們希望透過開放資料並提供安全但有限的模型,能降低障礙並加速研究。機器人的未來依賴於使機器人能夠相互學習,更重要的是,使研究人員能夠相互學習。”
VentureBeat 的使命是成為技術決策者獲取企業轉型技術知識和進行交易的數位廣場。探索我們的簡報。
延伸閱讀
- OpenAI 的創意寫作 AI 讓人想起高中文學社那個討人厭的孩子
- 亞馬遜成立新型代理 AI 團隊,將如何改變科技未來?
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 「搶先報名!TechCrunch Sessions: AI 演講者申請截止日期迫在眉睫!」
- MWC 最新報導:AI 影響力的兩極化觀點首次曝光!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!