DeepMind 研發的「驚人」新人工智慧掌控各式機器人

GoogleDeepMind 和其他 33 家研究機構合作建立通用人工智慧機器人系統概述 GoogleDeepMind 和其他 33 家研究機構聯手推出了一個名為 Open X-Embodiment 的專案，旨在建立一個能夠與不同型別的機器人合作並執行多工的通用人工智慧系統。傳統上，為每個機器人、任務 .... (往下繼續閱讀)

by 江塵
2023/10/7
10 分鐘閱讀時間

A- A A+

文章目錄

GoogleDeepMind 和其他 33 家研究機構合作建立通用人工智慧機器人系統

概述

GoogleDeepMind 和其他 33 家研究機構聯手推出了一個名為 Open X-Embodiment 的專案，旨在建立一個能夠與不同型別的機器人合作並執行多工的通用人工智慧系統。傳統上，為每個機器人、任務和環境訓練機器學習模型需要耗費大量的時間和精力。Open X-Embodiment 專案透過引入一個含有多種機器人資料的資料集和一系列能夠跨多種任務傳輸技能的模型來克服這個挑戰。

機器人的專業和泛用性

該專案的目的是解決機器人在專業性和泛用性方面的問題。正如 Google Robotics 的高級軟體工程師 Pannag Sanketi 在接受 VentureBeat 採訪時所說：“我們所觀察到的是，機器人在某一特定任務上表現得很出色，但在泛用任務上表現平平。通常情況下，每個任務、機器人和環境都需要訓練一個模型。一旦變數發生變化，就需要從頭開始。”為了克服這個問題，Open X-Embodiment 專案引入了兩個關鍵元件：包含多種機器人資料的資料集和一系列能夠跨多種任務傳輸技能的模型。這種泛用性的方法使得訓練和部署機器人變得更加容易和快速。

結合機器人資料

通常情況下，每種不同型別的機器人都需要一個特定的軟體模型，就像每個生物的大腦和神經系統進化成與其身體和環境相適應一樣。Open X-Embodiment 專案的概念部分受到大型語言模型（LLM）的啟發，當這些模型在大型通用資料集上訓練時，可以媲美甚至超越在狹窄、特定任務資料集上訓練的較小模型。令人驚訝的是，研究人員發現這個原則同樣適用於機器人領域。為了建立 Open X-Embodiment 資料集，研究團隊從不同國家的 20 個機構收集了 22 種機器人的資料。這個資料集包含了超過 500 種技能和 150,000 個任務的示例，在超過 100 萬個 episode（episode 是機器人每次嘗試完成任務時的一系列動作序列）中涵蓋了不同的機器人。

基於 transformer 模型的模型設計

與大型語言模型相同，Open X-Embodiment 模型也基於 transformer 深度學習架構。RT-1-X 是基於機器人領域的多工模型 RT-1 構建而成的，RT-1 擁有規模化的現實世界機器人任務。RT-2-X 則是基於 RT-1 的後繼模型 RT-2，它是一個從機器人和 Web 資料中學習的視覺-語言-動作（VLA）模型，能夠對自然語言命令做出反應。研究人員在五個常用機器人的五個研究實驗室上測試了 RT-1-X 在各種任務上的表現。相比於為每個機器人專門開發的模型，RT-1-X 在拾取和移動物體、開門等任務中的成功率提高了 50%。與專門為特定視覺情境設計的模型不同的是，該模型能夠將其技能推廣到不同的環境。這表明，透過對多種示例進行訓練的模型在大多數任務中優於專家模型。研究報告中指出，該模型可以應用於從機械臂到四腳動物的各種機器人。

將來的機器人研究方向

前瞻性地看，科學家們正在考慮將這些進展與 DeepMind 開發的自我改進模型 RoboCat 的見解結合起來。RoboCat 學會執行不同機械臂的各種任務，然後自動生成新的訓練資料以提高其效能。根據 Sanketi 的說法，另一個可能的研究方向是進一步研究不同資料集混合對不同體現通用性的影響以及如何實現改進的通用性。該團隊已經將 Open X-Embodiment 資料集和 RT-1-X 模型公開發布，但並沒有公開發布 RT-2-X 模型。Sanketi 說：“我們相信這些工具將改變機器人訓練的方式，加速這個研究領域的發展。我們希望開源資料並提供安全但有限的模型，能夠降低門檻，加速研究。機器人的未來依賴於使機器人彼此學習，更重要的是，使研究人員彼此學習。”

評論和建議

這一專案的意義在於解決機器人在專業性和泛用性之間的矛盾。傳統上，為每個機器人、任務和環境訓練機器學習模型需要耗費大量的時間和精力。由於每種機器人都具有自己獨特的特性和環境要求，專門為每個機器人設計模型成本高昂且耗時，並且不夠高效。 Open X-Embodiment 專案透過引入含有多種機器人資料的資料集和可以傳輸技能的模型來解決這個挑戰。這意味著研究人員可以從這一通用模型中受益，而不需要為每個機器人和任務重新訓練模型。此外 Open X-Embodiment 的資料集和模型開源，這將有助於促進研究人員之間的合作和共享。然而儘管 Open X-Embodiment 專案取得了令人驚喜的成果，但尚需面對一些挑戰。例如，如何處理來自不同機器人和任務的大量資料以及如何在不同環境下進行適應和推理，仍然是值得研究者們深入探討的問題。還有一個值得思考的問題是，這種通用模型是否可以應用於所有機器人和任務。即使 Open X-Embodiment 專案成功建立了一個通用模型，但某些特殊任務可能需要專門設計的模型。因此在實際應用中，研究人員仍然需要根據具體情況來選擇合適的模型。總而言之，Open X-Embodiment 專案為機器人研究和應用帶來了新的思路和方法。透過引入通用模型，研究人員可以更快地訓練和部署機器人，並且可以透過共享資料集和模型來促進合作和共享。然而該專案仍然需要面對一些挑戰，並且在實際應用中仍需要根據具體情況進行適當的選擇。

ArtificialIntelligence,Robotics-DeepMind,人工智慧,機器人,研發

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集