專案管理

DeepMind 揭示自我訓練的機器貓

DeepMind 揭示自我訓練機器貓 RoboCat 引言在 Google 的 DeepMind,研究人員最近將人工智慧與一個名為 RoboCat 的機器人結合在一起。雖然 RoboCat 尚未統治網際網路,但預計它將跨越一個充滿自我訓練機械人的未來世界的巨大跳躍。利用大型語言模型背後的相同技術,De .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

DeepMind 揭示自我訓練的機器貓

DeepMind 揭示自我訓練機器貓 RoboCat

引言

在 Google 的 DeepMind,研究人員最近將人工智慧與一個名為 RoboCat 的機器人結合在一起。雖然 RoboCat 尚未統治網際網路,但預計它將跨越一個充滿自我訓練機械人的未來世界的巨大跳躍。利用大型語言模型背後的相同技術,DeepMind 團隊由 30 多名研究人員組成,表示他們在一個機器貓中取得了突破,該貓不僅可以迅速學習新任務,還可以透過構建自己的效能資料來改善自己的表現。

自我訓練

按照 DeepMind 在 arXiv 上發表的論文《RoboCat:一個自我改進的基礎代理人用於機器人操作》,RoboCat 具有一個訓練的良性迴圈。它學習的新任務越多,它在學習其他新任務時就變得越好。到當前為止,機器人通常執行特定的、預先程式設計的任務。隨著大型語言模型的引入,機器人的技能範圍開始擴大,儘管訓練所需的大量資料需要大量的時間。然而 DeepMind 表示 RoboCat 可以迅速學習新的任務,例如將不同形狀的拼圖片段放入正確的插孔或將水果放入碗中。然後,它能夠在以前的任務和新生成的資料的"數百萬個軌跡"資料集的基礎上進一步進行更複雜的任務。研究人員表示:“這些改進源於 RoboCat 經驗的增加,就像人們在深化特定領域學習時發展出更多樣化的技能一樣。”

機器貓的測試與改進

機器貓改善其技巧之際,它學到的新行為將被轉移到其他機器人身上,這些機器人又在其基礎上進一步建立技能。該機器人透過人控制的機械臂對 100 到 1,000 個示範進行了效能微調。然後,特定任務的衍生模型接受培訓,將資料輸入通用指令池中。雖然 RoboCat 最初在未曾學習過的任務中取得了 36%的成功率,但它隨著時間的推移改善了自己的表現。透過自我訓練,成功率翻了一倍。DeepMind 的研究人員表示:“RoboCat 的學習速度比其他最先進的模型快得多,因為它從一個大而多樣的資料集中獲取知識,所以它只需要 100 個示範就能學會一個新的任務。”

加速機器人研究的重要一步

這一發展被視為加速機器人研究的重要一步,因為它減少了對人類監督訓練的需求,並且是創造一個通用機器人的重要一步。據 6 月 20 日發表的論文《RoboCat:一個自我改進的基礎代理人用於機器人操作》顯示,它減少了對人類監督訓練的需求,並且是創造一個通用機器人的重要一步。

人機互動的未來

這項技術的發展讓我們不禁問一個問題:這樣的機器人最終是否會取代人類的幹預?這個問題在 100 年前的 1921 年戲劇《R.U.R.:羅塞姆的通用機器人》中得到了回答。這個由捷克作家卡雷爾·瓦切克創作的故事設想了一個不斷工作並最終使勞動成本減少 80%的合成人類工廠。該劇首次使用了“機器人”一詞,源自捷克語的“robota”,意為“農奴的強制勞役”。最終機器人起來反抗並滅絕了人類。我們可以希望 RoboCats 將更友善一點。儘管如此我們也必須記住幽默作家威爾·羅傑斯曾說過:“讓貓從袋子裡跑出來要容易得多,而把它塞回去則更艱難。”

結論

DeepMind 揭示了一個具有自我訓練能力的機器貓 RoboCat,它能夠快速學習新任務並改進自己的表現。這個突破意味著機器人研究的加速,並帶來了創造通用機器人的重要一步。然而我們也需要謹慎地考慮人機互動的未來,以免重蹈歷史的覆轍。

AI, Machine learning-DeepMind,自我訓練,機器貓
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。