
<div><h2>Toyota Research Institute(TRI)正在開發一種教導機器人的新方法</h2>
<h3>人工智慧和機器學習的前沿</h3>
<p>機器學習可能是機器人領域中最令人興奮的前沿。這個領域的誕生可以追溯到數十年前,例如上世紀八十年代,透過示範學習這一方法開創了機器人學習的新局面。然而來自 CMU、MIT 和 UC Berkeley 等學校的一系列研究專案顯示了一個未來的前景,即機器人將與人類一樣進行學習。今天,在 TechCrunch Disrupt 的 Hardware Stage 上,Toyota Research Institute(TRI)展示了該研究所在機器人學習方面取得的突破,可以使機器人在一夜之間學會新技能。
</p>
<h3>研究所展示的方法結合了傳統機器人學習技術和擴散模型</h3>
<p>TRI 展示的系統使用了一些傳統的機器人學習技術,並結合了擴散模型,類似於驅動生成式 AI 模型(如 Stable Diffusion)的過程。這家汽車製造商的研究部門表示他們利用這種方法已經培訓了 60 種技能,並正在持續研究更多技能。</p>
<h4>擴大應用場景的優勢</h4>
<p>這種方法的一個優勢在於可以設計能夠適應多種場景的技能。這在機器人在不規則或無結構環境中執行方面是一個重要的方面。這是為什麼機器人在倉庫裡運行起來相對容易,而在道路或房屋裡運行則困難得多的主要原因。倉庫通常是有結構的,除了要處理人或叉車等移動物體外,很少有變化。理想情況下,我們希望機器人能夠應對各種情況。針對家庭的應用,TRI 的一個主要目標是開發能夠幫助老年人繼續獨立生活的系統。在像日本這樣的人口老齡化地區,這是一個越來越大的問題。其中一個目標是創造一個能夠在不同環境中工作並適應其中變化的系統。人們會移動家具,留下雜物,而且不總是把東西放回原處。傳統上,機器人學家必須針對這些情況事先進行程式設計,採取一種粗暴的解決方法。如果機器人要在現實世界中如廣告中所展示的那樣運行,這些都是重要的問題。同樣重要的是機器人學家稱之為“通用目的”的系統。這些是可以學習和適應新任務的機器人。這是一個從更加傳統的單一目的系統轉變出來的重大變革,這些傳統系統只能完成一件事,並一遍遍地反復培訓。不過我們離一個真正的“通用目的”機器人還有一段遠路要走。
</p>
<h2>傳遞行為模型教導機器人</h2>
<p>TRI 的機器人學家通常從遠端操作開始教導機器人,這是機器人學習中常用的工具。在這個過程中,機器人必須重複進行同一個任務,這可能需要幾個小時的冗長時間。“你可以把它想像成透過示範遙控操作機器人,” Burchfiel 說。 “當前的數量通常是幾十個,教授一個基本的行為大約需要一個小時。這個系統不關心你如何控制機器人。我們最近一直使用的那個遠端操作裝置實際上在機器人和人之間傳輸力量。這意味著死機器人與世界互動時,人可以感受到機器人在做什麼。這使你可以協調做其他你無法協調的事情。”該系統利用所有提供的資料,包括視覺和力反饋,以更完整地理解任務。只要收集到的資料之間存在一些重疊(例如將視覺與觸覺相聯動),它就能夠使用其內部的感測器來模仿該活動。力反饋是理解你是否正確地握著工具的關鍵。TRI 表示他們對觸感反饋的初步實驗“極為有希望”。例如,翻煎餅的成功率為 90%,30 次翻煎餅中有 27 次翻成功——這略微優於非觸覺試驗的 83%。另一方面,用於搓面團(96%)和盛食物(90%)的數位則非常突出。如果沒有觸感,這些數位會分別下降到 0 和 10%。一旦訓練的這部分完成,系統就會獨自執行,讓其神經網路在晚上進行訓練。如果一切按計劃進行,研究人員第二天回到實驗室時,該技能將完全學會。</p>
<h3>利用擴散策略進行機器人行為生成</h3>
<p>該系統依賴於擴散策略,研究人員稱其為“透過將機器人視覺運動策略表示為有條件的降噪擴散過程生成機器人行為的一種新方法”。簡單地說,它從隨機影象中去除“噪音”,找到其中的意義。雖然這在生成式 AI 領域中已經有所應用,但這項研究將這些過程應用於創造機器人的行為。</p>
<h3>結語</h3>
<p>我最近認識到,我對機器人學習的觀念有所誤解。我以前認為教導機器人的不同方法彼此衝突,最終會有一個優越的方法壟斷市場。但現在清楚的是,前進的方法將是多種方法的結合,就像人類學習一樣。在所有這些中,一個很重要的方面是“風險學習”——一個可以讓機器人彼此之間共享學習經驗的基於雲的系統。下一步的關鍵之一是建立大型行為模型來幫助機器人學習。Tedrake 副院長表示:“我們正在努力擴大應用範圍。到今年年底,我們已經培訓了 100 種技能,明年年底將有數千種技能。我們還不知道這些規模的法則。我們要培訓多少技能才能得到一個完全新的技能?我們正在研究這個問題。我們現在正處於一個可以開始提出這些非常基本問題並尋找法則的時期,以確保我們的時間表是怎樣的。”這支團隊希望這些研究成果能夠使機器人更加固大,在新環境中使用新物體,並根據訓練過的行為來生成行動。在許多情況下,任務由一系列可以串聯和執行的小行為組成。當然這需要一段時間。與此同時 TRI 的 CEO 兼首席科學家 Gill Pratt 將於週四與波士頓動力的 AI 研究所執行主任 Marc Raibert 一起參加 Disrupt 的 Hardware Stage,討論這些突破和更多相關問題。</p></div><div>ArtificialIntelligence-機器人學習,人工智慧,機器學習演算法,自主學習,人機互動,</div>
延伸閱讀
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 未來科技:研究人員揭示如何打造變形機器人,猶如 T-1000 般神奇!
- ElevenLabs 推出全新語音轉文字模型,引領 AI 語音技術的新潮流!