AIGC

亞馬遜的 Tye Brady 談論生成式人工智慧、人形機器人和移動操作

亞馬遜的 Tye Brady 討論生成式人工智慧、人形機器人和移動操作作者:Brian Heater / 8 小時前上週是機器人領域非常繁忙的一週。我們在灣區舉辦了 RoboBusiness 活動,在新奧爾良舉辦了 ROSCon 會議,在西雅圖舉辦了亞馬遜的 Delivering the Futur .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

亞馬遜的 Tye Brady 談論生成式人工智慧、人形機器人和移動操作

亞馬遜的 Tye Brady 討論生成式人工智慧、人形機器人移動操作

作者:Brian Heater / 8 小時前

上週是機器人領域非常繁忙的一週。我們在灣區舉辦了 RoboBusiness 活動,在新奧爾良舉辦了 ROSCon 會議,在西雅圖舉辦了亞馬遜的 Delivering the Future 活動。作為一個媒體代表,我最終選擇了亞馬遜的活動,因為去年在波士頓郊區的一個履行中心舉辦的活動給了我很多啟發。今年的活動持續了兩天。第一天在亞馬遜南湖總部外的這對玻璃穹頂建築"Spheres"中舉行。這些建築實際上是多層功能性溫室,所以從西雅圖的十月天氣進來有些溫度的差異。不過當時正值下雨,所以在蒸悶的玻璃結構裡面感到相當舒適——這是一年中大概只有 150 天才能有的機會。

今年,亞馬遜在機器人領域宣布了一系列訊息。其中最重要的是與 Prime Air 服務相關的兩則新聞。從今年開始,德克薩斯州的科林區的顧客將能夠使用亞馬遜藥房的無人機送遞藥物。明年,這項服務將在美國第三個城市以及英國和德國等尚未公佈的地點推出。過去幾年,這項服務碰到過各種困難(可以這麼說),包括 2020 年的裁員和今年早些時候的全公司裁員。因此亞馬遜理所當然地小心翼翼地進行專案開展。當前該服務僅限於德克薩斯州的一個城市和加利福尼亞州的另一個城市。除了擴充套件的困難之外,還必須應對大量的監管問題。亞馬遜已經與當地和國家政府合作,確保這一日遞服務符合法規。從很多方面來看,這是一個全新的世界,我們很可能會在未來看到亞馬遜和 Alphabet 旗下的 Wing 等公司的無人機在頭頂上的天空中成為一種常見的景象。亞馬遜在藥房領域有一個優勢,那就是他們沒有交易麻醉藥,這意味著阿片類藥物不會飛過任何人的頭頂。此外亞馬遜還將開始推出新的 MK30 無人機,該無人機聲稱比上一款機型要安靜得多。如果我們計劃讓這些東西在天空中嗡嗡作響,這一點相當重要。此外還值得一提的是,亞馬遜推出了全新的一方系統——Sequoia。該公司指出:“Sequoia 使我們能夠比我們當前能做得更快速地識別和儲存我們在履行中心收到的庫存。這意味著我們可以更快地在 Amazon.com 上列出待售商品,對賣家和顧客都有好處。當訂單下達時,Sequoia 還可以將處理訂單所需的時間減少多達 25%,從而提高我們的發貨可靠性,增加我們可以提供的次日或隔日發貨的商品數量。”顯然,這一切都是為了減少交貨時間——這也是亞馬遜的 Prime Air 投資的驅動力。公司已經在許多地區設定了次日和隔日交貨的期望,所以我們想知道是否會有更多的時間節省開銷,或者說是否極小的時間節省效果實際上可以忽略不計。如果我們問亞馬遜這個問題,他們可能會說“永遠都不會”。在我與亞馬遜機器人技術長泰·布雷迪的交談中,我並沒有提到這個具體的問題。相反,我們的對話主要聚焦於三個重要的(我認為)主題。第一個是與 Agility 的 Digit 系統的試點。我在上週的幾篇文章中都提到過這個話題,包括一篇名為“亞馬遜 Digit 試點對人形機器人的重要考驗”的文章。我真的相信這件事將引起很多人的關注。這不是因為我認為如果亞馬遜不延長合同而選擇其他選項,Agility 就會宣告失敗。相反,如果亞馬遜決定進一步發展這一領域,這將會讓更多的公司更加重視雙足/人形機器人。我一直說過,在我們看到更多在現實領域中的應用之前,我不會對人形機器人的效能做出評價,而亞馬遜顯然也持有相同的觀點。亞馬遜以其難以想像的規模(您最近參觀過地區履行中心嗎?)運營,因此在開始將新技術應用於其工作流程之前,他們確實需要感到絕對的自信。

另一個值得一提的訊息是亞馬遜與麻省理工學院/ Ipsos 合作,旨在理解工人和消費者對工業機器人的看法。麻省理工學院的 Julie Shah 表示:“有效的團隊合作的關鍵是建立我們合作夥伴的共同理解,理解他們要做什麼以及他們需要成功所需的條件。”她還表示:“我們的研究顯示最佳化人機團隊的表現的最佳方法是開發能夠主動幫助人類理解他們的能力、約束和行為的機器人。”我確實認為人們對機器人的感知是一個值得探討的問題,但我希望能有一個具有這樣的金融和學術資源的研究更深入地探討短期和長期的替代情況。

布雷迪在他的演講中提到了工作問題:我們在履行中心裡有超過 75 萬臺移動機器人和數千臺其他幫助我們移動、分類、識別和包裝顧客訂單的機器人系統。我們花了超過 10 年的時間才達到這個規模。在這段時間裡,亞馬遜僱了數十萬名員工來工作。我們在設計和部署技術時,始終堅持以目的為導向的方法,並始終優先使用機器人來支援安全性和簡化員工的日常任務。

在我們開始進入訪談之前,還有一個小插曲。在第二天上午開始時,一名亞馬遜代表表示:“我們所有的團隊都正在開發生成式人工智慧應用。”這句話讓我印象深刻,出於顯而易見的原因,但隨著會議進一步討論無人機和機器人的計劃,這個話題在很大程度上被忽略了。我開始與 Tye Brady 的對話時,就提了幾個問題關於這個主題。當天上午我們討論了生成式人工智慧的問題,但在後來的機器人討論中幾乎沒有提到。你的團隊如何思考這個主題呢?我將先談談機器學習,然後再談生成式人工智慧。我認為亞馬遜在機器學習方面已經處於前沿地位數十年了。可以想像,早在 Jeff [Bezos]時代,如果你需要預測商品需要去哪個地方,一個人是做不到的。我們早在開始時就將機器學習納入其中。亞馬遜網路服務(AWS)擁有機器學習工具包。現在它涉及到生成式人工智慧,在今天有超過 10 萬家企業正在使用這個工具集。我們正在看它的發展。我們有一個叫做 Codewhisperer 的工具,將幫助我們實際編寫機器人系統的程式碼。是真實語言?確實如此。如果你試圖完成某個程式或任務,它會建議你如何編寫子程式。只需剪貼即可,非常直接、容易。這有助於提高整體生產力。在機器人領域,生成式人工智慧具有很大的潛力。我們實驗室中現有的一個例子是我們生成的虛擬包裹,它們在任何圖片上幾乎無法識別。生成式人工智慧可以生成場景,比如機器人在正確的光線條件下能看到什麼。在模擬中,我們可以用真實的接觸力來撿起這些生成的包裹,並且透過實際感知系統來檢測它們。我們甚至可以以不同的方式損壞角落,以確保我們的檢測算法能夠常規工作。另一個例子是可抓握的場景。這是我們用來撿起物體時使用的一個術語,我們想要獲得的是抓握物體所需的末端執行器的方位和姿勢。生成式人工智慧在這方面有很多可能性。你可以想象,一組基本的基元,然後我們使用生成式人工智慧代理給我們的機器人末端執行器提供所有的選擇。為什麼不將它們有意義地組合在一起呢?以幫助確保最佳拾取方法。完全正確。這最終有助於我們的設計師確保並經過算法證實哪種方法是最佳的。這裡的主題是,生成式人工智慧有很多潛力,尤其是在影響我們的設計師做出更好的系統方面。我最近和 Daniela Rus 交談過,她對使用生成式人工智慧來設計機器人的概念感到興奮。機器人的動態特性,實際上是將機器人移動的能力——路徑規劃,以找到正確的角度——生成式人工智慧在這方面是非常出色的。我們今天已經看到了許多潛力。

那麼在實際問題解決方面呢?這也是一個很好的例子。我想要小心區分生成式人工智慧和我們現有的機器學習系統。我們在建築內部有一個稱為“flow”的系統。我們有機器學習系統,可以理解哪條生產線在什麼時間需要什麼,並且可以協助將正確的材料流向正確的工作站。我們還有機器學習系統,可以看作是我們所有移動驅動器的航空交通管制中心。這涉及到艦隊管理、任務管理和工作管理。在此基礎上,機器學習已經徹底改變了計算機視覺,例如對物體的分割——知道一個物體在哪裡結束,另一個物體在哪裡開始。你可以使用模擬,但總有一些你無法考慮到的因素。我聽說生成式人工智慧在讓機器人能夠即時做出遇到的情況下的決策方面可能很有用。是的,這在幾十年來一直是機器人的一部分,即使在生成式人工智慧之前,也能夠做出即時決策。這是,甚至在 generative AI 之前,使得我們的人物滿足系統得以實現的先決條件。即使在 Sequoia 中,也內建了能夠檢測物體和人的實時感知能力。這需要放在機器人中,然後在與之相連的 AWS 中保留具有更高階邏輯的部分。想象一下生成式 AI 的能力是令人激動的,但我不想過於自信。在 Amazon Robotics 內部,我們始終思考實際的現實世界中的例子。但是到當前為止,我們對生成式 AI 非常感興趣,特別是如果我們給我們的系統提供基本元素,然後允許生成式 AI 以能夠做出即時決策的方式將它們組合在一起。這在我們的移動性和操作性解決方案中非常有用。

在今年四月份左右,您宣布 Agility 將是工業創新基金的首批受益者之一。可能的倉庫整合是這些投資的一部分嗎?創新基金實際上是探索該領域的可能性。這也是研究實際的現實世界例子的一部分。我們對仿生機器人很感興趣,我覺得它的移動能力很有趣。我們也對其是否有效、哪些地方有效感興趣。人形的形式非常有趣。我不知道這是好還是壞。但我們本質上是實驗家。我們會搞清楚這個問題。我們將進行試點專案,看看情況如何。我們很高興他們成為我們基金的一部分,但我們的基金中還有其他公司,我們從這些公司中學到了一些東西,如果我們希望,我們可以在這些公司上進行更大的投資。我不是說如果我們資助一個專案,就一定會把它納入我們的流程中。這只是開始階段。在這裡"非常早期"是什麼意思?我們正在理解功能和實用性。在這裡有什麼可能性?什麼是炒作?什麼是真實的?這是否有可能擴充套件?我認為很多人很難理解我們的規模。它不能 99%的時間工作,因為 1%的缺陷率在我們的任何一個建築內部都是一個巨大的數位。從您在 Proteus 等專案上的進展情況來看,目標是將自動化推向籠子之外。我們正在走出籠子。這些投資所體現的情況是,在 2022 年,與手動建築相比,我們將記錄的受傷率降低了 15%。對於這類似 Agility 的交易,你是直接購買一些機器人進行測試嗎?還是租賃?沒有一個說法適用於所有情況。我們根據個案進行決策。(亞馬遜拒絕對此進一步評論。)雙足機器人的一個很大的吸引力是它們能夠在已有設施中操作,但亞馬遜實際上並沒有這個問題。對,我們對於 Agility 這樣的系統的興趣在於它的雙足性質。行走的本質是我們所感興趣的。無論是兩條腿、四條腿還是輪子,如果能執行移動功能,我們都會感興趣,因為我們知道我們需要物品移動。但考慮到亞馬遜的豐富資源,您可以從頭開始建立工廠。這是一個很好的觀察。您在 Sequoia 系統中可以看到的內容實際上是基於我們之前的 Kiva 貨架的高度進行設計的。如果我們想改裝舊建築,我們有這個能力。我們可以使用貨櫃將該建築封裝起來,以將安全性和生產力的好處帶到現有場所。我們可以對我們已經建造的舊設施進行改裝,匯入 Sequoia 系統。我們有既有的設施也有新建的設施,並不是每件事都是新建的。75 萬臺機器人真的很多。這些都是由亞馬遜製造並在麻薩諸塞州組裝的。你做了進一步的區分嗎?這些只是自動移動機器人(AMR)。我們還有一支排序包裹的機器人隊伍。我們還有一支機器人隊伍來處理包裹,比如我們的羅賓隊伍已經處理了 20 億多個包裹。你之前提到了移動操作。你的團隊在這個概念上是什麼情況?這是一個超級激動人心的領域。我認為在我們所達到的世界級掌握能力的那些核心基礎上,當你開始把它們以有趣的組合方式結合在一起時,就會產生一些非常獨特的事情。我認為在移動機器人方面,我們是世界領先的機構。沒有人擁有像我們這樣的移動工業機器人艦隊,並能夠在大規模上對其進行控制。現在我們非常重視的是不僅是處理包裹,還有物體的操作。將這兩者結合在一起,我認為看到了可能性是令人興奮的。移動操作是什麼樣的?我認為它可能就是你所想的那樣。在 AMR 上安裝一個手臂?對。使用 Agility 機器人作為可移動操作的例子也是我們感興趣的。它的移動方式對我們來說很有興趣,因為我們並沒有在雙足機器人上做很多工作。所以這就是我們對 Agility 感興趣的原因。但絕對可以,如果我們能夠將其與識別系統、作業系統、分揀系統、儲存系統以及任何能夠為我們的客戶進行創新的系統組合在一起,我們就會感興趣。同時也會做任何改進我們員工安全性的工作。這是一個非常困難的問題。當你談論數以百萬計的不同物品時,它涉及到不僅要抓住這個物品,而且還要識別它,還要檢查它的損壞情況,這非常了不起。我想消除所有的機械、乏味和重複的工作。因此如果我能自動化這些工作並允許員工更多地專注在重要任務上,那將是一個完全的成功。

這也與麻省理工學院的研究專案相關。這種情況通常是你替換了某個東西,工作也發生了變化。工作存在,但這是一個巨大的變革。如果您來參觀實驗室,您可以看到這些實驗正在進行中。是的,如果你今天去納什維爾邊外,你會看到 Proteus 正在和我們的 Cardinal 手臂一起工作。你可以看到它們的互操作性。我們有 Proteus 驅動器將車輛運送到出口碼頭。如果你去休斯頓外面的 Hou 6,你會看到 Sequoia 今天正在完成訂單,正好在假期購物季來臨之際。人們在其中扮演什麼角色?人們始終是機器人世界的中心。我們知道越多的機器人,越多的工作,我們透過生產力的提高來看到這一點。(MIT 的研究)聽起來似乎主要是關於人們對機器人的感知以及他們對機器人的看法,而不是具體的工作數位。我不確保。這取決於(MIT 教授 Julie Shah)想要實施的方式。對於人們對機器人的認知,我們非常感興趣,因為人們將使用我們的機器人。如果它令人生畏,或者存在摩擦,你不想使用它,那麼我們的設計就失敗了。

Robot-亞馬遜,TyeBrady,生成式人工智慧,人形機器人,移動操作
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。