AIGC

Google Deepmind 培訓影片遊戲 AI 成為你的合作夥伴

Google Deepmind 訓練 AI 共同合作的影片遊戲深度學習 AI 在影片遊戲中的應用 Google Deepmind 研究人員的最新創作是一個模型,該模型學會在多個影片遊戲中像人一樣遊玩,同時盡力理解並執行您口頭的指示。這個模型稱為 SIMA(可擴充套件的可指示多世界代理)。模型訓練 SIM .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

Google Deepmind 培訓影片遊戲 AI 成為你的合作夥伴

Google Deepmind 訓練 AI 共同合作的影片遊戲

深度學習 AI 在影片遊戲中的應用

Google Deepmind 研究人員的最新創作是一個模型,該模型學會在多個影片遊戲中像人一樣遊玩,同時盡力理解並執行您口頭的指示。這個模型稱為 SIMA(可擴充套件的可指示多世界代理)。

模型訓練

SIMA 透過觀看人類遊戲玩家的多個小時錄影以及資料標籤員提供的注釋,學會將特定的視覺表示與動作、物體和互動等相聯動。這包括遊戲中的基本動作、任務或事件,例如人物移動、開門等。

通用性和合作

研究人員的主要目標之一是看看是否訓練一個 AI 玩某些遊戲,是否能讓它具備玩其他遊戲的能力,這個過程被稱為通用性。研究結果是肯定的,雖然訓練在多個遊戲上的 AI 在未接觸過的遊戲上表現更好,但許多遊戲涉及特定和獨特的機制或術語,這會使 AI 難以應對。

然而模型本身可以透過更多的訓練資料來克服這些問題。這是因為雖然遊戲中有許多術語,但實際上玩家所能做的動作並不多。例如,無論您是搭建臨時棚,設立帳篷,還是施展魔法,您都是在“建造房屋”,對吧?因此當前模型認可的幾十種基本動作對研究人員來說非常有趣。

研究人員的野心不僅僅是在基於代理的 AI 領域取得進展,而且是要創造一個比我們今天僵硬的、硬編碼的遊戲夥伴更自然的 AI 玩家。他們希望打造一個合作型的 AI 玩家,可以接受指令並且在遊戲中和玩家一起執行任務。

與傳統方法的比較

相比於基於模擬器的代理訓練方法,SIMA 的學習方式更加靈活和開放。傳統的模擬器訓練使用強化學習,需要遊戲或環境提供一個“獎勵”訊號給代理,例如在圍棋或星際爭霸的贏/輸情況,或者在雅達利遊戲中的得分情況。

相對地,SIMA 使用人類行為的模仿學習,以文字形式給出目標,在訓練中不需要遊戲提供特定的獎勵訊號。這樣的學習方法更加開放和靈活,可以讓 AI 根據觀察到的行為來訓練自己,不受嚴格的獎勵結構的約束。

未來展望

此類開放合作和建立的研究也正在吸引其他公司的注意,例如在開放式對話機器人和 AI 模擬的研究上。未來,這種 AI 模型的廣泛應用將會在遊戲以外的領域帶來新的應用和發展。

ArtificialIntelligence-GoogleDeepmind,影片遊戲,人工智慧,合作夥伴,深度學習
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。