AIGC

Google Deepmind 培訓影片遊戲 AI 成為你的合作夥伴

Google Deepmind 訓練 AI 共同合作的影片遊戲深度學習 AI 在影片遊戲中的應用 Google Deepmind 研究人員的最新創作是一個模型，該模型學會在多個影片遊戲中像人一樣遊玩，同時盡力理解並執行您口頭的指示。這個模型稱為 SIMA（可擴充套件的可指示多世界代理）。模型訓練 SIM .... (往下繼續閱讀)

by 程宇肖
2024/3/13
5 分鐘閱讀時間

A- A A+

文章目錄

Google Deepmind 訓練 AI 共同合作的影片遊戲

深度學習 AI 在影片遊戲中的應用

Google Deepmind 研究人員的最新創作是一個模型，該模型學會在多個影片遊戲中像人一樣遊玩，同時盡力理解並執行您口頭的指示。這個模型稱為 SIMA（可擴充套件的可指示多世界代理）。

模型訓練

SIMA 透過觀看人類遊戲玩家的多個小時錄影以及資料標籤員提供的注釋，學會將特定的視覺表示與動作、物體和互動等相聯動。這包括遊戲中的基本動作、任務或事件，例如人物移動、開門等。

通用性和合作

研究人員的主要目標之一是看看是否訓練一個 AI 玩某些遊戲，是否能讓它具備玩其他遊戲的能力，這個過程被稱為通用性。研究結果是肯定的，雖然訓練在多個遊戲上的 AI 在未接觸過的遊戲上表現更好，但許多遊戲涉及特定和獨特的機制或術語，這會使 AI 難以應對。

然而模型本身可以透過更多的訓練資料來克服這些問題。這是因為雖然遊戲中有許多術語，但實際上玩家所能做的動作並不多。例如，無論您是搭建臨時棚，設立帳篷，還是施展魔法，您都是在“建造房屋”，對吧？因此當前模型認可的幾十種基本動作對研究人員來說非常有趣。

研究人員的野心不僅僅是在基於代理的 AI 領域取得進展，而且是要創造一個比我們今天僵硬的、硬編碼的遊戲夥伴更自然的 AI 玩家。他們希望打造一個合作型的 AI 玩家，可以接受指令並且在遊戲中和玩家一起執行任務。

與傳統方法的比較

相比於基於模擬器的代理訓練方法，SIMA 的學習方式更加靈活和開放。傳統的模擬器訓練使用強化學習，需要遊戲或環境提供一個“獎勵”訊號給代理，例如在圍棋或星際爭霸的贏/輸情況，或者在雅達利遊戲中的得分情況。

相對地，SIMA 使用人類行為的模仿學習，以文字形式給出目標，在訓練中不需要遊戲提供特定的獎勵訊號。這樣的學習方法更加開放和靈活，可以讓 AI 根據觀察到的行為來訓練自己，不受嚴格的獎勵結構的約束。

未來展望

此類開放合作和建立的研究也正在吸引其他公司的注意，例如在開放式對話機器人和 AI 模擬的研究上。未來，這種 AI 模型的廣泛應用將會在遊戲以外的領域帶來新的應用和發展。

ArtificialIntelligence-GoogleDeepmind,影片遊戲,人工智慧,合作夥伴,深度學習

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集