Google Deepmind 訓練 AI 共同合作的影片遊戲
深度學習 AI 在影片遊戲中的應用
Google Deepmind 研究人員的最新創作是一個模型,該模型學會在多個影片遊戲中像人一樣遊玩,同時盡力理解並執行您口頭的指示。這個模型稱為 SIMA(可擴充套件的可指示多世界代理)。
模型訓練
SIMA 透過觀看人類遊戲玩家的多個小時錄影以及資料標籤員提供的注釋,學會將特定的視覺表示與動作、物體和互動等相聯動。這包括遊戲中的基本動作、任務或事件,例如人物移動、開門等。
通用性和合作
研究人員的主要目標之一是看看是否訓練一個 AI 玩某些遊戲,是否能讓它具備玩其他遊戲的能力,這個過程被稱為通用性。研究結果是肯定的,雖然訓練在多個遊戲上的 AI 在未接觸過的遊戲上表現更好,但許多遊戲涉及特定和獨特的機制或術語,這會使 AI 難以應對。
然而模型本身可以透過更多的訓練資料來克服這些問題。這是因為雖然遊戲中有許多術語,但實際上玩家所能做的動作並不多。例如,無論您是搭建臨時棚,設立帳篷,還是施展魔法,您都是在“建造房屋”,對吧?因此當前模型認可的幾十種基本動作對研究人員來說非常有趣。
研究人員的野心不僅僅是在基於代理的 AI 領域取得進展,而且是要創造一個比我們今天僵硬的、硬編碼的遊戲夥伴更自然的 AI 玩家。他們希望打造一個合作型的 AI 玩家,可以接受指令並且在遊戲中和玩家一起執行任務。
與傳統方法的比較
相比於基於模擬器的代理訓練方法,SIMA 的學習方式更加靈活和開放。傳統的模擬器訓練使用強化學習,需要遊戲或環境提供一個“獎勵”訊號給代理,例如在圍棋或星際爭霸的贏/輸情況,或者在雅達利遊戲中的得分情況。
相對地,SIMA 使用人類行為的模仿學習,以文字形式給出目標,在訓練中不需要遊戲提供特定的獎勵訊號。這樣的學習方法更加開放和靈活,可以讓 AI 根據觀察到的行為來訓練自己,不受嚴格的獎勵結構的約束。
未來展望
此類開放合作和建立的研究也正在吸引其他公司的注意,例如在開放式對話機器人和 AI 模擬的研究上。未來,這種 AI 模型的廣泛應用將會在遊戲以外的領域帶來新的應用和發展。
延伸閱讀
- 在 AI 領域的女性:Tara Chklovski 正在教導下一代的 AI 創新者
- 為什麼 RAG 無法解決生成式 AI 的幻覺問題
- 本週人工智慧大事記:生成式人工智慧與創作者補償的問題
- 蘋果 AI 計劃揭祕:從財報中學到的三件事
- 特斯拉 CEO 為人工智慧新創公司籌集 60 億美元,TikTok 是否在逃避蘋果的傭金?
- Allozymes 以加速酶學應用於資料和人工智慧,籌集 1500 萬美元
- 在 TC 的 Techstars 調查內部以及人工智慧如何加速殘障科技
- Microsoft 禁止美國警察局使用企業人工智慧工具
- 你的 AI 原生新創公司並非一般的 SaaS 公司
- Airbnb 釋出團體訂房功能,並整合人工智慧以提升客戶服務