
Google Deepmind 訓練 AI 共同合作的影片遊戲
深度學習 AI 在影片遊戲中的應用
Google Deepmind 研究人員的最新創作是一個模型,該模型學會在多個影片遊戲中像人一樣遊玩,同時盡力理解並執行您口頭的指示。這個模型稱為 SIMA(可擴充套件的可指示多世界代理)。
模型訓練
SIMA 透過觀看人類遊戲玩家的多個小時錄影以及資料標籤員提供的注釋,學會將特定的視覺表示與動作、物體和互動等相聯動。這包括遊戲中的基本動作、任務或事件,例如人物移動、開門等。
通用性和合作
研究人員的主要目標之一是看看是否訓練一個 AI 玩某些遊戲,是否能讓它具備玩其他遊戲的能力,這個過程被稱為通用性。研究結果是肯定的,雖然訓練在多個遊戲上的 AI 在未接觸過的遊戲上表現更好,但許多遊戲涉及特定和獨特的機制或術語,這會使 AI 難以應對。
然而模型本身可以透過更多的訓練資料來克服這些問題。這是因為雖然遊戲中有許多術語,但實際上玩家所能做的動作並不多。例如,無論您是搭建臨時棚,設立帳篷,還是施展魔法,您都是在“建造房屋”,對吧?因此當前模型認可的幾十種基本動作對研究人員來說非常有趣。
研究人員的野心不僅僅是在基於代理的 AI 領域取得進展,而且是要創造一個比我們今天僵硬的、硬編碼的遊戲夥伴更自然的 AI 玩家。他們希望打造一個合作型的 AI 玩家,可以接受指令並且在遊戲中和玩家一起執行任務。
與傳統方法的比較
相比於基於模擬器的代理訓練方法,SIMA 的學習方式更加靈活和開放。傳統的模擬器訓練使用強化學習,需要遊戲或環境提供一個“獎勵”訊號給代理,例如在圍棋或星際爭霸的贏/輸情況,或者在雅達利遊戲中的得分情況。
相對地,SIMA 使用人類行為的模仿學習,以文字形式給出目標,在訓練中不需要遊戲提供特定的獎勵訊號。這樣的學習方法更加開放和靈活,可以讓 AI 根據觀察到的行為來訓練自己,不受嚴格的獎勵結構的約束。
未來展望
此類開放合作和建立的研究也正在吸引其他公司的注意,例如在開放式對話機器人和 AI 模擬的研究上。未來,這種 AI 模型的廣泛應用將會在遊戲以外的領域帶來新的應用和發展。
延伸閱讀
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 未來科技:研究人員揭示如何打造變形機器人,猶如 T-1000 般神奇!
- ElevenLabs 推出全新語音轉文字模型,引領 AI 語音技術的新潮流!