Google Deepmind 訓練 AI 共同合作的影片遊戲
深度學習 AI 在影片遊戲中的應用
Google Deepmind 研究人員的最新創作是一個模型,該模型學會在多個影片遊戲中像人一樣遊玩,同時盡力理解並執行您口頭的指示。這個模型稱為 SIMA(可擴充套件的可指示多世界代理)。
模型訓練
SIMA 透過觀看人類遊戲玩家的多個小時錄影以及資料標籤員提供的注釋,學會將特定的視覺表示與動作、物體和互動等相聯動。這包括遊戲中的基本動作、任務或事件,例如人物移動、開門等。
通用性和合作
研究人員的主要目標之一是看看是否訓練一個 AI 玩某些遊戲,是否能讓它具備玩其他遊戲的能力,這個過程被稱為通用性。研究結果是肯定的,雖然訓練在多個遊戲上的 AI 在未接觸過的遊戲上表現更好,但許多遊戲涉及特定和獨特的機制或術語,這會使 AI 難以應對。
然而模型本身可以透過更多的訓練資料來克服這些問題。這是因為雖然遊戲中有許多術語,但實際上玩家所能做的動作並不多。例如,無論您是搭建臨時棚,設立帳篷,還是施展魔法,您都是在“建造房屋”,對吧?因此當前模型認可的幾十種基本動作對研究人員來說非常有趣。
研究人員的野心不僅僅是在基於代理的 AI 領域取得進展,而且是要創造一個比我們今天僵硬的、硬編碼的遊戲夥伴更自然的 AI 玩家。他們希望打造一個合作型的 AI 玩家,可以接受指令並且在遊戲中和玩家一起執行任務。
與傳統方法的比較
相比於基於模擬器的代理訓練方法,SIMA 的學習方式更加靈活和開放。傳統的模擬器訓練使用強化學習,需要遊戲或環境提供一個“獎勵”訊號給代理,例如在圍棋或星際爭霸的贏/輸情況,或者在雅達利遊戲中的得分情況。
相對地,SIMA 使用人類行為的模仿學習,以文字形式給出目標,在訓練中不需要遊戲提供特定的獎勵訊號。這樣的學習方法更加開放和靈活,可以讓 AI 根據觀察到的行為來訓練自己,不受嚴格的獎勵結構的約束。
未來展望
此類開放合作和建立的研究也正在吸引其他公司的注意,例如在開放式對話機器人和 AI 模擬的研究上。未來,這種 AI 模型的廣泛應用將會在遊戲以外的領域帶來新的應用和發展。
延伸閱讀
- Fairgen「提振」調查結果,利用合成資料和人工智慧生成的回應
- 用 Retell AI 讓公司打造「語音代理人」來應答電話
- OpenAI 揭開 AI 祕密指令的面紗
- AI 助您創辦者更快、更輕鬆地籌集資金嗎?
- 深度學習技術進步!Meta 推出廣告 AI 工具,能創造全新影象而非僅替換背景
- Google Deepmind 推出巨大的 AlphaFold 更新和免費蛋白質組學服務網路應用程式
- 盧西德機器人獲得 900 萬美元用於無人機清潔任何地方
- 以色列新創公司 Panax 籌集了 1,000 萬美元 A 輪融資,用於其基於人工智慧的現金流管理平臺
- Reddit 測試使用基於 LLM 的人工智慧進行自動整站法語翻譯
- 三星醫聲將以 9270 萬美元收購法國人工智慧超聲波新創公司 Sonio