
AI 使用 GPT-4 成為專家級 Minecraft 玩家
最近,AI 研究人員建立了一個 Minecraft bot,可以在遊戲的開放世界中探索和擴充套件其能力。與其他機器人不同的是,這個機器人基本上是透過反覆嘗試和大量 GPT-4 查詢寫出自己的程式碼。這個實驗系統名為 Voyager,是一個“體驗智慧體”的範例,一個可以在模擬或真實環境中自由、有目的地移動和行動的 AI。個人助理型的 AI 和聊天機器人不必真的做事,更不必在複雜的世界中導航,以完成這些任務。但這正是未來家庭機器人所期望做的事情,因此研究如何實現這種技術非常重要。
為什麼 Minecraft 是一個好的測試場所?
Minecraft 是一個很好的測試這些方法的地方,因為它是一個非常(非常)接近現實世界的表示具有簡單、明確的規則和物理特性,但也足夠開放和複雜,有很多事情可以完成或嘗試。定制的模擬器也很好,但它們有自己的約束。MineDojo 是一個建立在 Minecraft 周圍的模擬框架,因為您不能只將一個隨機 AI 扔到那裡,指望它理解所有這些方塊和豬在做什麼。其建立者(與 Voyager 團隊有很多重疊)製作了有關遊戲的 YouTube 影片、講義、維基文章和大量從 r / minecraft 的 Reddit 文章等資料,這樣使用者可以在它們上面建立或微調 AI 模型。它還讓這些模型可以透過檢視它們完成類似建立圍欄圍住羊或發現並挖掘鑽石等任務的效果來進行更或少客觀的評估。
Voyager 與其他模型的區別
Voyager 在這些任務上表現突出,在這些任務上,它的表現遠遠優於唯一一個接近它的其他模型 AutoGPT,但它們的方法相似:使用 GPT-4 在進行遊戲時寫自己的程式碼。通常情況下,您只需要在所有良好的 Minecraft 資料上訓練模型,希望它在太陽落山時找出如何與骷髏戰鬥。然而 Voyager 從相對幼稚的開始,當它在遊戲中遇到事物時,它就會與 GPT-4 進行一些內部對話,探討應該做什麼以及如何做。指導下一個動作,並向技能庫新增技能。例如,當夜幕降臨並出現骷髏時。代理人對此有一般概念,但它會問自己,當附近有怪物時,這個遊戲的好的玩家會做什麼呢?好吧,GPT-4 說,如果你想安全地探索世界,你需要在製作桌上製作和裝備劍,然後在避免被打擊的同時揮舞劍並打骷髏。將何要做的具體目標轉化為:收集石頭和木材,在製作桌上製作一把劍,裝備它,並與骷髏戰鬥。完成這些事情後,這些技能將被輸入到一個通用的技能庫中,以便以後,當任務是“深入地下探索以找到鐵礦石”時,它不必從頭開始學習戰鬥。它仍然使用 GPT,但便宜和更快的 GPT-3.5,它告訴代理人最適合特定情況的技能,因此它不會嘗試挖掘骷髏和戰鬥礦石。當面對它尚未知道的介面時,類似於 AutoGPT 的代理人必須自學以導航以實現其目標。但 Minecraft 比它用於解決的環境更加深入,因此像 Voyager 這樣的專業代理人做得更好。它找到更多的東西,學到更多的技能,探索了比其他機器人更廣闊的區域。有趣的是,也許並不令人意外的是,與 GPT-3.5(即 ChatGPT)相比,GPT-4 在生成有用的程式碼方面表現非常出色。一個測試將前者替換為後者,使代理人在早期碰到了問題,甚至可能是直接失敗了。從這兩種模型的對話中很難看出哪一種更聰明,但事實是您不必特別聰明才能進行明顯智慧的對話(問我怎麼知道的)。編寫程式碼要困難得多,GPT-4 在這方面有了很大的更新。此研究的目的不是使 Minecraft 玩家過時,而是找到一種方法,透過“經驗”來幫助相對簡單的 AI 模型改進自己。如果我們將來要有機器人幫助我們在家、醫院和辦公室工作,那麼它們將需要學習和應用這些教訓來進行未來的行動。
延伸閱讀
- OpenAI 的創意寫作 AI 讓人想起高中文學社那個討人厭的孩子
- 亞馬遜成立新型代理 AI 團隊,將如何改變科技未來?
- 「搶先報名!TechCrunch Sessions: AI 演講者申請截止日期迫在眉睫!」
- MWC 最新報導:AI 影響力的兩極化觀點首次曝光!
- 亞馬遜新推出 Alexa+:為孩子們帶來 AI 驅動的「探索」與「故事」新功能!
- Bridgetown Research 載著 AI 助力,成功募資 1900 萬美元加速盡職調查!
- Nomagic 獲得 4400 萬美元資金,AI 驅動的機器手臂技術將改變未來!
- 全方位理解 Anthropic 的 AI:揭開 Claude 的神祕面紗!
- 微軟刪除 AI 資料中心租賃,背後原因何在?
- Perfect 獲得 2300 萬美元資金,運用 AI 革新招聘流程!