新加坡科技與設計大學研究團隊訓練 AI 以強化學習擊敗街頭霸王冠軍玩家
簡介
新加坡科技與設計大學(SUTD)的研究人員成功地將強化學習應用於一個影片遊戲問題。他們創造了一種基於透過圍棋和西洋棋等棋類遊戲證實有效的方法的複雜動作設計軟體。在單次測試中,這種新方法的動作優於頂尖人類玩家的動作。這些研究結果可能對機器人技術和自動化產生影響,開啟了一個新的動作設計時代。
背景
強化學習是一種機器學習的方法,透過測試各種行動並獲得反饋,使計算機程式學習做出決策。例如,透過測試在圍棋棋盤上導致成功或失敗的數百萬種可能移動,該算法可以學習下棋。該程式旨在幫助算法從經驗中學習並改進其決策能力。
研究方法
研究團隊提供了數百萬個初始動作給計算機,以建立一個運動設計的強化學習程式。然後,該程式透過多次嘗試將每個動作隨機改進到特定目標。計算機調整角色的動作或調整其策略,直到學會進行能克敵制勝內建 AI 的動作。
研究結果
研究團隊專注於建立能在短時間內擊敗頂尖人類玩家的新動作。這要求使用衰減算法來建立這些動作。算法測試顯示,新的 AI 設計的動作非常有效。研究人員指出,衡量設計系統成功程度的好品質有很多,例如合理的遊戲禮節、處理不準確訊息的能力、實現特定遊戲狀態的能力以及擊敗對手所使用的時間的短暫性。換句話說,該程式展示了出色的身體和心理素質,也就是說,具備了有效的動作設計。
研究應用
該研究標誌著藉著使用人工智慧來推動運動科學研究的重要時刻。這一技術的潛在應用是多種多樣的,包括開發更具自主性的汽車、新型協作機器人和空中無人機。這項技術的發展加速了許多科學領域的進展。
結論
新加坡科技與設計大學的研究團隊透過強化學習建立了一個能擊敗冠軍街頭霸王玩家的 AI。他們的研究對於運動科學、機器人技術和自動化領域有著重要的意義。我們在未來可能看到更多基於強化學習的 AI 應用,這將提升我們在各個科學領域的研究成果。
延伸閱讀
- RPA 供應商如何在 AI 代理人世界保持競爭力
- 元 AI 測試:未能彰顯自身價值,但免費就是免費
- Google 推出新功能“口語練習”,利用人工智慧幫助使用者提高英文能力
- 科技巨頭 xAI 競爭開放人工智慧,吸金 60 億美元。推動社交網路 X 成為股東
- Xaira:AI 藥物發現新創公司以 10 億美元巨額啟動,宣稱已準備好開展藥物開發
- Rabbit 宣布推出一個迷人的小型 AI 裝置:R1
- Perplexity AI 可能價值高達 30 億美元,原因在於…
- 基於人工智慧時代,Anon 正在打造自動化認證層 - 技術新聞
- Snowflake 推出自家旗艦生成式人工智慧模型
- Parloa 完成 6600 萬美元融資,打造客服對話人工智慧平臺