研究人員運用強化學習訓練 AI，成功擊敗街頭霸王冠軍玩家

新加坡科技與設計大學研究團隊訓練 AI 以強化學習擊敗街頭霸王冠軍玩家簡介新加坡科技與設計大學（SUTD）的研究人員成功地將強化學習應用於一個影片遊戲問題。他們創造了一種基於透過圍棋和西洋棋等棋類遊戲證實有效的方法的複雜動作設計軟體。在單次測試中，這種新方法的動作優於頂尖人類玩家的動作。這些研究結果 .... (往下繼續閱讀)

by 程宇肖
2023/10/13
4 分鐘閱讀時間

A- A A+

文章目錄

新加坡科技與設計大學研究團隊訓練 AI 以強化學習擊敗街頭霸王冠軍玩家

簡介

新加坡科技與設計大學（SUTD）的研究人員成功地將強化學習應用於一個影片遊戲問題。他們創造了一種基於透過圍棋和西洋棋等棋類遊戲證實有效的方法的複雜動作設計軟體。在單次測試中，這種新方法的動作優於頂尖人類玩家的動作。這些研究結果可能對機器人技術和自動化產生影響，開啟了一個新的動作設計時代。

背景

強化學習是一種機器學習的方法，透過測試各種行動並獲得反饋，使計算機程式學習做出決策。例如，透過測試在圍棋棋盤上導致成功或失敗的數百萬種可能移動，該算法可以學習下棋。該程式旨在幫助算法從經驗中學習並改進其決策能力。

研究方法

研究團隊提供了數百萬個初始動作給計算機，以建立一個運動設計的強化學習程式。然後，該程式透過多次嘗試將每個動作隨機改進到特定目標。計算機調整角色的動作或調整其策略，直到學會進行能克敵制勝內建 AI 的動作。

研究結果

研究團隊專注於建立能在短時間內擊敗頂尖人類玩家的新動作。這要求使用衰減算法來建立這些動作。算法測試顯示，新的 AI 設計的動作非常有效。研究人員指出，衡量設計系統成功程度的好品質有很多，例如合理的遊戲禮節、處理不準確訊息的能力、實現特定遊戲狀態的能力以及擊敗對手所使用的時間的短暫性。換句話說，該程式展示了出色的身體和心理素質，也就是說，具備了有效的動作設計。

研究應用

該研究標誌著藉著使用人工智慧來推動運動科學研究的重要時刻。這一技術的潛在應用是多種多樣的，包括開發更具自主性的汽車、新型協作機器人和空中無人機。這項技術的發展加速了許多科學領域的進展。

結論

新加坡科技與設計大學的研究團隊透過強化學習建立了一個能擊敗冠軍街頭霸王玩家的 AI。他們的研究對於運動科學、機器人技術和自動化領域有著重要的意義。我們在未來可能看到更多基於強化學習的 AI 應用，這將提升我們在各個科學領域的研究成果。

"ArtificialIntelligence"-強化學習,人工智慧,AI 訓練,街頭霸王,冠軍玩家

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集

研究人員運用強化學習訓練 AI，成功擊敗街頭霸王冠軍玩家

文章目錄

新加坡科技與設計大學研究團隊訓練 AI 以強化學習擊敗街頭霸王冠軍玩家

簡介

背景

研究方法

研究結果

研究應用

結論

延伸閱讀

遊戲業正攻佔自動化玩家支援領域！

歐盟警告後，開展對 X 的據稱虛假資訊調查

程宇肖