#強化學習

7 篇文章

研究人員運用強化學習訓練 AI,成功擊敗街頭霸王冠軍玩家
782

研究人員運用強化學習訓練 AI,成功擊敗街頭霸王冠軍玩家

新加坡科技與設計大學研究團隊訓練 AI 以強化學習擊敗街頭霸王冠軍玩家簡介新加坡科技與設計大學(SUTD)的研究人員成功地將強化學習應用於一個影片遊戲問題。他們創造了一種基於透過圍棋和西洋棋等棋類遊戲證實有效的方法的複雜動作設計軟體。在單次測試中,這種新方法的動作優於頂尖人類玩家的動作。這些研究結果

研究人員運用強化學習訓練 AI 戰勝頂尖街頭霸王玩家
867

研究人員運用強化學習訓練 AI 戰勝頂尖街頭霸王玩家

研究人員透過強化學習訓練人工智慧擊敗街頭霸王冠軍玩家影響運動設計的新時代新加坡科技與設計大學(SUTD)的研究人員成功地將強化學習應用於一個影片遊戲問題中。他們創造了一種基於在象棋和圍棋等棋類遊戲中被證實有效的方法的新型複雜動作設計軟體。在單次測試中,新方法的動作表現優於頂尖人類玩家。這些研究結果可

強化學習方法:無人機覆蓋路徑與充電計劃的新突破
781

強化學習方法:無人機覆蓋路徑與充電計劃的新突破

強化學習方法改進無人機覆蓋路徑規劃和充電簡介無人機(也稱為無人飛行器或無人機)已經在應對各種現實世界問題中發揮了重要作用。例如,它們可以協助人類進行投遞、環境監測、電影製作和搜救任務。儘管過去十年間無人機的效能有了顯著提升,但很多無人機的電池壽命仍然相對短,因此在完成任務之前就可能耗盡電池並停止執行

強化學習智慧決策的全新方法
814

強化學習智慧決策的全新方法

新方法:在強化學習中進行智慧決策由《智慧計算》發表的一篇新論文介紹了在複雜且動態的環境中進行智慧決策的強化學習的主要挑戰。強化學習是一種機器學習的方法,其中代理透過與環境互動並獲得回報或懲罰來學習做出決策。代理的目標是透過確保在不同情況下採取的最佳行動來最大化長期回報。然而南京大學的陳陽吳和張宗張的

強化學習技術助力水下機器人在水底準確搜尋及追蹤物體
544

強化學習技術助力水下機器人在水底準確搜尋及追蹤物體

強化學習讓水下機器人能夠定位和追蹤水下物體簡介一個研究團隊首次展示,應用於自主車輛和水下機器人的強化學習 ─ 即一種基於一系列獎勵來學習最佳行動方式的神經網路,能夠定位並精準追蹤海洋物體和動物。這項研究的詳情已發表在《科學機器人學》期刊上。如今水下機器人技術正成為瞭解海洋的重要工具,尤其在探索海洋困

機器學習更有效提升真實世界場景的訓練方式
989

機器學習更有效提升真實世界場景的訓練方式

更有效的方法訓練機器應對不確保世界隨著人工智慧不斷發展,機器學習的重要性日益凸顯,但現實世界充滿不確保性和變化,這使得機器在面對複雜的任務和環境時變得困難。依靠"老師"指導是機器學習的一個重要策略,但機器該何時模仿老師,何時試錯學習也是一個難題。麻省理工學院的研究團隊發明了一種自動且動態的演算法,可

進化強化學習有望在機器學習方面取得更多進展
1024

進化強化學習有望在機器學習方面取得更多進展

演化強化學習:機器學習的新前沿演化強化學習是機器學習的一個新前沿,結合了兩種不同方法的優勢:強化學習和演化計算。在演化強化學習中,智慧體透過積極探索不同的方法並獲得成功表現的獎勵來學習最優策略。這種創新的範例將強化學習的試錯學習與演化演算法模擬自然選擇的能力相結合,形成了一種強大的人工智慧開發方法,並

«1»