DeepMind發佈《星際爭霸 II》深度學習環境 | 2分鐘讀論文

 2017-09-27 17:35:00.0

DeepMind發佈《星際爭霸 II》深度學習環境 | 2分鐘讀論文

雷鋒網AI研習社【本期論文】

StarCraft II: A New Challenge for Reinforcement Learning

星際爭霸 II:增強學習的新挑戰

上個月,DeepMind和暴雪終於開源了《星際爭霸II 》的機器學習平臺。本文介紹了基於星際爭霸II遊戲的強化學習環境SC2LE(《星際爭霸II 》學習環境)。

DeepMind發佈《星際爭霸 II》深度學習環境 | 2分鐘讀論文

論文描述《星際爭霸II 》行動和獎勵規範,並提供一個開源的Python界面,用於與遊戲引擎進行通信。暴雪提供遊戲輸入輸出的API,DeepMind又做了層基於Python的封裝。

除了主要的遊戲地圖,他們提供了一套專注於《星際爭霸II 》遊戲不同元素的迷你遊戲。對於主要的遊戲地圖,還提供了一個伴隨專業玩家的遊戲重播數據數據集。從該數據訓練的神經網絡的初始基線結果,預測遊戲結果和玩家行爲。

DeepMind發佈《星際爭霸 II》深度學習環境 | 2分鐘讀論文

文中使用了被稱爲Blizzard分數的一箇中間分數,這個分數包含了一個對當前資源、等級以及單位和建築的加權和,如果玩家贏得戰鬥而且管理好資源,這個分數就會單調增加,失敗的時候,這個分數就會減少。此外,系統還使用了一系列的特徵層爲AI編碼相關信息,比如地形高度、相機位置、屏幕中單位的血量以及各種其他信息。

最後,提出了應用於《星際爭霸II 》的規範深強化學習的初始基線結果。DeepMind之後也會發布上百萬幀的選手遊戲記錄,這對模擬環境研究也會有很大的幫助。

▷ 觀看論文解讀大概需要  6  分鐘

學霸們還請自行閱讀論文以獲得更多細節

論文原址: https://arxiv.org/abs/1708.04782

Github: https://github.com/Blizzard/s2client 

雷鋒網AI研習社出品系列短視頻《 2 分鐘論文 》,帶大家用碎片時間閱覽前沿技術,瞭解 AI 領域的最新研究成果。歡迎關注雷鋒網(公衆號:雷鋒網)雷鋒字幕組專欄,獲得更多AI知識~感謝志願者對本期內容作出貢獻。

DeepMind發佈《星際爭霸 II》深度學習環境 | 2分鐘讀論文

DeepMind發佈《星際爭霸 II》深度學習環境 | 2分鐘讀論文

文章來源:雷鋒網