日前,騰訊開悟”平臺宣佈正式開放王者榮耀AI開放研究環境”申請,邁出全面開放的第一步。面向非商業用途的機器學習算法研究,開悟”平臺將提供業界獨有的高復雜度MOBA訓練環境,助力相關學術領域的前沿探索。
最新開放申請的王者榮耀AI開放研究環境”,包含王者榮耀1v1對戰環境與baseline算法模型,當前支持20位英雄的鏡像對戰任務以及非鏡像類對戰任務,尤其適合研究競爭性強化學習中的泛化性與通用性問題。
現在,研究者隻需在騰訊開悟平臺官網註冊賬號、提交資料並通過平臺審核,即可免費下載王者榮耀1v1測試環境gamecore,在本地進行AI相關研究測試。
騰訊介紹稱,在《王者榮耀》對戰中,雙方玩傢互為競爭關系,需要收集資源的同時幹擾對方,以達到贏得遊戲的目的。作為一個具備多英雄、多玩法的復雜對抗遊戲,王者榮耀的狀態、動作空間復雜度比圍棋等遊戲高很多,是學術屆研究復雜控制類問題的優質環境。
本次最新開放申請的王者榮耀AI開放研究環境”在隻考慮雙方英雄選擇條件下,支持400種對戰子任務,如果算上召喚師技能,將會有40000種子任務,這對模型的泛化性有很大挑戰,所以尤其適合研究競爭性強化學習中的泛化性與通用性問題。
2021年起,開悟”先後與北大、清華、中科大等19所國內頭部高校教師團隊聯合發起創新課程合作項目,已於多所高校陸續落地多智能體強化學習實踐課程,幫助學生通過更有趣的方式掌握機器學習、強化學習、多智能體決策等關鍵知識點。