利用王者榮耀複雜環境第二屆“開悟”大賽聯動高校破局AI研究

騰訊正在聯動高校，利用王者榮耀的複雜環境，為推動通用人工智慧研究創造各種可能性。

4月14日，第二屆“騰訊開悟多智慧體強化學習大賽”（以下稱“大賽”）決賽在成都落幕，來自20多所頂尖高校的AI研發團隊，經過半年來的比拼，共有4支團隊進入決賽。經過現場激烈角逐，來自清華大學計算機系的團隊獲得本屆大賽冠軍。

本屆大賽由騰訊AI Lab、王者榮耀、騰訊新文創總部、騰訊高校合作、騰訊遊戲學堂等共同發起。騰訊“開悟”AI開放研究平臺依託於騰訊太極機器學習平臺，為參賽團隊提供了研究資源、全棧打通的閉環科研驗證環境和輔助管理服務；算力方面，基於遨馳分散式雲作業系統的新一代全球領先的異構加速引擎技術，為本屆AI大賽全程提供資源及技術支援。

據開悟平臺技術專家介紹，各隊在演算法模型設計、獎勵函式設計以及訓練方式等方面，分別進行了探索嘗試，訓練出了較高強度的AI，並且在對戰中表現出了獨特的戰略風格。

本次賽事的四強隊伍，來自清華大學自動化系的王博源同學在分享中表示：“我們在參賽過程中極大地促進了合作能力，為今後的科研做好了鋪墊”；來自西安交通大學的王子儒同學更是表示，本次參賽經歷讓隊員們堅定了未來從事的科研方向。

開放AI能力，讓參賽者聚焦演算法研究

本屆賽事沿用過往面向高校的邀請賽制，進一步擴大了開放規模，邀請20多所國內外知名高校參賽。參賽隊伍需要在指定的時間內，在給定的資源下訓練出最優模型，並最終部署好使用最優模型的AI伺服器，提交系統完成1V1、3V3對局挑戰。

在賽事各階段，每支參賽隊伍都可獲得等量的訓練資源。這意味著參賽者無法透過無限加大算力來提升AI能力，而是需要不斷最佳化模型。同時，為了讓參賽者將目光聚焦於演算法本身，賽事禁止參賽者為AI編寫規則，AI只能透過行為反饋來最佳化自身策略。

目前AI學介面臨的四大挑戰：演算法、資料、算力、場景。研究場景稀缺、沒有資料、演算法測試困難、算力昂貴等問題一直困擾高校AI研究團隊；隨著高校對強化學習演算法研究的不斷深入，計算資源的需求量也水漲船高。除了機器資源本身，高校也缺乏容易上手的AI開放實驗平臺。

騰訊正在將自身的AI能力開放給AI研究者，致力於成為國內科研的助推器。

“開悟”是騰訊牽頭構建的AI多智慧體與複雜決策開放研究平臺，依託騰訊AI Lab和王者榮耀在演算法、算力和實驗場景方面的核心優勢，旨在為學術研究人員和演算法開發者開放國內領先、國際一流研究與應用探索平臺。

其中，王者榮耀為高校AI研究提供了一種現實可用的場景。這款移動端的MOBA類遊戲，具有高複雜度、高挑戰性、強協作性的特點。據統計，在王者5V5對局中，玩家的動作狀態空間高達10的20000次方，遠遠大於圍棋及其他簡單遊戲，甚至超過整個宇宙的原子總數（10的80次方）。

利用王者榮耀複雜環境第二屆“開悟”大賽聯動高校破局AI研究

“開悟”持續擴大開放範圍，發力AI人才教育

賽事之外，騰訊“開悟”AI開放研究平臺正持續擴大開放範圍，發力AI人才教育。

今年3月，成都大運會“數智競技”邀請賽正式啟動，該邀請賽由大運會執委會主辦、騰訊承辦，邀請全球12所高校的學生於開悟平臺上進行AI技術博弈，最終成績將於今年7月大運會期間釋出。

騰訊新文創總部自2020年落戶成都，不斷探索區域科技創新、文化創新，與城市的整體力量合作，大運會世界大學生數智競技邀請賽和第二屆“開悟"Al大賽落地蓉城，是立足成都，講好科技故事的創新實踐。透過與網際網路企業的協作以及連線新型數字文化載體，推動建設人工智慧開放交流的“科技+體育”新體系。

今年上半年，“開悟”平臺還基於兩屆賽事的積累，與北京大學、清華大學、電子科技大學、中科大四所國內高校合作開發了創新課程，進一步幫助高校學生在實踐中理解強化學習知識，目前相關課程已經陸續開課。

從短期來看，若AI能在類似“王者榮耀”這樣複雜的環境中，學會人一樣實時感知、分析、理解、推理、決策到行動，就可能在多變、複雜的真實環境中發揮更大作用。下一個AI里程碑可能會在複雜策略遊戲中誕生。

長遠來說，AI攻克遊戲的能力將有助於解決真實世界的複雜問題。藉助開悟平臺，騰訊AI Lab和王者榮耀希望聯動更多有興趣的高校和學者參與，共同在遊戲環境中探討和研究這些難題，並尋找AI新技術覆蓋更多場景的可能性，服務醫療、工業、農業、交通等行業。

利用王者榮耀複雜環境 第二屆“開悟”大賽聯動高校破局AI研究

開放AI能力，讓參賽者聚焦演算法研究

“開悟”持續擴大開放範圍，發力AI人才教育

相關文章

利用王者榮耀複雜環境第二屆“開悟”大賽聯動高校破局AI研究