利用王者榮耀複雜環境 第二屆“開悟”大賽聯動高校破局AI研究

Editor發表於2022-04-15

騰訊正在聯動高校,利用王者榮耀的複雜環境,為推動通用人工智慧研究創造各種可能性。

 

4月14日,第二屆“騰訊開悟多智慧體強化學習大賽”(以下稱“大賽”)決賽在成都落幕,來自20多所頂尖高校的AI研發團隊,經過半年來的比拼,共有4支團隊進入決賽。經過現場激烈角逐,來自清華大學計算機系的團隊獲得本屆大賽冠軍。


利用王者榮耀複雜環境   第二屆“開悟”大賽聯動高校破局AI研究


本屆大賽由騰訊AI Lab、王者榮耀、騰訊新文創總部、騰訊高校合作、騰訊遊戲學堂等共同發起。騰訊“開悟”AI開放研究平臺依託於騰訊太極機器學習平臺,為參賽團隊提供了研究資源、全棧打通的閉環科研驗證環境和輔助管理服務;算力方面,基於遨馳分散式雲作業系統的新一代全球領先的異構加速引擎技術,為本屆AI大賽全程提供資源及技術支援。

 

據開悟平臺技術專家介紹,各隊在演算法模型設計、獎勵函式設計以及訓練方式等方面,分別進行了探索嘗試,訓練出了較高強度的AI,並且在對戰中表現出了獨特的戰略風格。

 

本次賽事的四強隊伍,來自清華大學自動化系的王博源同學在分享中表示:“我們在參賽過程中極大地促進了合作能力,為今後的科研做好了鋪墊”;來自西安交通大學的王子儒同學更是表示,本次參賽經歷讓隊員們堅定了未來從事的科研方向。

 

開放AI能力,讓參賽者聚焦演算法研究

 

本屆賽事沿用過往面向高校的邀請賽制,進一步擴大了開放規模,邀請20多所國內外知名高校參賽。參賽隊伍需要在指定的時間內,在給定的資源下訓練出最優模型,並最終部署好使用最優模型的AI伺服器,提交系統完成1V1、3V3對局挑戰。

 

在賽事各階段,每支參賽隊伍都可獲得等量的訓練資源。這意味著參賽者無法透過無限加大算力來提升AI能力,而是需要不斷最佳化模型。同時,為了讓參賽者將目光聚焦於演算法本身,賽事禁止參賽者為AI編寫規則,AI只能透過行為反饋來最佳化自身策略。

 

目前AI學介面臨的四大挑戰:演算法、資料、算力、場景。研究場景稀缺、沒有資料、演算法測試困難、算力昂貴等問題一直困擾高校AI研究團隊;隨著高校對強化學習演算法研究的不斷深入,計算資源的需求量也水漲船高。除了機器資源本身,高校也缺乏容易上手的AI開放實驗平臺。

 

騰訊正在將自身的AI能力開放給AI研究者,致力於成為國內科研的助推器。

 

“開悟”是騰訊牽頭構建的AI多智慧體與複雜決策開放研究平臺,依託騰訊AI Lab和王者榮耀在演算法、算力和實驗場景方面的核心優勢,旨在為學術研究人員和演算法開發者開放國內領先、國際一流研究與應用探索平臺。

 

其中,王者榮耀為高校AI研究提供了一種現實可用的場景。這款移動端的MOBA類遊戲,具有高複雜度、高挑戰性、強協作性的特點。據統計,在王者5V5對局中,玩家的動作狀態空間高達10的20000次方,遠遠大於圍棋及其他簡單遊戲,甚至超過整個宇宙的原子總數(10的80次方)。


 利用王者榮耀複雜環境   第二屆“開悟”大賽聯動高校破局AI研究


“開悟”持續擴大開放範圍,發力AI人才教育

 

賽事之外,騰訊“開悟”AI開放研究平臺正持續擴大開放範圍,發力AI人才教育。

 

今年3月,成都大運會“數智競技”邀請賽正式啟動,該邀請賽由大運會執委會主辦、騰訊承辦,邀請全球12所高校的學生於開悟平臺上進行AI技術博弈,最終成績將於今年7月大運會期間釋出。

 

騰訊新文創總部自2020年落戶成都,不斷探索區域科技創新、文化創新,與城市的整體力量合作,大運會世界大學生數智競技邀請賽和第二屆“開悟"Al大賽落地蓉城,是立足成都,講好科技故事的創新實踐。透過與網際網路企業的協作以及連線新型數字文化載體,推動建設人工智慧開放交流的“科技+體育”新體系。

 

今年上半年,“開悟”平臺還基於兩屆賽事的積累,與北京大學、清華大學、電子科技大學、中科大四所國內高校合作開發了創新課程,進一步幫助高校學生在實踐中理解強化學習知識,目前相關課程已經陸續開課。

 

從短期來看,若AI能在類似“王者榮耀”這樣複雜的環境中,學會人一樣實時感知、分析、理解、推理、決策到行動,就可能在多變、複雜的真實環境中發揮更大作用。下一個AI里程碑可能會在複雜策略遊戲中誕生。

 

長遠來說,AI攻克遊戲的能力將有助於解決真實世界的複雜問題。藉助開悟平臺,騰訊AI Lab和王者榮耀希望聯動更多有興趣的高校和學者參與,共同在遊戲環境中探討和研究這些難題,並尋找AI新技術覆蓋更多場景的可能性,服務醫療、工業、農業、交通等行業。

相關文章