王者榮耀:探索和發(fā)展通用AI問題
2021-05-13
歐米智能
生物體的進化速度需要數(shù)百萬年才能計算出來,而人工智能的進化速度是肉眼可見的。
圖片來自網(wǎng)絡
半百年前,人類需要用一臺重達1270公斤的電腦來對抗象棋大師時,根本沒有想到過半個世紀后,王者榮耀的AI可以進化到職業(yè)電競水平,這就是王者榮耀的AI——“絕悟”,它可以模仿玩家離線對局的樣本,為了突破上限,又采用了AI自對局的強化學習,然后在“絕悟挑戰(zhàn)”中測試強度。
《王者榮耀》執(zhí)行制作人、騰訊天美L1工作室總經(jīng)理黃藍梟在STAC首屆科創(chuàng)聯(lián)誼會上表示,“絕悟”是一個多智能體系統(tǒng),即大量能夠自主決策的AI共同協(xié)作,以實現(xiàn)一個共同且具有挑戰(zhàn)性的目標。
此外,王者榮耀團隊還開放了王者的核心機制,與騰訊AILab、相關高校、研究機構等合作,對多主體進行研究。希望通過這些研究成果,能夠在其他行業(yè)領域推廣應用,為工業(yè)機器人、救災機器人等提供幫助。
圖片來自網(wǎng)絡
做王者榮耀AI的前沿研究。
多元智能系統(tǒng)統(tǒng)(大量具有自主決策能力的AI共同協(xié)作,以達到同一目標)是前沿人工智能技術的核心研究領域,經(jīng)過多年的研究,已被廣泛應用于各行各業(yè)。例如無人倉庫,多智能體機器人完成大規(guī)模倉庫管理;智能交通車輛協(xié)同系統(tǒng),實現(xiàn)無人駕駛;智能工業(yè)機器人,物聯(lián)網(wǎng)等領域。而多代理技術都能很好地應用下來提高生產效率。
在游戲研發(fā)過程中,王者榮耀團隊發(fā)現(xiàn)MOBA游戲機制具有很強的多人協(xié)作性,在非對稱信息下的游戲空間很大,合作競技性很強,非常適合于采用多代理人工智能技術來提高生產和測試效率。
如果AI技術能夠學習人類在如此復雜的環(huán)境中實時感知、分析、理解、推理、決策和行動,它將在變化的、復雜的現(xiàn)實環(huán)境中扮演更重要的角色。
基于這一背景,基于王者榮耀游戲的特性,王者榮耀團隊與騰訊AILab合作,在王者繼續(xù)進行人工智能相關的技術研究和應用實踐,研究并開發(fā)出多智能體產品“絕悟”。
使AI學會像人一樣做出決定。
圖片來自網(wǎng)絡
“絕悟”這個名字的寓意是“絕悟”,它的技術研發(fā)始于2017年,并于2018年12月通過了頂級業(yè)余水平測試。
在2019年8月2日于吉隆坡舉行的王者榮耀冠軍杯半決賽特設環(huán)節(jié)上,“絕悟”以5v5職業(yè)選手賽區(qū)聯(lián)隊帶來的水平測試獲勝,升級到王者榮耀電競職業(yè)級別。
與之相比,“絕悟”1v1版也首次公開亮相,在上海舉行的國際數(shù)碼互動娛樂展上,ChinaJoy向頂級業(yè)余玩家開放了為期四天的體驗測試。在為期4天的2100場考試中,“絕悟”只輸4場,勝率達99.81%。
職業(yè)描述AI打王者榮耀的場景是——非完全信息多智能體協(xié)同零和即時游戲。簡單地說,AI需要在信息不完全、復雜性高的情況下做出復雜而快速的決策。
圖片來自網(wǎng)絡
10個參與者面對著一幅信息不全的巨大地圖,其中包括戰(zhàn)略規(guī)劃、英雄選擇、技能運用、路徑探索和團隊合作,這些都給他們帶來了極其復雜的情況,其中預期可能發(fā)生10的20000次方種操作,而整個宇宙原子總數(shù)只有10的80個方種操作。
從王者本身的實踐層面上,玩家可以在限時開放的「絕悟」挑戰(zhàn)中體驗AI的能力,在遇到隊友掉線時,也可以把掉線的隊友交給AI托管,但是AI并不能主宰比賽,勝負的決定權仍掌握在所有玩家手中,此外,「絕悟」只在實驗室環(huán)境下才能使用。
“絕悟”也在新英雄設計和游戲數(shù)值調整中起到了重要作用,為AI最終探索游戲打法和勝率提供參考,幫助規(guī)劃優(yōu)化游戲設計。
在2020年11月的一次平衡調整中,王者團隊想要提高公孫離的強度,“絕悟”對調整后的公孫離進行了模擬對戰(zhàn),結果顯示改變后的勝率+2.42個百分點,但部分體驗服玩家認為這將嚴重削弱公孫離。
圖片來自網(wǎng)絡
由“絕悟”到“開悟”
經(jīng)實踐驗證,王者榮耀與騰訊AILab團隊開放了多智能體研究過程中所沉淀下來的技術資產,建立了開悟開放平臺,打造了以王者榮耀核心技術為支撐,面向用戶低成本進行多智能體算法研究、教學和驗證的教學科研平臺。
他說:“我們開放王者的核心機制,提供標準界面、核心算法、脫敏訓練、評估工具和計算集群等,讓教師和同學進行多智能體機器學習算法研究,交流學習結果,對算法結果進行反復迭代升級。將來還可以提供給其他有需要的研究機構進行更接近工業(yè)化進程的研究,”王者榮耀執(zhí)行制作人、騰訊天美L1工作室總經(jīng)理黃藍梟說。
到2020年,王者榮耀將與騰訊AILab、騰訊大學、騰訊游戲學院共同舉辦首屆“王者榮耀·開悟AI+游戲大賽”,邀請18所頂尖大學的老師和同學在“開悟AI+游戲大賽”上進行學術研究和交流,并提供全方位的資源支持。
"多個智能體相互學習協(xié)作是很困難的,需要確定每個智能體的目標,并劃分主輔關系,實現(xiàn)這樣復雜的設計成本很高。"中國科學院自動化研究所興軍亮團隊提出了一個自我提升式強化學習框架,智能體可以先通過模仿學習,再通過自我互動而進階進化,再加上他們提出的一個新策略,可以有效地緩解多智能學習中的常見問題。
通過一年的實踐,活動取得了良好的成果,驗證了王者榮耀在游戲環(huán)境中人工智能技術賦能的思路。
圖片來自網(wǎng)絡
助產學,共享AI+游戲新生態(tài)。
《王者榮耀》制作人、騰訊天美L1工作室總經(jīng)理黃藍梟在STAC首屆科創(chuàng)聯(lián)誼會上宣布,將與國內頂尖大學共同建立“多智能體人工智能科研教學聯(lián)盟”,為更多的高校教師和學生賦能,為教師、學生和業(yè)界伙伴提供低門檻、內容豐富且穩(wěn)定可靠的學術研究和交流場景,這一場景將在國內高校中率先展開。
“人工智能是國家的重大戰(zhàn)略,騰訊游戲公司副總裁、騰訊游戲學院院長夏琳表示,騰訊游戲公司將與各高校進行深度產教融合,重點培養(yǎng)AI+游戲的新興科技人才。
與此同時,聚焦王者榮耀等游戲AI領域的科研,與國內外重點大學和國家重點實驗室不斷輸出對行業(yè)有價值的科研成果,AI將在國內持續(xù)發(fā)展,未來可期。
隨著人類與科技的交融,王者榮耀不斷地投入,讓AI由0到1去學習進化,并發(fā)展出一套合理的行為模式,其中的經(jīng)驗、方法和結論,短期內可以為游戲業(yè)、電競業(yè)帶來直接的推動和幫助,有望在更大范圍內產生更深遠的影響,如醫(yī)療、制造業(yè)、無人駕駛、農業(yè)、智慧城市等。從長遠來看,AI+游戲的研究,將推動AI的最終目標——探索和發(fā)展通用AI問題。



首頁
無人配送,“持證上崗”
你可能也喜歡

