近年來,人工智能(AI)技術(shù)發(fā)展迅猛,并被快速推動(dòng)應(yīng)用到社會(huì)生活的各個(gè)方面,智能博弈領(lǐng)域正是其應(yīng)用與實(shí)踐的熱點(diǎn)領(lǐng)域之一。2019年12月28日,第三屆全國兵棋推演大賽人機(jī)挑戰(zhàn)賽暨首屆全國智能博弈論壇在火熱的氛圍中落下帷幕,來自軍地科研院所、院校、國防軍工企業(yè)和智能博弈領(lǐng)域的260余位專家、學(xué)者觀摩了比賽盛況并參加了論壇交流。
所謂“人機(jī)挑戰(zhàn)賽”,即人類選手與AI智能體的對(duì)戰(zhàn)。本次挑戰(zhàn)賽的兵棋AI智能體——“戰(zhàn)顱”由國防科技大學(xué)系統(tǒng)工程學(xué)院研制;參加挑戰(zhàn)的人類選手是通過全國兵棋推演大賽總決賽篩選出的11名優(yōu)秀選手。比賽吸引了眾多與會(huì)人員的關(guān)注,大家?guī)е鴱?qiáng)烈的好奇心爭(zhēng)相目睹“人與人工智能”的精彩對(duì)決。
比賽當(dāng)日,國內(nèi)眾多智能博弈與兵棋領(lǐng)域的專家蒞臨現(xiàn)場(chǎng)觀摩,中國指揮與控制學(xué)會(huì)監(jiān)事長(zhǎng)、中國工程院戴浩院士等嘉賓現(xiàn)場(chǎng)觀摩了比賽并致辭。比賽開幕式由中國指揮與控制學(xué)會(huì)理事劉忠教授主持。全國兵棋推演大賽總導(dǎo)演兼總裁判長(zhǎng)楊南征、“戰(zhàn)顱”首席設(shè)計(jì)師馮旸赫、優(yōu)秀參賽選手代表呂峒臻作為點(diǎn)評(píng)嘉賓,對(duì)現(xiàn)場(chǎng)比賽進(jìn)行了精彩講解和點(diǎn)評(píng)。
比賽開始前,大賽總導(dǎo)演兼總裁判長(zhǎng)楊南征介紹說,“戰(zhàn)顱”在賽前已經(jīng)與全國兵棋推演大賽總決賽前48名的選手對(duì)戰(zhàn)了36場(chǎng),目前保持全勝。本次人機(jī)對(duì)抗賽特別邀請(qǐng)了獲得全國賽特等獎(jiǎng)、一等獎(jiǎng)、二等獎(jiǎng)的11名優(yōu)秀選手分別挑戰(zhàn)智能體,將為我們帶來22場(chǎng)精彩對(duì)決。對(duì)于比賽結(jié)果,他更希望人類選手能夠挑戰(zhàn)成功。
經(jīng)過1個(gè)半小時(shí)的緊張角逐,“戰(zhàn)顱”以全勝戰(zhàn)績(jī)贏得了冠軍。馮旸赫表示,“戰(zhàn)顱”的研發(fā)基于智能系統(tǒng)工程思想,融合知識(shí)推理、監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等一系列方法構(gòu)建智能決策模型,充分利用人人對(duì)抗產(chǎn)生的優(yōu)質(zhì)數(shù)據(jù)和機(jī)機(jī)自打產(chǎn)生的大數(shù)據(jù)對(duì)智能體進(jìn)行訓(xùn)練。截止參賽,“戰(zhàn)顱”一共訓(xùn)練了136天,每天一個(gè)計(jì)算節(jié)點(diǎn)大約自打160盤。據(jù)悉,“戰(zhàn)顱”的主創(chuàng)人員是國防科大一群平均年齡僅24歲的碩士生博士生,該智能體是他們集中攻關(guān)4個(gè)多月的智慧結(jié)晶。
中國指揮與控制學(xué)會(huì)智能博弈與兵棋推演專委會(huì)主任委員黃金才教授表示,從近一個(gè)月的參賽表現(xiàn)看,智能體不僅學(xué)會(huì)了一些人類選手的經(jīng)典戰(zhàn)法,還獨(dú)創(chuàng)了部分特有的戰(zhàn)法戰(zhàn)術(shù)。當(dāng)然,從比賽中也可以看出“戰(zhàn)顱”目前還存在很多局限性,這次戰(zhàn)勝人類選手也只是智能博弈技術(shù)在實(shí)踐應(yīng)用中邁出的第一步,他表示,將帶領(lǐng)研發(fā)團(tuán)隊(duì)進(jìn)一步探索智能博弈的“無人區(qū)”,構(gòu)建具有持續(xù)學(xué)習(xí)能力的智能體。
在11位人類挑戰(zhàn)者中,來自軍地院校的王俊翔、武煜強(qiáng)、余雷脫穎而出,成為人類選手的“前三甲”。三位選手在賽后采訪時(shí)表示,“戰(zhàn)顱”的優(yōu)點(diǎn)是數(shù)據(jù)分析、學(xué)習(xí)能力強(qiáng),能針對(duì)人類選手的操作、根據(jù)實(shí)時(shí)態(tài)勢(shì)改變應(yīng)對(duì)策略,擅長(zhǎng)精算、細(xì)算;而人類選手可以通過奇策奇招,針對(duì)“戰(zhàn)顱”的策略漏洞進(jìn)行針對(duì)性打擊。
針對(duì)此次大賽的結(jié)果,劉忠教授表示,AI的獲勝并不代表人工智能技術(shù)在任務(wù)規(guī)劃領(lǐng)域超越了人類,AI智能體是在人類智慧的基礎(chǔ)上研發(fā)出來的,特別是在智能博弈領(lǐng)域,人工智能的學(xué)習(xí)效率及泛化性還有待提高,針對(duì)智能指揮與控制,要推動(dòng)智能博弈技術(shù)從實(shí)驗(yàn)室走向?qū)嵺`應(yīng)用,仍需砥礪前行。
在下午舉辦的首屆全國智能博弈論壇上,來自兵棋推演、智能指控、機(jī)器學(xué)習(xí)等領(lǐng)域的四位專家分別圍繞“兵棋推演的前世今生”、“智能指揮控制的實(shí)踐與思考”、“多智能體強(qiáng)化學(xué)習(xí)中的博弈與均衡”、“面向星際爭(zhēng)霸的大規(guī)模智能體訓(xùn)練技術(shù)”等四個(gè)主題做了精彩報(bào)告,為現(xiàn)場(chǎng)觀眾帶來了一場(chǎng)智能博弈與兵棋推演的“學(xué)術(shù)盛宴”。
本次人機(jī)挑戰(zhàn)賽作為中國指揮與控制學(xué)會(huì)主辦的2019第三屆全國兵棋推演大賽的一項(xiàng)專題賽事,由國防科技大學(xué)系統(tǒng)工程學(xué)院和CICC智能博弈與兵棋推演專業(yè)委員會(huì)協(xié)辦,活動(dòng)得到了中國電科五十二研究所、北京華戍防務(wù)技術(shù)有限公司等單位的大力支持。隨著AlphaGo、AlphaStAR等不斷攻破人類智能高地,人工智能發(fā)展將對(duì)各行各業(yè)產(chǎn)生沖擊甚至顛覆性影響。本次“人機(jī)挑戰(zhàn)賽”作為探索智能博弈新方法、國防教育新模式的有效手段和載體,必將對(duì)人工智能技術(shù)的實(shí)踐應(yīng)用產(chǎn)生重要影響。
供稿:程光權(quán)、吳克宇
圖片:何書遠(yuǎn)、劉世旋
編輯:楊勇、劉亞麗