91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“深綠”及AlphaGo對(duì)指揮與控制智能化的啟示

mK5P_AItists ? 來源:lq ? 2018-12-10 14:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要: 隨著未來戰(zhàn)爭(zhēng)日趨復(fù)雜、人工智能突飛猛進(jìn), 指揮與控制向智能化發(fā)展成為大勢(shì)所趨. 美軍的 “深綠” 計(jì)劃項(xiàng)目雖因各 種原因暫停, 但其思路和方法值得借鑒. AlphaGo 在圍棋領(lǐng)域戰(zhàn)勝人類頂尖水平, 其采用的方法也有一定的參考價(jià)值. 簡(jiǎn)要介紹了二者采用的方法, 并開展了方法適用性分析, 研究了其在指揮與控制領(lǐng)域的應(yīng)用機(jī)理及能力, 分析了應(yīng)用的難點(diǎn)及對(duì)策, 并對(duì) 指揮與控制智能化的發(fā)展提出了啟示和建議。

指揮與控制是一項(xiàng)跨物理域、信息域和認(rèn)知域的學(xué)科, 既包含工程, 也包含藝術(shù).受到信息技術(shù)發(fā)展的推動(dòng)和制約, 多年來指揮與控制技術(shù)的發(fā)展大量集中在信息域和物理域, 在指揮與控制系統(tǒng)工程 方面取得了長(zhǎng)足的進(jìn)步, 但在指揮與控制輔助決 策方面, 尤其是涉及指揮藝術(shù)的認(rèn)知域, 一直停留在初級(jí)階段. 雖然設(shè)計(jì)了一些輔助計(jì)算模型,但在現(xiàn)代化戰(zhàn)爭(zhēng)復(fù)雜、快速、多變的特性面前, 可信度、實(shí)用 性遠(yuǎn)遠(yuǎn)不能滿足實(shí)際需要. 美軍曾推出 “深綠” 計(jì)劃, 旨在探索智能化的指揮與控制輔助決策, 但也因戰(zhàn)爭(zhēng)的復(fù)雜性等種種原因未獲成功.人工智能技術(shù)近年來發(fā)展迅猛,尤以深度學(xué)習(xí)技術(shù)為代表, 在語(yǔ)音識(shí)別、圖像識(shí)別、運(yùn)動(dòng)感知等領(lǐng)域紛紛取得了突破性的進(jìn)展.AlphaGo與李世石的一場(chǎng)圍棋大戰(zhàn)獲得了舉世矚目, 最終人工智能以4:1 的結(jié)果戰(zhàn)勝了人類, 代表其在認(rèn)知領(lǐng)域再下一城,一時(shí)間掀起了熱議. 緊接著, AlphaGo宣稱要挑戰(zhàn)星際爭(zhēng)霸, 更是將人工智能推向了神壇. 圍棋和星際爭(zhēng)霸這兩類游戲,和軍事指揮與控制有著緊密的聯(lián)系, 尤其是星際爭(zhēng)霸與戰(zhàn)爭(zhēng)有著很高的相似度. 因此, 很自然的想法, 就是將人工智能技術(shù)應(yīng)用于作戰(zhàn)指揮. 隨著 美軍宣稱要將人工智能列為 “改變游戲規(guī)則” 的顛覆性技術(shù)大力發(fā)展, 國(guó)內(nèi)外對(duì)指揮與控制智能化的呼聲也越來越高.相比之下, AlphaGo是智能化技術(shù)向軍事領(lǐng)域的推進(jìn), 而“深綠”則是從軍事領(lǐng)域推智能化. 兩者雖然一成一敗, 都不失為軍事指揮與控制智能化發(fā)展的里程碑.其中涉及的技術(shù)方法,很值得深入研究.本文簡(jiǎn)要介紹了二者采用的技術(shù)方法, 并開展了方法 適用性分析, 研究了其在指揮與控制領(lǐng)域的應(yīng)用機(jī)理及能力, 分析了應(yīng)用的難點(diǎn)及對(duì)策, 并作為拋磚引玉, 對(duì)指揮與控制智能化的發(fā)展提出了啟示和建議.

1 方法簡(jiǎn)介及適用性分析

1.1 美軍 “深綠” 系統(tǒng)

“深綠”計(jì)劃是美國(guó)國(guó)防部高級(jí)研究計(jì)劃局DARPA支持的一項(xiàng)面向美國(guó)陸軍、旅級(jí)的指揮與控制領(lǐng)域的研究項(xiàng)目, 是將人工智能引入作戰(zhàn)輔助決策的一項(xiàng)嘗試探索. 文獻(xiàn)對(duì) “深綠” 計(jì)劃中應(yīng)用的技術(shù)、執(zhí)行的情況、及其面臨的困難和挑戰(zhàn) 進(jìn)行了深入探討.

深綠的核心技術(shù)本質(zhì)上是基于實(shí)時(shí)態(tài)勢(shì)的動(dòng)態(tài) 仿真, 也是 “平行仿真” 的核心要義. 仿真擅長(zhǎng)逼真地、量化地模擬復(fù)雜多因素綜合作用的過程和結(jié) 果, 而這是很難用傳統(tǒng)的數(shù)學(xué)公式描述出來的. 基于 實(shí)時(shí)態(tài)勢(shì)做仿真, 可以量化地估計(jì)未來某一時(shí)刻的戰(zhàn)場(chǎng)狀態(tài),也可以幫助人理解各種量變?cè)诓煌瑫r(shí)間、空間上交叉產(chǎn)生、綜合作用之后可能帶來的質(zhì)變, 這種質(zhì)變代表具有不同意義的戰(zhàn)場(chǎng)態(tài)勢(shì)局面. 在復(fù)雜戰(zhàn)爭(zhēng)中, 可能導(dǎo)致不同態(tài)勢(shì)局面的因素眾多, 包含各種隨機(jī)性、偶然性, 一個(gè)細(xì)微的因素可能改變整個(gè)戰(zhàn) 局的發(fā)展. 使用仿真的方法, 可以盡可能地將每一個(gè)細(xì)節(jié)因素的影響都模擬出來, 只要模型足夠逼真, 計(jì)算平臺(tái)足以支撐.

然而, 用仿真來預(yù)測(cè)戰(zhàn)場(chǎng)變化的一大缺點(diǎn), 是無法應(yīng)對(duì)分支太多的情形. 包括敵方戰(zhàn)術(shù)策略、我方應(yīng)對(duì)策略、環(huán)境變化、隨機(jī)過程等不確定性都會(huì)導(dǎo)致分支出現(xiàn). 而各種不確定性的組合爆炸是 “深綠” 面臨的最大難題. 按照深綠的方法, 每種可能的分支都 要仿真模擬一遍才行, 那么分支一多, 這種仿真模擬 的計(jì)算資源和時(shí)間成本就十分高昂, 以至于無法實(shí) 現(xiàn). 但事實(shí)證明, 戰(zhàn)爭(zhēng)迷霧無處不在, 只有戰(zhàn)術(shù)層面、 短時(shí)間內(nèi), 不確定性才相對(duì)較少. 但很明顯, 戰(zhàn)術(shù)層面、短時(shí)間內(nèi)的預(yù)測(cè)對(duì)指揮員而言非常簡(jiǎn)單, 用機(jī)器預(yù)測(cè)的意義不大. 此外, 態(tài)勢(shì)與決策的輸入輸出、數(shù)據(jù)的決定性、計(jì)算機(jī)與人協(xié)同等問題, 都是 “深綠” 計(jì)劃面臨的難題.

美軍于 2011 財(cái)年終止 “深綠” 計(jì)劃的原因是多方面的, 包括技術(shù)上存在的風(fēng)險(xiǎn), 也包括經(jīng)費(fèi)、人員 等各方面因素. 美軍高調(diào)宣稱終止某項(xiàng)研究計(jì)劃的背后, 往往在隱秘地持續(xù)開展相關(guān)研究. “深綠” 計(jì)劃表面上雖然被叫停, 不排除相關(guān)研究仍在繼續(xù)的可能.

1.2 谷歌 AlphaGo系統(tǒng)

相比于軍方自頂向下推進(jìn)指揮與控制智能化的 努力困難重重, AlphaGo 在民用領(lǐng)域取得的突破可謂 另辟蹊徑, 后來居上.

AlphaGo 所采用的核心技術(shù)是深度學(xué)習(xí)和蒙特 卡洛搜索,特別擅于分析博弈層面的問題, 而且已 被證明比人類更擅長(zhǎng)應(yīng)對(duì)天文數(shù)字般的組合不確定 性. 其通過訓(xùn)練深度神經(jīng)網(wǎng)絡(luò), 實(shí)現(xiàn)對(duì)人類直覺思維 的模擬, 是在神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用中非常有魄力的一 種創(chuàng)新. 神經(jīng)網(wǎng)絡(luò)雖然和人類大腦中的神經(jīng)元系統(tǒng) 相差甚遠(yuǎn), 卻被實(shí)踐證明可以模擬非常復(fù)雜的映射關(guān)系. 而人類的直覺就是一種說不清、道不明的潛 在映射關(guān)系. 機(jī)器通過千萬級(jí)別的訓(xùn)練樣本, 學(xué)會(huì)了 人類的這種直覺, 可以直接生成當(dāng)前局勢(shì)的 “應(yīng)對(duì)良 策”(實(shí)際上是人類高手在同類局勢(shì)下使用較多的棋 招), 而不是對(duì)每種可能性都推一遍, 同時(shí)生成對(duì)最終 輸贏結(jié)果的價(jià)值估計(jì) (實(shí)際上是人類類似棋局最終 輸贏結(jié)果的統(tǒng)計(jì)分布), 并在有限范圍內(nèi)開展推演求 證 (由于縮小了范圍, 屏蔽了細(xì)節(jié), 推演效率高). 因此, 使用 AlphaGo 的方法, 可以幫助人們高效演算作 戰(zhàn)中的博弈問題, 從而尋求戰(zhàn)法策略的優(yōu)化.

然而, AlphaGo直接用于作戰(zhàn)設(shè)計(jì)和分析是有問題的, 主要是屏蔽了太多細(xì)節(jié)導(dǎo)致的失真。和圍棋不同, 戰(zhàn)場(chǎng)上任何一招一策, 能達(dá)到何種效果, 都是和具體對(duì)象、環(huán)境相關(guān)的. 棋盤上看似簡(jiǎn)單的一步棋, 實(shí)際效果可能未必落在想要落在的那個(gè)格子里. 此外, 使用 AlphaGo方法, 還面臨著戰(zhàn)場(chǎng)抽象建模、非輪次博弈、非單一目標(biāo)、不完全信息、不完備規(guī)則、缺訓(xùn)練樣本等一系列問題, 下文中會(huì)詳細(xì)闡述. 換言之, 單靠棋盤上的博弈驗(yàn)證戰(zhàn)法策略的有效性, 有 “紙上 談兵” 之嫌, 具有一定的意義, 但實(shí)用性不強(qiáng).

2 應(yīng)用機(jī)理及能力分析

2.1 應(yīng)用機(jī)理

“深綠”和 AlphaGo所采用的兩種方法, 既可以 分別應(yīng)用在指揮與控制中, 也可以結(jié)合起來應(yīng)用, 取 決于實(shí)際需求.

1) “深綠”—— 戰(zhàn)術(shù)級(jí)仿真推演

從美軍 “深綠” 系統(tǒng)的設(shè)計(jì)初衷和其應(yīng)用效果來 看, 其更適合戰(zhàn)術(shù)層級(jí)的仿真推演. 一方面, 戰(zhàn)術(shù)層 級(jí)的實(shí)體行為模型較易建立, 武器平臺(tái)的運(yùn)用規(guī)則 相對(duì)簡(jiǎn)單、作用效果相對(duì)容易量化評(píng)估. 另一方面, 戰(zhàn)術(shù)層級(jí)的不確定性相對(duì)較小, 因?yàn)闀r(shí)間相對(duì)較短、 規(guī)模相對(duì)較小、流程相對(duì)固定. 再一方面, 戰(zhàn)術(shù)層級(jí) 的分析對(duì)于精確量化的要求更高, 武器平臺(tái)的控制、 打擊效果的評(píng)估等都需要精確量化的數(shù)據(jù)支撐. 在 戰(zhàn)術(shù)級(jí)運(yùn)用仿真推演, 可以充分發(fā)揮機(jī)器精確的計(jì) 算能力.

2) AlphaGo—— 戰(zhàn)略、戰(zhàn)役級(jí)博弈推理

從 AlphaGo 定位于棋類游戲來看, 其更適合戰(zhàn) 略、戰(zhàn)役層級(jí)的博弈推理. 棋招類似于戰(zhàn)法, 走一 步棋類似于指揮員下定一步作戰(zhàn)行動(dòng)的決心. 通過 AlphaGo 扮演 “藍(lán)軍” 指揮員, 與扮演 “紅軍” 的人類 指揮員互相拆招喂招, 可以幫助指揮員定性地分析 各種戰(zhàn)法相互作用、多個(gè)回合之后的可能結(jié)果. 戰(zhàn)爭(zhēng) 是不確定性的王國(guó), AlphaGo 擅長(zhǎng)的就是從大量不確 定性中尋求可行解. 另外, AlphaGo 采用的自我博弈 方法, 還能幫助指揮員從龐大的解空間中自動(dòng)尋找最有可能取勝的戰(zhàn)法組合, 幫助實(shí)現(xiàn)戰(zhàn)法策略的優(yōu) 化.

3) 兩者結(jié)合 —— 一體化作戰(zhàn)設(shè)計(jì)分析

然而, AlphaGo 真正要用在指揮與控制領(lǐng)域, 實(shí) 現(xiàn)從棋類游戲到戰(zhàn)爭(zhēng)推演的轉(zhuǎn)化, 就要和 “深綠” 的 方法相結(jié)合, 互相取長(zhǎng)補(bǔ)短.

結(jié)合應(yīng)用的機(jī)理如圖 1 所示, 指揮員和機(jī)器在 棋盤上進(jìn)行對(duì)弈, 通過仿真環(huán)境實(shí)現(xiàn)和真實(shí)戰(zhàn)場(chǎng)的 對(duì)接. 首先, 指揮員在棋盤上設(shè)計(jì)戰(zhàn)法, 相當(dāng)于走出 一步棋,“深綠” 系統(tǒng)使用草圖到計(jì)劃的功能, 將該戰(zhàn) 法細(xì)化成具體可操作的行動(dòng)方案, 并基于實(shí)時(shí)接入 的戰(zhàn)場(chǎng)數(shù)據(jù), 通過仿真模擬出方案執(zhí)行后的效果, 將該效果抽象之后呈現(xiàn)在棋盤上, 即通過仿真估計(jì)出 棋子可能落在哪一格. 接著, AlphaGo 用其深度學(xué)習(xí) 得到的策略網(wǎng)絡(luò), 生成敵方的戰(zhàn)法, “深綠” 系統(tǒng)將其 細(xì)化成方案, 仿真出效果并抽象到棋盤上, 從而完成 雙方一輪走棋. AlphaGo 再用估值網(wǎng)絡(luò)估計(jì)一下當(dāng)前 盤面的勝負(fù)概率, 并用蒙特卡洛搜索進(jìn)行推演求證, 供指揮員分析參考. 按照這種方法, 戰(zhàn)略、戰(zhàn)役、戰(zhàn)術(shù)層級(jí)得到了兼 顧, 兩種方法形成了優(yōu)勢(shì)互補(bǔ), AlphaGo 解決了不確 定性的問題, “深綠” 實(shí)現(xiàn)了 “紙上談兵” 和實(shí)際戰(zhàn)場(chǎng) 的結(jié)合, 因此, 可用于一體化的作戰(zhàn)設(shè)計(jì)分析.

2.2 應(yīng)用能力

在指揮與控制領(lǐng)域應(yīng)用 “深綠” 和 AlphaGo的方法, 可以實(shí)現(xiàn)很多前所未有的功能, 支撐戰(zhàn)前推演、實(shí)時(shí)預(yù)測(cè)、臨機(jī)決策、精準(zhǔn)控制、戰(zhàn)后評(píng)估等一系列指揮與控制業(yè)務(wù).

1) 博弈式籌劃推演

在戰(zhàn)前, 可以將 AlphaGo和 “深綠” 結(jié)合起來, 實(shí) 現(xiàn)博弈式的籌劃推演. 一種是人 - 機(jī)博弈: 人類指揮員設(shè)計(jì)我方戰(zhàn)法, AlphaGo 設(shè)計(jì)敵方戰(zhàn)法, “深綠” 負(fù)責(zé)行動(dòng)方案細(xì)化生成、行動(dòng)效果模擬抽象, AlphaGo 估計(jì)勝負(fù)概率, 人類指揮員可以選擇繼續(xù)往下走, 或者悔棋重新設(shè)計(jì)戰(zhàn)法, 重新推演, 以此反復(fù)修改優(yōu)化方案. 另一種是機(jī) - 機(jī)博弈: AlphaGo 用自我博弈的方法, 同時(shí)設(shè)計(jì)敵、我戰(zhàn)法, 通過隨機(jī)選擇戰(zhàn)法的方 式, 把各種可能的戰(zhàn)法組合都推演一遍, 并自動(dòng)對(duì)推 演結(jié)果進(jìn)行批處理分析、比對(duì), 從而幫助人類指揮員尋找較為理想的方案. 由于人類指揮員在設(shè)計(jì)方案時(shí)往往具有思維定勢(shì), 容易忽略掉一些可行解, 而 器采用有限范圍內(nèi)的解空間搜索方式, 或許能搜出 一些人想不到的方案, 其中不乏 “奇招、妙招”.

2) 實(shí)時(shí)態(tài)勢(shì)預(yù)測(cè)

在戰(zhàn)中, 可以將 AlphaGo 和 “深綠” 結(jié)合起來, 實(shí) 現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)的實(shí)時(shí)預(yù)測(cè). 其中, AlphaGo 主要負(fù)責(zé)敵 方的出招預(yù)測(cè), 即預(yù)測(cè)敵方在當(dāng)前形勢(shì)下, 下一步可 能采用的戰(zhàn)法. 但按其方法原理, 其只能預(yù)測(cè)當(dāng)前局 勢(shì)下令對(duì)手贏面最大的一招, 而無法預(yù)測(cè)對(duì)手可能 采用的 “昏招” 或 “險(xiǎn)招”. “深綠” 主要負(fù)責(zé)戰(zhàn)術(shù)層面 的戰(zhàn)場(chǎng)狀態(tài)預(yù)測(cè), 一是按敵我當(dāng)前戰(zhàn)法打下去, 量化 估計(jì)下一時(shí)刻可能的戰(zhàn)場(chǎng)狀態(tài), 二是考慮環(huán)境、對(duì)抗 中的少量隨機(jī)性, 或敵我戰(zhàn)法的少量可選項(xiàng), 歸納出 短時(shí)間內(nèi)未來態(tài)勢(shì)可能出現(xiàn)的幾種局面.

3) 臨機(jī)快速?zèng)Q策

AlphaGo 的一大特點(diǎn), 是克服大量未知不確定性的組合爆炸, 模擬人類的棋感直覺, 根據(jù)當(dāng)前盤面形勢(shì)快速拆招解招. 這種能力如果用在臨機(jī)指揮中, 可以快速生成決策建議, 尤其是在突遭變化、敵方后招 難以捉摸, 而形勢(shì)又特別緊急的情況下, 可以避免人 類指揮員容易出現(xiàn)的猶豫不決現(xiàn)象, 提升決策效率. 更重要的是, AlphaGo 在訓(xùn)練時(shí)使用的樣本很多, 可以模擬很多高水平指揮員的共性直覺, 理論上其生成的建議有可能會(huì)優(yōu)于單個(gè)人類指揮員. 當(dāng)然, 以目前人工智能的水平, 支持戰(zhàn)前籌劃還行, 支持戰(zhàn)中指揮有點(diǎn)不太現(xiàn)實(shí), 但如果 AlphaGo攻克了星際爭(zhēng)霸之類的實(shí)時(shí)競(jìng)技類游戲, 那就完全不同了.

4) 前饋式精準(zhǔn)控制

深綠基于仿真的實(shí)時(shí)量化預(yù)測(cè)能力, 可以在行動(dòng)執(zhí)行過程中, 模擬戰(zhàn)場(chǎng)多因素綜合作用的結(jié)果, 超實(shí)時(shí)預(yù)測(cè)行動(dòng)執(zhí)行的效果, 并根據(jù)實(shí)時(shí)數(shù)據(jù)動(dòng)態(tài)修正預(yù)測(cè)結(jié)果. 指揮員可以實(shí)時(shí)把握行動(dòng)預(yù)計(jì)效果同預(yù)期之間的偏差, 提前對(duì)行動(dòng)進(jìn)行調(diào)整. 過去都是根據(jù)當(dāng)前行動(dòng)執(zhí)行的結(jié)果, 來調(diào)整下一步的行動(dòng), 是在偏差已經(jīng)產(chǎn)生情況下的調(diào)控. 而通過超前預(yù)測(cè)引入的反饋, 是在偏差尚未產(chǎn)生之前的調(diào)控, 類似控制論 中的前饋式控制, 可以幫助指揮員防患于未然. 在此基礎(chǔ)上, 如果仿真模型的粒度越細(xì), 則效果預(yù)測(cè)就越精確, 控制的精準(zhǔn)度就越高.

5) 戰(zhàn)后評(píng)估訓(xùn)練

一方面, 戰(zhàn)前的博弈式推演方法也可以用在戰(zhàn)后, 對(duì)各種戰(zhàn)法進(jìn)行博弈演練, 發(fā)現(xiàn)戰(zhàn)法存在的問題, 從而進(jìn)行優(yōu)化. 另一方面, 利用 AlphaGo中的深度學(xué)習(xí)技術(shù), 還可以實(shí)現(xiàn)各種作戰(zhàn)模型的訓(xùn)練優(yōu)化. 很多作戰(zhàn)模型因?yàn)橛绊懸蛩靥?、作用機(jī)理復(fù)雜, 傳統(tǒng)數(shù)學(xué)模型難以精確擬合. 例如部隊(duì)實(shí)戰(zhàn)能力, 受敵我兵力配屬、武器配備、使用戰(zhàn)法、訓(xùn)練水平、士氣、相對(duì)位置、戰(zhàn)場(chǎng)環(huán)境等諸多因素影響, 一直以來都很難建模. 而指揮員和部隊(duì)一起摸爬滾打多年, 對(duì)其實(shí)戰(zhàn)能力的估計(jì)是比較準(zhǔn)確的, 這種經(jīng)驗(yàn)性的直覺判斷, 類似 AlphaGo 對(duì)盤面勝負(fù)概率的估計(jì). 神經(jīng)網(wǎng)絡(luò)具備超強(qiáng)的分類/擬合性能, 如果給定歷史案例中各種情況下的戰(zhàn)況數(shù)據(jù), 用深度學(xué)習(xí)方式或許能擬合出 一個(gè)較為精確的模型出來.

3 技術(shù)應(yīng)用面臨的挑戰(zhàn)

“深綠” 計(jì)劃面臨的挑戰(zhàn)如前所述, 包括戰(zhàn)爭(zhēng)的復(fù)雜不確定性、模型的精確性、計(jì)算資源的占用性等. AlphaGo的方法雖然在圍棋領(lǐng)域取得了杰出的成就, 并且具有一定的通用性, 但真正應(yīng)用在作戰(zhàn)指 揮與控制領(lǐng)域, 還面臨許多挑戰(zhàn).

1) 戰(zhàn)場(chǎng)抽象建模

棋盤上, 車無輪、馬無韁, 一切都是簡(jiǎn)化過的. 而現(xiàn)實(shí)戰(zhàn)爭(zhēng)太復(fù)雜, 要考慮的細(xì)節(jié)因素太多, 只有抽象到棋盤層面, 才有可能分析戰(zhàn)法博弈. 但如何抽象, 才能做到既簡(jiǎn)化了繁冗的細(xì)節(jié), 又保留了博弈的本質(zhì), 是一個(gè)值得研究的問題. 例如, 戰(zhàn)場(chǎng)態(tài)勢(shì)決不僅僅是兵力的棋布, 各種相互關(guān)系、能勢(shì)大小、趨勢(shì)方向都應(yīng)在棋盤上反映出來;調(diào)兵遣將也決不僅僅是棋子的位置挪移, 各種戰(zhàn)法戰(zhàn)術(shù)策略、武器使用方式都應(yīng)在棋盤上可選. 其實(shí)這是兵棋要考慮的問題, 但現(xiàn)在的兵棋能否做到, 還有待驗(yàn)證.

2) 非輪次博弈

現(xiàn)代化戰(zhàn)爭(zhēng)不像古代的決斗, 不是你走一步我 走一步的模式, 而是你走一步, 我可能走兩步甚至更多. 戰(zhàn)爭(zhēng)也不是你走一子我走一子, 而是多個(gè)子同時(shí)在走. 像星際爭(zhēng)霸之類的游戲是很接近戰(zhàn)爭(zhēng), 但 AlphaGo 能否攻克還是未知數(shù), 很可能不會(huì)采用和圍棋一樣的方法. 戰(zhàn)爭(zhēng)是連續(xù)演進(jìn)的, 一種方式是采用某種策略將其離散化, 分成許多時(shí)間片段, 允許每個(gè)片段結(jié)束時(shí)雙方各做一次決策 (保持不變也是一種決策), 然后套用圍棋的方法, 這種方法帶來的問題就是時(shí)間片劃分多細(xì)合適, 太細(xì)了計(jì)算量大, 太粗了容易失真. 除此之外, 就需要?jiǎng)?chuàng)新提出完全不同于AlphaGo的方法來解決.

3) 非單一目標(biāo)

棋盤對(duì)弈, 最終的目標(biāo)就是輸贏. 而實(shí)際戰(zhàn)爭(zhēng)往往沒有那么簡(jiǎn)單, 很多情況下沒有明確的輸贏之分, 而是要達(dá)到某種期望的狀態(tài), 比如奪取制空權(quán)之類. 而且實(shí)際戰(zhàn)爭(zhēng)中除了輸贏, 考評(píng)一個(gè)作戰(zhàn)方案還有很多其它指標(biāo), 比如預(yù)期效能的達(dá)標(biāo)性、損失代價(jià)的可接受性、資源占用條件的滿足性、應(yīng)對(duì)各種變化的靈活性等. 換言之, 實(shí)際戰(zhàn)爭(zhēng)的目標(biāo)是非單一的, 是一套價(jià)值目標(biāo)體系. 如何在棋盤對(duì)弈中模擬這樣的價(jià)值目標(biāo)體系, 而神經(jīng)網(wǎng)絡(luò)又如何來學(xué)習(xí)這種價(jià)值目標(biāo)體系下的人類直覺, 都是值得研究的問題.

4) 不完全信息

棋盤上, 黑白分布一目了然. 而現(xiàn)實(shí)戰(zhàn)爭(zhēng)中, 信息有缺有失、有真有假. 當(dāng)信息缺失時(shí), 就好像一個(gè)人在下棋, 走了好幾步之后, 才知道對(duì)手走到哪兒, 也不知道對(duì)手是怎么走到那里的, 那么在這幾步 “盲棋” 中, 該如何做決策?另一方面, 當(dāng)信息有假時(shí), 就好像對(duì)手表面上走了一步棋, 實(shí)際上走的是另一步棋, 有一個(gè)看得見的棋盤和一個(gè)看不見的棋盤, 如何鑒別看得見的這步棋, 又如何估計(jì)看不見的那步棋? 星際爭(zhēng)霸游戲中設(shè)置了一部分信息缺失的元素, 例如未經(jīng)玩家探索過的地區(qū)會(huì)蒙上一層黑幕. AlphaGo能否通過這樣的考驗(yàn), 讓我們?cè)嚹恳源?

5) 不完備規(guī)則

棋盤上, 一招一式都有規(guī)定, 規(guī)則是明確的, 對(duì)雙方是一致的. 而現(xiàn)實(shí)戰(zhàn)爭(zhēng)中, 招無定式、兵無定法, 人可以隨時(shí)創(chuàng)造出新戰(zhàn)法. 朱可夫在與關(guān)東軍作戰(zhàn) 中, 用滑輪繩索將坦克拉上陡坡, 實(shí)現(xiàn)了出奇制勝. 而現(xiàn)代化戰(zhàn)爭(zhēng)中, 前方兵力看似不多, 后方一枚遠(yuǎn)程導(dǎo)彈就有可能瞬間改變戰(zhàn)局, 美軍號(hào)稱一小時(shí)內(nèi)能打到全球任何一處, 小小棋盤又哪能覆蓋無邊界的戰(zhàn)場(chǎng)?即便循規(guī)蹈矩地照教科書上的戰(zhàn)法, 用在不同的實(shí)際情況下也是需要調(diào)整的, 創(chuàng)新是無處不在的. 試想兩人對(duì)弈中, 如果對(duì)手不斷地違規(guī)走棋, 即便是 “圍棋之神” 也難以取勝. 當(dāng)然, 實(shí)際戰(zhàn)爭(zhēng)中對(duì)手的規(guī)則也不是完全不清楚, 是可以大致估計(jì)出來的, 很多情況下對(duì)手別無選擇, 這里面有個(gè)度的問題.

6) 缺訓(xùn)練樣本

棋局盤面可以達(dá)到千萬級(jí)的規(guī)模, 現(xiàn)實(shí)戰(zhàn)爭(zhēng)不太可能. 即便算上演習(xí)訓(xùn)練, 也離這個(gè)規(guī)模相去甚遠(yuǎn). AlphaGo 通過自我博弈無中生有地制造了大量樣本, 這對(duì)于戰(zhàn)爭(zhēng)能否做到是個(gè)問題. 棋盤上自我博弈較為簡(jiǎn)單, 用于作戰(zhàn)還要解決從戰(zhàn)法到行動(dòng)方案的自動(dòng)生成問題. 此外, 人造的樣本能不能用也是個(gè)問題, 深度學(xué)習(xí)如果學(xué)到的是人造的規(guī)律, 就失去了意義. 另一方面, 人類自身在學(xué)習(xí)時(shí)并不需要太多樣本, 打 過幾次仗的兵就算老兵了, 一生身經(jīng)數(shù)十戰(zhàn)就是 “戰(zhàn)神” 了, 人類靠的不僅僅是經(jīng)驗(yàn)積累, 每積累一次經(jīng)驗(yàn)都會(huì)帶有思考, 讓理性思維和感性認(rèn)識(shí)相結(jié)合, 才能實(shí)現(xiàn)快速學(xué)習(xí). 如何讓機(jī)器像人一樣去學(xué)習(xí)作戰(zhàn), 是很值得研究的問題.

上述挑戰(zhàn)問題, 每一個(gè)目前都沒有很好的解決辦法, 但筆者相信隨著技術(shù)的發(fā)展, 它們終有一天會(huì)被解決. 正如 AlphaGo 贏棋之前, 很多人預(yù)測(cè)這一天還要很多年才能到來. 我們處在技術(shù)飛速發(fā)展的時(shí) 代, 每一天都在見證奇跡的出現(xiàn).

4 指揮與控制智能化發(fā)展著力點(diǎn)

分析認(rèn)為, 不論 AlphaGo還是 “深綠”, 其邁向智能化的基礎(chǔ)都是知識(shí). AlphaGo的知識(shí)是16萬人類高手的圍棋棋譜, “深綠” 的知識(shí)是各種仿真實(shí)體的交戰(zhàn)模型. 沒有這些知識(shí)做基礎(chǔ), 它們是達(dá)不到現(xiàn)在 的智能化程度的. 因此, 知識(shí)工程是智能化的基石, 解決智能化的關(guān)鍵問題, 還應(yīng)從知識(shí)表示、知識(shí)學(xué) 習(xí)、知識(shí)推理等基礎(chǔ)問題入手, 加強(qiáng)技術(shù)方法研究.

1) 加強(qiáng)指揮員認(rèn)知域的知識(shí)表示方法研究

智能化的第一步, 是讓機(jī)器理解戰(zhàn)爭(zhēng), 理解戰(zhàn)場(chǎng)上發(fā)生的事, 以及指揮員心中考慮的問題. 分析戰(zhàn)爭(zhēng)問題, 很重要的一點(diǎn)就是抽象. 要分析戰(zhàn)法博弈層面的問題, 首先要分析一下指揮員心中的棋盤是什么樣的, 指揮員是如何分析任務(wù)目標(biāo)、理解戰(zhàn)場(chǎng)局勢(shì)、 設(shè)計(jì)作戰(zhàn)思路的、評(píng)價(jià)作戰(zhàn)效果的, 指揮員大腦里抽象、模糊、不確定的知識(shí)產(chǎn)物具有哪些要素特征. 然后探尋如何將這些要素特征形式化描述, 以便機(jī)器理解.

2) 加強(qiáng)復(fù)雜戰(zhàn)爭(zhēng)規(guī)律的知識(shí)學(xué)習(xí)方法研究

戰(zhàn)爭(zhēng)規(guī)律不斷在變化, 而且復(fù)雜性也在不斷提升, 人類經(jīng)驗(yàn)總結(jié)是一方面, 機(jī)器學(xué)習(xí)的方法可以幫助人類提升對(duì)復(fù)雜戰(zhàn)爭(zhēng)規(guī)律的認(rèn)識(shí). 運(yùn)用深度學(xué)習(xí)方法, 首先要解決訓(xùn)練樣本的問題, 可用的實(shí)際戰(zhàn)爭(zhēng)和演習(xí)數(shù)據(jù)有限, 一種可行的途徑是通過仿真模擬的作戰(zhàn)過程積累數(shù)據(jù). 因此, 要大力建設(shè)作戰(zhàn)仿真模擬環(huán)境, 類似星際爭(zhēng)霸之類的戰(zhàn)爭(zhēng)游戲, 還應(yīng)當(dāng)越做越精細(xì), 更加逼真的模擬真實(shí)作戰(zhàn), 不僅僅是在畫面效果上, 還要在作戰(zhàn)流程、交戰(zhàn)對(duì)抗、實(shí)體行為決策、 戰(zhàn)場(chǎng)環(huán)境上盡量貼近真實(shí), 讓更多一線的指揮人員成為游戲的玩家, 同時(shí)也讓將戰(zhàn)爭(zhēng)游戲打造成為檢 驗(yàn)戰(zhàn)法戰(zhàn)術(shù)的試金石和試驗(yàn)田. 在積累了大量指揮軍官的游戲數(shù)據(jù)之后, 深度學(xué)習(xí)才能派上用場(chǎng).

3) 加強(qiáng)面向博弈對(duì)抗的知識(shí)推理方法研究

如前所述, 戰(zhàn)爭(zhēng)博弈對(duì)抗具有非輪次博弈、非單一目標(biāo)、不完全信息、不完備規(guī)則等特征, 傳統(tǒng)的知識(shí)推理方法存在適用性問題. 因此, 在充分吸收 AlphaGo的推理方法的同時(shí), 還應(yīng)結(jié)合邏輯推理、不確定推理、基于案例的推理、基于仿真的模擬推演,以及傳統(tǒng)的數(shù)學(xué)計(jì)算等多種手段, 或者創(chuàng)造新的推理方法. 另一方面, 人工智能目前還不能完全替代人類的智慧, 但兩種智能可以結(jié)合起來解決問題. 如何優(yōu)化人和機(jī)器的智能分工與協(xié)作效率, 實(shí)現(xiàn)智能輸出的最大化, 也是值得研究的問題.

5 啟示及建議

本文對(duì)美軍 “深綠” 計(jì)劃及 AlphaGo進(jìn)行了簡(jiǎn)要的介紹, 分析了其各自的優(yōu)缺點(diǎn), 提出了將二者的核心技術(shù)方法結(jié)合起來, 應(yīng)用于戰(zhàn)前推演、實(shí)時(shí)預(yù)測(cè)、臨機(jī)決策、精準(zhǔn)控制、戰(zhàn)后評(píng)估等指揮與控制業(yè)務(wù)的方法.同時(shí), 也從戰(zhàn)爭(zhēng)抽象建模、非輪次博弈、非單一目標(biāo)、不完全信息、不完備規(guī)則、缺訓(xùn)練樣本等方面分析了技術(shù)應(yīng)用面臨的挑戰(zhàn), 指出發(fā)展指揮與控制智能化應(yīng)以知識(shí)表示、學(xué)習(xí)、推理等基礎(chǔ)問題作為著力點(diǎn). 知識(shí)是智能化的核心, 而數(shù)據(jù)是根基, 所謂 “巧婦難為無米之炊”, 是當(dāng)前指揮與控制智能化面臨的困境, 因此, 要大力推進(jìn)知識(shí)工程建設(shè), 積累數(shù)據(jù)是關(guān)鍵。

人工智能技術(shù)雖然不能說已經(jīng)成熟, 但足以和目前的指揮與控制系統(tǒng)拉開足夠差距, 可以發(fā)展的空間很大, 很多傳統(tǒng)方法解決不了的問題有可能通過智能化技術(shù)解決。然而,發(fā)展智能化指揮與控制要一步步來,不能急功近利,“深綠” 就是前車之鑒, 把握不好, 一次重大失利, 就可能將其帶入低谷. 深度 學(xué)習(xí)技術(shù)只是人工智能的一種方法, 不能解決所有問題, 其他人工智能方法也有待進(jìn)一步發(fā)展, 關(guān)鍵在于如何結(jié)合領(lǐng)域特征高效轉(zhuǎn)化應(yīng)用. 最后, 應(yīng)當(dāng)將人工智能當(dāng)作指揮員的助手, 用于輔助決策, 但最終做決定的還應(yīng)當(dāng)是人類, 全自主化戰(zhàn)爭(zhēng)目前來看還太遙遠(yuǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6255

    瀏覽量

    111713
  • 智能化
    +關(guān)注

    關(guān)注

    15

    文章

    5244

    瀏覽量

    60267
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50185

    瀏覽量

    266280

原文標(biāo)題:“深綠” 及 AlphaGo 對(duì)指揮與控制智能化的啟示

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    賦能現(xiàn)代指揮 筑牢智能化防線 —— 公安指揮中心弱電系統(tǒng)全景建設(shè)方案

    公安指揮中心作為集信息收集、信息整理、指揮調(diào)度、事務(wù)管理、事件處置、各業(yè)務(wù)部門辦公及會(huì)議保障等多項(xiàng)功能于一體的大型、綜合性、現(xiàn)代專業(yè)指揮與管控中心,其弱電系統(tǒng)建設(shè)需充分契合上述功能定
    的頭像 發(fā)表于 01-04 11:07 ?332次閱讀
    賦能現(xiàn)代<b class='flag-5'>化</b><b class='flag-5'>指揮</b> 筑牢<b class='flag-5'>智能化</b>防線 —— 公安<b class='flag-5'>指揮</b>中心弱電系統(tǒng)全景建設(shè)方案

    分布式可視驅(qū)動(dòng) —— 指揮中心音視頻及智能管控系統(tǒng)實(shí)施體系

    指揮中心以監(jiān)控、管理為手段,以控制、優(yōu)化為目的,采用智能化、高效率的管理模式替代傳統(tǒng)低效管理模式,提升信息系統(tǒng)管理效率與服務(wù)管理質(zhì)量,降低人工操作及管理風(fēng)險(xiǎn)。建設(shè)過程中充分運(yùn)用現(xiàn)代
    的頭像 發(fā)表于 12-30 11:31 ?484次閱讀
    分布式可視<b class='flag-5'>化</b>驅(qū)動(dòng) —— <b class='flag-5'>指揮</b>中心音視頻及<b class='flag-5'>智能</b>管控系統(tǒng)實(shí)施體系

    指揮中心 “協(xié)同密碼”:KVM 坐席協(xié)作系統(tǒng)如何破解數(shù)據(jù)壁壘與安全難題?

    隨著國(guó)家各部門信息建設(shè)的持續(xù)深化,國(guó)家明確規(guī)劃指揮中心建設(shè)的六大主要系統(tǒng)與三級(jí)指揮架構(gòu),最終構(gòu)建全面覆蓋、快速高效的智能化、及時(shí)、可視
    的頭像 發(fā)表于 12-18 11:13 ?328次閱讀
    <b class='flag-5'>指揮</b>中心 “協(xié)同密碼”:KVM 坐席協(xié)作系統(tǒng)如何破解數(shù)據(jù)壁壘與安全難題?

    制造業(yè)工業(yè)鎖具智能化升級(jí)

    制造業(yè)工業(yè)鎖具智能化升級(jí)在傳統(tǒng)制造業(yè)向智能化、數(shù)字轉(zhuǎn)型的過程中,福建好視角無源雙通道智能鎖具憑借其無需內(nèi)置電源、安全性高、可追溯、遠(yuǎn)程授權(quán)、數(shù)據(jù)聯(lián)動(dòng)、安裝簡(jiǎn)便,適配性強(qiáng)等優(yōu)勢(shì),可以在
    的頭像 發(fā)表于 11-12 11:07 ?729次閱讀
    制造業(yè)工業(yè)鎖具<b class='flag-5'>智能化</b>升級(jí)

    “汽車智能化” 和 “家電高端

    “帶輪子的超級(jí)計(jì)算機(jī)” 了!而這一切都離不開 7nm 級(jí)別的高算力芯片:? 智能座艙的 “大腦” 需求:現(xiàn)在新車流行的 7 屏聯(lián)動(dòng)、4K 高清顯示、語(yǔ)音控制、人臉識(shí)別,都需要芯片有超強(qiáng)算力。比如國(guó)產(chǎn)高端
    發(fā)表于 10-28 20:46

    華為助力行業(yè)智能化轉(zhuǎn)型的最新思考與實(shí)踐

    在華為全聯(lián)接大會(huì)2025期間,華為公司高級(jí)副總裁、企業(yè)銷售總裁陳雷發(fā)表了“躍升行業(yè)智能化,千行萬業(yè)啟新程”的主題演講,分享了華為關(guān)于行業(yè)智能化轉(zhuǎn)型的最新思考與實(shí)踐,并提出進(jìn)一步推動(dòng)行業(yè)智能化落地的“ACT三步走”實(shí)施路徑。在現(xiàn)場(chǎng)
    的頭像 發(fā)表于 09-20 16:06 ?1777次閱讀

    突破傳統(tǒng)桎梏,PPEC Workbench 開啟電源智能化設(shè)計(jì)新路徑

    開發(fā): 工程師通過拖拽模塊組件快速搭建控制邏輯,無需編寫底層代碼,極大降低了對(duì)編程經(jīng)驗(yàn)的依賴,輕松完成基本設(shè)計(jì)框架。 2、 智能化設(shè)計(jì):加速產(chǎn)品開發(fā) ■ 海量工程模版: 平臺(tái)提供豐富的拓?fù)涔こ棠0?/div>
    發(fā)表于 08-26 11:40

    智能化如何選擇終端產(chǎn)品

    園區(qū)建設(shè)的客戶在選擇智能化的終端產(chǎn)品時(shí),往往會(huì)遇到這樣的困境:門禁選便宜的,人行道閘選漂亮的,停車場(chǎng)選品牌大的,包括電梯、訪客機(jī)、節(jié)能控制系統(tǒng)都選擇了不同廠家的,最終結(jié)果卻沒有達(dá)到客戶心中的智能化預(yù)期。
    的頭像 發(fā)表于 08-15 14:22 ?927次閱讀

    鯤云科技助力油田行業(yè)智能化安全管理

    隨著國(guó)家對(duì)安全生產(chǎn)要求的不斷加強(qiáng),油田行業(yè)的安全管理亟待實(shí)現(xiàn)智能化和高效。在油田智能化升級(jí)的浪潮中,眾多 AI 轉(zhuǎn)型方案涌現(xiàn),鯤云以“算力+算法+平臺(tái)”一體的 AI 視頻分析解決方案幫助油田安全管理不止于“看得見”,更致力于“
    的頭像 發(fā)表于 07-25 15:04 ?1051次閱讀

    德索SMA接頭的精密工藝與未來智能化發(fā)展趨勢(shì)

    智能化
    德索五金電子
    發(fā)布于 :2025年07月03日 14:23:06

    奇瑞汽車整合相關(guān)業(yè)務(wù)成立智能化中心

    為加快推進(jìn)智能化戰(zhàn)略,奇瑞汽車于近日將旗下子公司雄獅科技、大卓智能與研發(fā)總院相關(guān)業(yè)務(wù)進(jìn)行整合,統(tǒng)一成立“奇瑞智能化中心”。奇瑞智能化中心成立后,將以更大的力度、更加體系
    的頭像 發(fā)表于 06-04 15:29 ?902次閱讀

    酒店智能化都用到哪些芯片之高速互聯(lián)型MCU CH32V317

    復(fù)雜算法處理和實(shí)時(shí)控制場(chǎng)景中表現(xiàn)優(yōu)異。芯片集成了豐富的通信接口,包括: 二、酒店智能化系統(tǒng)中的CH32V317應(yīng)用 (一)多協(xié)議通信架構(gòu) 在酒店智能化系統(tǒng)中,CH32V317通過靈活配置多通信接口
    發(fā)表于 05-30 17:02

    多模融合,秒級(jí)響應(yīng)-云翎智能應(yīng)急指揮箱打造全域指揮“移動(dòng)中樞”

    云翎智能應(yīng)急指揮終端是一款面向應(yīng)急指揮場(chǎng)景研發(fā)的移動(dòng)、智能化終端設(shè)備,通過多模態(tài)通信技術(shù)融合、高精度定位、AI
    的頭像 發(fā)表于 04-29 18:01 ?903次閱讀
    多模融合,秒級(jí)響應(yīng)-云翎<b class='flag-5'>智能</b>應(yīng)急<b class='flag-5'>指揮</b>箱打造全域<b class='flag-5'>指揮</b>“移動(dòng)中樞”

    智能家居控制器:無線通訊,智能化管理家居設(shè)備

    智能家居控制器是智能家居系統(tǒng)的核心設(shè)備,通過集中管理和協(xié)調(diào)各類智能終端,實(shí)現(xiàn)家居環(huán)境的自動(dòng)、智能化
    的頭像 發(fā)表于 04-24 15:09 ?1430次閱讀

    智能家居Mesh組網(wǎng)方案:實(shí)現(xiàn)智能化生活的無縫連接NRF52832

    特性: 1、多語(yǔ)音平臺(tái)接入:智能家居 Mesh 組網(wǎng)方案支持天貓精靈、Echo 等智能語(yǔ)音平臺(tái)的接入,讓用戶可以通過語(yǔ)音指令控制智能家居設(shè)備,實(shí)現(xiàn)
    發(fā)表于 04-15 14:07