簧片在线免费观看,欧美日三级片干国内无码视频

摘要：隨著未來戰(zhàn)爭(zhēng)日趨復(fù)雜、人工智能突飛猛進(jìn), 指揮與控制向智能化發(fā)展成為大勢(shì)所趨. 美軍的 “深綠” 計(jì)劃項(xiàng)目雖因各種原因暫停, 但其思路和方法值得借鑒. AlphaGo 在圍棋領(lǐng)域戰(zhàn)勝人類頂尖水平, 其采用的方法也有一定的參考價(jià)值. 簡(jiǎn)要介紹了二者采用的方法, 并開展了方法適用性分析, 研究了其在指揮與控制領(lǐng)域的應(yīng)用機(jī)理及能力, 分析了應(yīng)用的難點(diǎn)及對(duì)策, 并對(duì) 指揮與控制智能化的發(fā)展提出了啟示和建議。

指揮與控制是一項(xiàng)跨物理域、信息域和認(rèn)知域的學(xué)科, 既包含工程, 也包含藝術(shù).受到信息技術(shù)發(fā)展的推動(dòng)和制約, 多年來指揮與控制技術(shù)的發(fā)展大量集中在信息域和物理域, 在指揮與控制系統(tǒng)工程方面取得了長(zhǎng)足的進(jìn)步, 但在指揮與控制輔助決策方面, 尤其是涉及指揮藝術(shù)的認(rèn)知域, 一直停留在初級(jí)階段. 雖然設(shè)計(jì)了一些輔助計(jì)算模型,但在現(xiàn)代化戰(zhàn)爭(zhēng)復(fù)雜、快速、多變的特性面前, 可信度、實(shí)用性遠(yuǎn)遠(yuǎn)不能滿足實(shí)際需要. 美軍曾推出 “深綠” 計(jì)劃, 旨在探索智能化的指揮與控制輔助決策, 但也因戰(zhàn)爭(zhēng)的復(fù)雜性等種種原因未獲成功.人工智能技術(shù)近年來發(fā)展迅猛,尤以深度學(xué)習(xí)技術(shù)為代表, 在語(yǔ)音識(shí)別、圖像識(shí)別、運(yùn)動(dòng)感知等領(lǐng)域紛紛取得了突破性的進(jìn)展.AlphaGo與李世石的一場(chǎng)圍棋大戰(zhàn)獲得了舉世矚目, 最終人工智能以4:1 的結(jié)果戰(zhàn)勝了人類, 代表其在認(rèn)知領(lǐng)域再下一城,一時(shí)間掀起了熱議. 緊接著, AlphaGo宣稱要挑戰(zhàn)星際爭(zhēng)霸, 更是將人工智能推向了神壇. 圍棋和星際爭(zhēng)霸這兩類游戲,和軍事指揮與控制有著緊密的聯(lián)系, 尤其是星際爭(zhēng)霸與戰(zhàn)爭(zhēng)有著很高的相似度. 因此, 很自然的想法, 就是將人工智能技術(shù)應(yīng)用于作戰(zhàn)指揮. 隨著美軍宣稱要將人工智能列為 “改變游戲規(guī)則” 的顛覆性技術(shù)大力發(fā)展, 國(guó)內(nèi)外對(duì)指揮與控制智能化的呼聲也越來越高.相比之下, AlphaGo是智能化技術(shù)向軍事領(lǐng)域的推進(jìn), 而“深綠”則是從軍事領(lǐng)域推智能化. 兩者雖然一成一敗, 都不失為軍事指揮與控制智能化發(fā)展的里程碑.其中涉及的技術(shù)方法,很值得深入研究.本文簡(jiǎn)要介紹了二者采用的技術(shù)方法, 并開展了方法適用性分析, 研究了其在指揮與控制領(lǐng)域的應(yīng)用機(jī)理及能力, 分析了應(yīng)用的難點(diǎn)及對(duì)策, 并作為拋磚引玉, 對(duì)指揮與控制智能化的發(fā)展提出了啟示和建議.

1 方法簡(jiǎn)介及適用性分析

1.1 美軍 “深綠” 系統(tǒng)

“深綠”計(jì)劃是美國(guó)國(guó)防部高級(jí)研究計(jì)劃局DARPA支持的一項(xiàng)面向美國(guó)陸軍、旅級(jí)的指揮與控制領(lǐng)域的研究項(xiàng)目, 是將人工智能引入作戰(zhàn)輔助決策的一項(xiàng)嘗試探索. 文獻(xiàn)對(duì) “深綠” 計(jì)劃中應(yīng)用的技術(shù)、執(zhí)行的情況、及其面臨的困難和挑戰(zhàn) 進(jìn)行了深入探討.

深綠的核心技術(shù)本質(zhì)上是基于實(shí)時(shí)態(tài)勢(shì)的動(dòng)態(tài) 仿真, 也是 “平行仿真” 的核心要義. 仿真擅長(zhǎng)逼真地、量化地模擬復(fù)雜多因素綜合作用的過程和結(jié) 果, 而這是很難用傳統(tǒng)的數(shù)學(xué)公式描述出來的. 基于實(shí)時(shí)態(tài)勢(shì)做仿真, 可以量化地估計(jì)未來某一時(shí)刻的戰(zhàn)場(chǎng)狀態(tài),也可以幫助人理解各種量變?cè)诓煌瑫r(shí)間、空間上交叉產(chǎn)生、綜合作用之后可能帶來的質(zhì)變, 這種質(zhì)變代表具有不同意義的戰(zhàn)場(chǎng)態(tài)勢(shì)局面. 在復(fù)雜戰(zhàn)爭(zhēng)中, 可能導(dǎo)致不同態(tài)勢(shì)局面的因素眾多, 包含各種隨機(jī)性、偶然性, 一個(gè)細(xì)微的因素可能改變整個(gè)戰(zhàn) 局的發(fā)展. 使用仿真的方法, 可以盡可能地將每一個(gè)細(xì)節(jié)因素的影響都模擬出來, 只要模型足夠逼真, 計(jì)算平臺(tái)足以支撐.

然而, 用仿真來預(yù)測(cè)戰(zhàn)場(chǎng)變化的一大缺點(diǎn), 是無法應(yīng)對(duì)分支太多的情形. 包括敵方戰(zhàn)術(shù)策略、我方應(yīng)對(duì)策略、環(huán)境變化、隨機(jī)過程等不確定性都會(huì)導(dǎo)致分支出現(xiàn). 而各種不確定性的組合爆炸是 “深綠” 面臨的最大難題. 按照深綠的方法, 每種可能的分支都要仿真模擬一遍才行, 那么分支一多, 這種仿真模擬的計(jì)算資源和時(shí)間成本就十分高昂, 以至于無法實(shí) 現(xiàn). 但事實(shí)證明, 戰(zhàn)爭(zhēng)迷霧無處不在, 只有戰(zhàn)術(shù)層面、短時(shí)間內(nèi), 不確定性才相對(duì)較少. 但很明顯, 戰(zhàn)術(shù)層面、短時(shí)間內(nèi)的預(yù)測(cè)對(duì)指揮員而言非常簡(jiǎn)單, 用機(jī)器預(yù)測(cè)的意義不大. 此外, 態(tài)勢(shì)與決策的輸入輸出、數(shù)據(jù)的決定性、計(jì)算機(jī)與人協(xié)同等問題, 都是 “深綠” 計(jì)劃面臨的難題.

美軍于 2011 財(cái)年終止 “深綠” 計(jì)劃的原因是多方面的, 包括技術(shù)上存在的風(fēng)險(xiǎn), 也包括經(jīng)費(fèi)、人員等各方面因素. 美軍高調(diào)宣稱終止某項(xiàng)研究計(jì)劃的背后, 往往在隱秘地持續(xù)開展相關(guān)研究. “深綠” 計(jì)劃表面上雖然被叫停, 不排除相關(guān)研究仍在繼續(xù)的可能.

1.2 谷歌 AlphaGo系統(tǒng)

相比于軍方自頂向下推進(jìn)指揮與控制智能化的努力困難重重, AlphaGo 在民用領(lǐng)域取得的突破可謂另辟蹊徑, 后來居上.

AlphaGo 所采用的核心技術(shù)是深度學(xué)習(xí)和蒙特卡洛搜索，特別擅于分析博弈層面的問題, 而且已被證明比人類更擅長(zhǎng)應(yīng)對(duì)天文數(shù)字般的組合不確定性. 其通過訓(xùn)練深度神經(jīng)網(wǎng)絡(luò), 實(shí)現(xiàn)對(duì)人類直覺思維的模擬, 是在神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用中非常有魄力的一種創(chuàng)新. 神經(jīng)網(wǎng)絡(luò)雖然和人類大腦中的神經(jīng)元系統(tǒng) 相差甚遠(yuǎn), 卻被實(shí)踐證明可以模擬非常復(fù)雜的映射關(guān)系. 而人類的直覺就是一種說不清、道不明的潛在映射關(guān)系. 機(jī)器通過千萬級(jí)別的訓(xùn)練樣本, 學(xué)會(huì)了人類的這種直覺, 可以直接生成當(dāng)前局勢(shì)的 “應(yīng)對(duì)良策”(實(shí)際上是人類高手在同類局勢(shì)下使用較多的棋招), 而不是對(duì)每種可能性都推一遍, 同時(shí)生成對(duì)最終輸贏結(jié)果的價(jià)值估計(jì) (實(shí)際上是人類類似棋局最終輸贏結(jié)果的統(tǒng)計(jì)分布), 并在有限范圍內(nèi)開展推演求證 (由于縮小了范圍, 屏蔽了細(xì)節(jié), 推演效率高). 因此, 使用 AlphaGo 的方法, 可以幫助人們高效演算作戰(zhàn)中的博弈問題, 從而尋求戰(zhàn)法策略的優(yōu)化.

然而, AlphaGo直接用于作戰(zhàn)設(shè)計(jì)和分析是有問題的, 主要是屏蔽了太多細(xì)節(jié)導(dǎo)致的失真。和圍棋不同, 戰(zhàn)場(chǎng)上任何一招一策, 能達(dá)到何種效果, 都是和具體對(duì)象、環(huán)境相關(guān)的. 棋盤上看似簡(jiǎn)單的一步棋, 實(shí)際效果可能未必落在想要落在的那個(gè)格子里. 此外, 使用 AlphaGo方法, 還面臨著戰(zhàn)場(chǎng)抽象建模、非輪次博弈、非單一目標(biāo)、不完全信息、不完備規(guī)則、缺訓(xùn)練樣本等一系列問題, 下文中會(huì)詳細(xì)闡述. 換言之, 單靠棋盤上的博弈驗(yàn)證戰(zhàn)法策略的有效性, 有 “紙上談兵” 之嫌, 具有一定的意義, 但實(shí)用性不強(qiáng).

2 應(yīng)用機(jī)理及能力分析

2.1 應(yīng)用機(jī)理

“深綠”和 AlphaGo所采用的兩種方法, 既可以分別應(yīng)用在指揮與控制中, 也可以結(jié)合起來應(yīng)用, 取決于實(shí)際需求.

1) “深綠”—— 戰(zhàn)術(shù)級(jí)仿真推演

從美軍 “深綠” 系統(tǒng)的設(shè)計(jì)初衷和其應(yīng)用效果來看, 其更適合戰(zhàn)術(shù)層級(jí)的仿真推演. 一方面, 戰(zhàn)術(shù)層級(jí)的實(shí)體行為模型較易建立, 武器平臺(tái)的運(yùn)用規(guī)則相對(duì)簡(jiǎn)單、作用效果相對(duì)容易量化評(píng)估. 另一方面, 戰(zhàn)術(shù)層級(jí)的不確定性相對(duì)較小, 因?yàn)闀r(shí)間相對(duì)較短、規(guī)模相對(duì)較小、流程相對(duì)固定. 再一方面, 戰(zhàn)術(shù)層級(jí) 的分析對(duì)于精確量化的要求更高, 武器平臺(tái)的控制、打擊效果的評(píng)估等都需要精確量化的數(shù)據(jù)支撐. 在戰(zhàn)術(shù)級(jí)運(yùn)用仿真推演, 可以充分發(fā)揮機(jī)器精確的計(jì) 算能力.

2) AlphaGo—— 戰(zhàn)略、戰(zhàn)役級(jí)博弈推理

從 AlphaGo 定位于棋類游戲來看, 其更適合戰(zhàn) 略、戰(zhàn)役層級(jí)的博弈推理. 棋招類似于戰(zhàn)法, 走一步棋類似于指揮員下定一步作戰(zhàn)行動(dòng)的決心. 通過 AlphaGo 扮演 “藍(lán)軍” 指揮員, 與扮演 “紅軍” 的人類指揮員互相拆招喂招, 可以幫助指揮員定性地分析各種戰(zhàn)法相互作用、多個(gè)回合之后的可能結(jié)果. 戰(zhàn)爭(zhēng) 是不確定性的王國(guó), AlphaGo 擅長(zhǎng)的就是從大量不確定性中尋求可行解. 另外, AlphaGo 采用的自我博弈方法, 還能幫助指揮員從龐大的解空間中自動(dòng)尋找最有可能取勝的戰(zhàn)法組合, 幫助實(shí)現(xiàn)戰(zhàn)法策略的優(yōu) 化.

3) 兩者結(jié)合 —— 一體化作戰(zhàn)設(shè)計(jì)分析

然而, AlphaGo 真正要用在指揮與控制領(lǐng)域, 實(shí) 現(xiàn)從棋類游戲到戰(zhàn)爭(zhēng)推演的轉(zhuǎn)化, 就要和 “深綠” 的方法相結(jié)合, 互相取長(zhǎng)補(bǔ)短.

結(jié)合應(yīng)用的機(jī)理如圖 1 所示, 指揮員和機(jī)器在棋盤上進(jìn)行對(duì)弈, 通過仿真環(huán)境實(shí)現(xiàn)和真實(shí)戰(zhàn)場(chǎng)的對(duì)接. 首先, 指揮員在棋盤上設(shè)計(jì)戰(zhàn)法, 相當(dāng)于走出一步棋,“深綠” 系統(tǒng)使用草圖到計(jì)劃的功能, 將該戰(zhàn) 法細(xì)化成具體可操作的行動(dòng)方案, 并基于實(shí)時(shí)接入的戰(zhàn)場(chǎng)數(shù)據(jù), 通過仿真模擬出方案執(zhí)行后的效果, 將該效果抽象之后呈現(xiàn)在棋盤上, 即通過仿真估計(jì)出棋子可能落在哪一格. 接著, AlphaGo 用其深度學(xué)習(xí) 得到的策略網(wǎng)絡(luò), 生成敵方的戰(zhàn)法, “深綠” 系統(tǒng)將其細(xì)化成方案, 仿真出效果并抽象到棋盤上, 從而完成雙方一輪走棋. AlphaGo 再用估值網(wǎng)絡(luò)估計(jì)一下當(dāng)前盤面的勝負(fù)概率, 并用蒙特卡洛搜索進(jìn)行推演求證, 供指揮員分析參考. 按照這種方法, 戰(zhàn)略、戰(zhàn)役、戰(zhàn)術(shù)層級(jí)得到了兼顧, 兩種方法形成了優(yōu)勢(shì)互補(bǔ), AlphaGo 解決了不確定性的問題, “深綠” 實(shí)現(xiàn)了 “紙上談兵” 和實(shí)際戰(zhàn)場(chǎng) 的結(jié)合, 因此, 可用于一體化的作戰(zhàn)設(shè)計(jì)分析.

2.2 應(yīng)用能力

在指揮與控制領(lǐng)域應(yīng)用 “深綠” 和 AlphaGo的方法, 可以實(shí)現(xiàn)很多前所未有的功能, 支撐戰(zhàn)前推演、實(shí)時(shí)預(yù)測(cè)、臨機(jī)決策、精準(zhǔn)控制、戰(zhàn)后評(píng)估等一系列指揮與控制業(yè)務(wù).

1) 博弈式籌劃推演

在戰(zhàn)前, 可以將 AlphaGo和 “深綠” 結(jié)合起來, 實(shí) 現(xiàn)博弈式的籌劃推演. 一種是人 - 機(jī)博弈: 人類指揮員設(shè)計(jì)我方戰(zhàn)法, AlphaGo 設(shè)計(jì)敵方戰(zhàn)法, “深綠” 負(fù)責(zé)行動(dòng)方案細(xì)化生成、行動(dòng)效果模擬抽象, AlphaGo 估計(jì)勝負(fù)概率, 人類指揮員可以選擇繼續(xù)往下走, 或者悔棋重新設(shè)計(jì)戰(zhàn)法, 重新推演, 以此反復(fù)修改優(yōu)化方案. 另一種是機(jī) - 機(jī)博弈: AlphaGo 用自我博弈的方法, 同時(shí)設(shè)計(jì)敵、我戰(zhàn)法, 通過隨機(jī)選擇戰(zhàn)法的方式, 把各種可能的戰(zhàn)法組合都推演一遍, 并自動(dòng)對(duì)推演結(jié)果進(jìn)行批處理分析、比對(duì), 從而幫助人類指揮員尋找較為理想的方案. 由于人類指揮員在設(shè)計(jì)方案時(shí)往往具有思維定勢(shì), 容易忽略掉一些可行解, 而器采用有限范圍內(nèi)的解空間搜索方式, 或許能搜出一些人想不到的方案, 其中不乏 “奇招、妙招”.

2) 實(shí)時(shí)態(tài)勢(shì)預(yù)測(cè)

在戰(zhàn)中, 可以將 AlphaGo 和 “深綠” 結(jié)合起來, 實(shí) 現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)的實(shí)時(shí)預(yù)測(cè). 其中, AlphaGo 主要負(fù)責(zé)敵方的出招預(yù)測(cè), 即預(yù)測(cè)敵方在當(dāng)前形勢(shì)下, 下一步可能采用的戰(zhàn)法. 但按其方法原理, 其只能預(yù)測(cè)當(dāng)前局勢(shì)下令對(duì)手贏面最大的一招, 而無法預(yù)測(cè)對(duì)手可能采用的 “昏招” 或 “險(xiǎn)招”. “深綠” 主要負(fù)責(zé)戰(zhàn)術(shù)層面的戰(zhàn)場(chǎng)狀態(tài)預(yù)測(cè), 一是按敵我當(dāng)前戰(zhàn)法打下去, 量化估計(jì)下一時(shí)刻可能的戰(zhàn)場(chǎng)狀態(tài), 二是考慮環(huán)境、對(duì)抗中的少量隨機(jī)性, 或敵我戰(zhàn)法的少量可選項(xiàng), 歸納出短時(shí)間內(nèi)未來態(tài)勢(shì)可能出現(xiàn)的幾種局面.

3) 臨機(jī)快速?zèng)Q策

AlphaGo 的一大特點(diǎn), 是克服大量未知不確定性的組合爆炸, 模擬人類的棋感直覺, 根據(jù)當(dāng)前盤面形勢(shì)快速拆招解招. 這種能力如果用在臨機(jī)指揮中, 可以快速生成決策建議, 尤其是在突遭變化、敵方后招難以捉摸, 而形勢(shì)又特別緊急的情況下, 可以避免人類指揮員容易出現(xiàn)的猶豫不決現(xiàn)象, 提升決策效率. 更重要的是, AlphaGo 在訓(xùn)練時(shí)使用的樣本很多, 可以模擬很多高水平指揮員的共性直覺, 理論上其生成的建議有可能會(huì)優(yōu)于單個(gè)人類指揮員. 當(dāng)然, 以目前人工智能的水平, 支持戰(zhàn)前籌劃還行, 支持戰(zhàn)中指揮有點(diǎn)不太現(xiàn)實(shí), 但如果 AlphaGo攻克了星際爭(zhēng)霸之類的實(shí)時(shí)競(jìng)技類游戲, 那就完全不同了.

4) 前饋式精準(zhǔn)控制

深綠基于仿真的實(shí)時(shí)量化預(yù)測(cè)能力, 可以在行動(dòng)執(zhí)行過程中, 模擬戰(zhàn)場(chǎng)多因素綜合作用的結(jié)果, 超實(shí)時(shí)預(yù)測(cè)行動(dòng)執(zhí)行的效果, 并根據(jù)實(shí)時(shí)數(shù)據(jù)動(dòng)態(tài)修正預(yù)測(cè)結(jié)果. 指揮員可以實(shí)時(shí)把握行動(dòng)預(yù)計(jì)效果同預(yù)期之間的偏差, 提前對(duì)行動(dòng)進(jìn)行調(diào)整. 過去都是根據(jù)當(dāng)前行動(dòng)執(zhí)行的結(jié)果, 來調(diào)整下一步的行動(dòng), 是在偏差已經(jīng)產(chǎn)生情況下的調(diào)控. 而通過超前預(yù)測(cè)引入的反饋, 是在偏差尚未產(chǎn)生之前的調(diào)控, 類似控制論中的前饋式控制, 可以幫助指揮員防患于未然. 在此基礎(chǔ)上, 如果仿真模型的粒度越細(xì), 則效果預(yù)測(cè)就越精確, 控制的精準(zhǔn)度就越高.

5) 戰(zhàn)后評(píng)估訓(xùn)練

一方面, 戰(zhàn)前的博弈式推演方法也可以用在戰(zhàn)后, 對(duì)各種戰(zhàn)法進(jìn)行博弈演練, 發(fā)現(xiàn)戰(zhàn)法存在的問題, 從而進(jìn)行優(yōu)化. 另一方面, 利用 AlphaGo中的深度學(xué)習(xí)技術(shù), 還可以實(shí)現(xiàn)各種作戰(zhàn)模型的訓(xùn)練優(yōu)化. 很多作戰(zhàn)模型因?yàn)橛绊懸蛩靥?、作用機(jī)理復(fù)雜, 傳統(tǒng)數(shù)學(xué)模型難以精確擬合. 例如部隊(duì)實(shí)戰(zhàn)能力, 受敵我兵力配屬、武器配備、使用戰(zhàn)法、訓(xùn)練水平、士氣、相對(duì)位置、戰(zhàn)場(chǎng)環(huán)境等諸多因素影響, 一直以來都很難建模. 而指揮員和部隊(duì)一起摸爬滾打多年, 對(duì)其實(shí)戰(zhàn)能力的估計(jì)是比較準(zhǔn)確的, 這種經(jīng)驗(yàn)性的直覺判斷, 類似 AlphaGo 對(duì)盤面勝負(fù)概率的估計(jì). 神經(jīng)網(wǎng)絡(luò)具備超強(qiáng)的分類/擬合性能, 如果給定歷史案例中各種情況下的戰(zhàn)況數(shù)據(jù), 用深度學(xué)習(xí)方式或許能擬合出一個(gè)較為精確的模型出來.

3 技術(shù)應(yīng)用面臨的挑戰(zhàn)

“深綠” 計(jì)劃面臨的挑戰(zhàn)如前所述, 包括戰(zhàn)爭(zhēng)的復(fù)雜不確定性、模型的精確性、計(jì)算資源的占用性等. AlphaGo的方法雖然在圍棋領(lǐng)域取得了杰出的成就, 并且具有一定的通用性, 但真正應(yīng)用在作戰(zhàn)指揮與控制領(lǐng)域, 還面臨許多挑戰(zhàn).

1) 戰(zhàn)場(chǎng)抽象建模

棋盤上, 車無輪、馬無韁, 一切都是簡(jiǎn)化過的. 而現(xiàn)實(shí)戰(zhàn)爭(zhēng)太復(fù)雜, 要考慮的細(xì)節(jié)因素太多, 只有抽象到棋盤層面, 才有可能分析戰(zhàn)法博弈. 但如何抽象, 才能做到既簡(jiǎn)化了繁冗的細(xì)節(jié), 又保留了博弈的本質(zhì), 是一個(gè)值得研究的問題. 例如, 戰(zhàn)場(chǎng)態(tài)勢(shì)決不僅僅是兵力的棋布, 各種相互關(guān)系、能勢(shì)大小、趨勢(shì)方向都應(yīng)在棋盤上反映出來；調(diào)兵遣將也決不僅僅是棋子的位置挪移, 各種戰(zhàn)法戰(zhàn)術(shù)策略、武器使用方式都應(yīng)在棋盤上可選. 其實(shí)這是兵棋要考慮的問題, 但現(xiàn)在的兵棋能否做到, 還有待驗(yàn)證.

2) 非輪次博弈

現(xiàn)代化戰(zhàn)爭(zhēng)不像古代的決斗, 不是你走一步我走一步的模式, 而是你走一步, 我可能走兩步甚至更多. 戰(zhàn)爭(zhēng)也不是你走一子我走一子, 而是多個(gè)子同時(shí)在走. 像星際爭(zhēng)霸之類的游戲是很接近戰(zhàn)爭(zhēng), 但 AlphaGo 能否攻克還是未知數(shù), 很可能不會(huì)采用和圍棋一樣的方法. 戰(zhàn)爭(zhēng)是連續(xù)演進(jìn)的, 一種方式是采用某種策略將其離散化, 分成許多時(shí)間片段, 允許每個(gè)片段結(jié)束時(shí)雙方各做一次決策 (保持不變也是一種決策), 然后套用圍棋的方法, 這種方法帶來的問題就是時(shí)間片劃分多細(xì)合適, 太細(xì)了計(jì)算量大, 太粗了容易失真. 除此之外, 就需要?jiǎng)?chuàng)新提出完全不同于AlphaGo的方法來解決.

3) 非單一目標(biāo)

棋盤對(duì)弈, 最終的目標(biāo)就是輸贏. 而實(shí)際戰(zhàn)爭(zhēng)往往沒有那么簡(jiǎn)單, 很多情況下沒有明確的輸贏之分, 而是要達(dá)到某種期望的狀態(tài), 比如奪取制空權(quán)之類. 而且實(shí)際戰(zhàn)爭(zhēng)中除了輸贏, 考評(píng)一個(gè)作戰(zhàn)方案還有很多其它指標(biāo), 比如預(yù)期效能的達(dá)標(biāo)性、損失代價(jià)的可接受性、資源占用條件的滿足性、應(yīng)對(duì)各種變化的靈活性等. 換言之, 實(shí)際戰(zhàn)爭(zhēng)的目標(biāo)是非單一的, 是一套價(jià)值目標(biāo)體系. 如何在棋盤對(duì)弈中模擬這樣的價(jià)值目標(biāo)體系, 而神經(jīng)網(wǎng)絡(luò)又如何來學(xué)習(xí)這種價(jià)值目標(biāo)體系下的人類直覺, 都是值得研究的問題.

4) 不完全信息

棋盤上, 黑白分布一目了然. 而現(xiàn)實(shí)戰(zhàn)爭(zhēng)中, 信息有缺有失、有真有假. 當(dāng)信息缺失時(shí), 就好像一個(gè)人在下棋, 走了好幾步之后, 才知道對(duì)手走到哪兒, 也不知道對(duì)手是怎么走到那里的, 那么在這幾步 “盲棋” 中, 該如何做決策？另一方面, 當(dāng)信息有假時(shí), 就好像對(duì)手表面上走了一步棋, 實(shí)際上走的是另一步棋, 有一個(gè)看得見的棋盤和一個(gè)看不見的棋盤, 如何鑒別看得見的這步棋, 又如何估計(jì)看不見的那步棋？星際爭(zhēng)霸游戲中設(shè)置了一部分信息缺失的元素, 例如未經(jīng)玩家探索過的地區(qū)會(huì)蒙上一層黑幕. AlphaGo能否通過這樣的考驗(yàn), 讓我們?cè)嚹恳源?

5) 不完備規(guī)則

棋盤上, 一招一式都有規(guī)定, 規(guī)則是明確的, 對(duì)雙方是一致的. 而現(xiàn)實(shí)戰(zhàn)爭(zhēng)中, 招無定式、兵無定法, 人可以隨時(shí)創(chuàng)造出新戰(zhàn)法. 朱可夫在與關(guān)東軍作戰(zhàn) 中, 用滑輪繩索將坦克拉上陡坡, 實(shí)現(xiàn)了出奇制勝. 而現(xiàn)代化戰(zhàn)爭(zhēng)中, 前方兵力看似不多, 后方一枚遠(yuǎn)程導(dǎo)彈就有可能瞬間改變戰(zhàn)局, 美軍號(hào)稱一小時(shí)內(nèi)能打到全球任何一處, 小小棋盤又哪能覆蓋無邊界的戰(zhàn)場(chǎng)？即便循規(guī)蹈矩地照教科書上的戰(zhàn)法, 用在不同的實(shí)際情況下也是需要調(diào)整的, 創(chuàng)新是無處不在的. 試想兩人對(duì)弈中, 如果對(duì)手不斷地違規(guī)走棋, 即便是 “圍棋之神” 也難以取勝. 當(dāng)然, 實(shí)際戰(zhàn)爭(zhēng)中對(duì)手的規(guī)則也不是完全不清楚, 是可以大致估計(jì)出來的, 很多情況下對(duì)手別無選擇, 這里面有個(gè)度的問題.

6) 缺訓(xùn)練樣本

棋局盤面可以達(dá)到千萬級(jí)的規(guī)模, 現(xiàn)實(shí)戰(zhàn)爭(zhēng)不太可能. 即便算上演習(xí)訓(xùn)練, 也離這個(gè)規(guī)模相去甚遠(yuǎn). AlphaGo 通過自我博弈無中生有地制造了大量樣本, 這對(duì)于戰(zhàn)爭(zhēng)能否做到是個(gè)問題. 棋盤上自我博弈較為簡(jiǎn)單, 用于作戰(zhàn)還要解決從戰(zhàn)法到行動(dòng)方案的自動(dòng)生成問題. 此外, 人造的樣本能不能用也是個(gè)問題, 深度學(xué)習(xí)如果學(xué)到的是人造的規(guī)律, 就失去了意義. 另一方面, 人類自身在學(xué)習(xí)時(shí)并不需要太多樣本, 打過幾次仗的兵就算老兵了, 一生身經(jīng)數(shù)十戰(zhàn)就是 “戰(zhàn)神” 了, 人類靠的不僅僅是經(jīng)驗(yàn)積累, 每積累一次經(jīng)驗(yàn)都會(huì)帶有思考, 讓理性思維和感性認(rèn)識(shí)相結(jié)合, 才能實(shí)現(xiàn)快速學(xué)習(xí). 如何讓機(jī)器像人一樣去學(xué)習(xí)作戰(zhàn), 是很值得研究的問題.

上述挑戰(zhàn)問題, 每一個(gè)目前都沒有很好的解決辦法, 但筆者相信隨著技術(shù)的發(fā)展, 它們終有一天會(huì)被解決. 正如 AlphaGo 贏棋之前, 很多人預(yù)測(cè)這一天還要很多年才能到來. 我們處在技術(shù)飛速發(fā)展的時(shí) 代, 每一天都在見證奇跡的出現(xiàn).

4 指揮與控制智能化發(fā)展著力點(diǎn)

分析認(rèn)為, 不論 AlphaGo還是 “深綠”, 其邁向智能化的基礎(chǔ)都是知識(shí). AlphaGo的知識(shí)是16萬人類高手的圍棋棋譜, “深綠” 的知識(shí)是各種仿真實(shí)體的交戰(zhàn)模型. 沒有這些知識(shí)做基礎(chǔ), 它們是達(dá)不到現(xiàn)在的智能化程度的. 因此, 知識(shí)工程是智能化的基石, 解決智能化的關(guān)鍵問題, 還應(yīng)從知識(shí)表示、知識(shí)學(xué) 習(xí)、知識(shí)推理等基礎(chǔ)問題入手, 加強(qiáng)技術(shù)方法研究.

1) 加強(qiáng)指揮員認(rèn)知域的知識(shí)表示方法研究

智能化的第一步, 是讓機(jī)器理解戰(zhàn)爭(zhēng), 理解戰(zhàn)場(chǎng)上發(fā)生的事, 以及指揮員心中考慮的問題. 分析戰(zhàn)爭(zhēng)問題, 很重要的一點(diǎn)就是抽象. 要分析戰(zhàn)法博弈層面的問題, 首先要分析一下指揮員心中的棋盤是什么樣的, 指揮員是如何分析任務(wù)目標(biāo)、理解戰(zhàn)場(chǎng)局勢(shì)、設(shè)計(jì)作戰(zhàn)思路的、評(píng)價(jià)作戰(zhàn)效果的, 指揮員大腦里抽象、模糊、不確定的知識(shí)產(chǎn)物具有哪些要素特征. 然后探尋如何將這些要素特征形式化描述, 以便機(jī)器理解.

2) 加強(qiáng)復(fù)雜戰(zhàn)爭(zhēng)規(guī)律的知識(shí)學(xué)習(xí)方法研究

戰(zhàn)爭(zhēng)規(guī)律不斷在變化, 而且復(fù)雜性也在不斷提升, 人類經(jīng)驗(yàn)總結(jié)是一方面, 機(jī)器學(xué)習(xí)的方法可以幫助人類提升對(duì)復(fù)雜戰(zhàn)爭(zhēng)規(guī)律的認(rèn)識(shí). 運(yùn)用深度學(xué)習(xí)方法, 首先要解決訓(xùn)練樣本的問題, 可用的實(shí)際戰(zhàn)爭(zhēng)和演習(xí)數(shù)據(jù)有限, 一種可行的途徑是通過仿真模擬的作戰(zhàn)過程積累數(shù)據(jù). 因此, 要大力建設(shè)作戰(zhàn)仿真模擬環(huán)境, 類似星際爭(zhēng)霸之類的戰(zhàn)爭(zhēng)游戲, 還應(yīng)當(dāng)越做越精細(xì), 更加逼真的模擬真實(shí)作戰(zhàn), 不僅僅是在畫面效果上, 還要在作戰(zhàn)流程、交戰(zhàn)對(duì)抗、實(shí)體行為決策、戰(zhàn)場(chǎng)環(huán)境上盡量貼近真實(shí), 讓更多一線的指揮人員成為游戲的玩家, 同時(shí)也讓將戰(zhàn)爭(zhēng)游戲打造成為檢驗(yàn)戰(zhàn)法戰(zhàn)術(shù)的試金石和試驗(yàn)田. 在積累了大量指揮軍官的游戲數(shù)據(jù)之后, 深度學(xué)習(xí)才能派上用場(chǎng).

3) 加強(qiáng)面向博弈對(duì)抗的知識(shí)推理方法研究

如前所述, 戰(zhàn)爭(zhēng)博弈對(duì)抗具有非輪次博弈、非單一目標(biāo)、不完全信息、不完備規(guī)則等特征, 傳統(tǒng)的知識(shí)推理方法存在適用性問題. 因此, 在充分吸收 AlphaGo的推理方法的同時(shí), 還應(yīng)結(jié)合邏輯推理、不確定推理、基于案例的推理、基于仿真的模擬推演,以及傳統(tǒng)的數(shù)學(xué)計(jì)算等多種手段, 或者創(chuàng)造新的推理方法. 另一方面, 人工智能目前還不能完全替代人類的智慧, 但兩種智能可以結(jié)合起來解決問題. 如何優(yōu)化人和機(jī)器的智能分工與協(xié)作效率, 實(shí)現(xiàn)智能輸出的最大化, 也是值得研究的問題.

5 啟示及建議

本文對(duì)美軍 “深綠” 計(jì)劃及 AlphaGo進(jìn)行了簡(jiǎn)要的介紹, 分析了其各自的優(yōu)缺點(diǎn), 提出了將二者的核心技術(shù)方法結(jié)合起來, 應(yīng)用于戰(zhàn)前推演、實(shí)時(shí)預(yù)測(cè)、臨機(jī)決策、精準(zhǔn)控制、戰(zhàn)后評(píng)估等指揮與控制業(yè)務(wù)的方法.同時(shí), 也從戰(zhàn)爭(zhēng)抽象建模、非輪次博弈、非單一目標(biāo)、不完全信息、不完備規(guī)則、缺訓(xùn)練樣本等方面分析了技術(shù)應(yīng)用面臨的挑戰(zhàn), 指出發(fā)展指揮與控制智能化應(yīng)以知識(shí)表示、學(xué)習(xí)、推理等基礎(chǔ)問題作為著力點(diǎn). 知識(shí)是智能化的核心, 而數(shù)據(jù)是根基, 所謂 “巧婦難為無米之炊”, 是當(dāng)前指揮與控制智能化面臨的困境, 因此, 要大力推進(jìn)知識(shí)工程建設(shè), 積累數(shù)據(jù)是關(guān)鍵。

人工智能技術(shù)雖然不能說已經(jīng)成熟, 但足以和目前的指揮與控制系統(tǒng)拉開足夠差距, 可以發(fā)展的空間很大, 很多傳統(tǒng)方法解決不了的問題有可能通過智能化技術(shù)解決。然而，發(fā)展智能化指揮與控制要一步步來，不能急功近利，“深綠” 就是前車之鑒, 把握不好, 一次重大失利, 就可能將其帶入低谷. 深度學(xué)習(xí)技術(shù)只是人工智能的一種方法, 不能解決所有問題, 其他人工智能方法也有待進(jìn)一步發(fā)展, 關(guān)鍵在于如何結(jié)合領(lǐng)域特征高效轉(zhuǎn)化應(yīng)用. 最后, 應(yīng)當(dāng)將人工智能當(dāng)作指揮員的助手, 用于輔助決策, 但最終做決定的還應(yīng)當(dāng)是人類, 全自主化戰(zhàn)爭(zhēng)目前來看還太遙遠(yuǎn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6255

瀏覽量
111713
智能化

智能化

+關(guān)注

關(guān)注
15

文章
5244

瀏覽量
60267
人工智能

人工智能

+關(guān)注

關(guān)注
1819

文章
50185

瀏覽量
266280

原文標(biāo)題：“深綠” 及 AlphaGo 對(duì)指揮與控制智能化的啟示

文章出處：【微信號(hào)：AItists，微信公眾號(hào)：人工智能學(xué)家】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

“深綠”及AlphaGo對(duì)指揮與控制智能化的啟示

評(píng)論