0、 引言
作戰能力是由一系列的能力、多種因素相互作用的結果,一般來說,是指不同的作戰層次的作戰力量,對相應層次的作戰目標\\(使命\\)的實現能力,可具體分解表現為多項作戰能力目標,是具有綜合性、集成性、涌現性等特征的復雜系統。該系統由大量的不同特征的基本作戰單元組成,而且這些組成單元之間存在強烈的非線性相互作用,從而導致交戰系統在整體行為特征上表現為與其基本組成單元無關的性質,使得很多傳統的分析方法無法處理這類系統。
筆者采用基于智能體模型\\(agent based models,ABMs\\)建模仿真方法,有效地對復雜系統建模仿真予以解決。在 ABMs 建模仿真方法中,一個復雜系統被抽象成很多具有自治能力和自主決策能力的實體,稱之 Agent。評估作戰能力時,首先分析武器作戰能力的構成,根據能力構成的各指標特點,抽象作戰實體的屬性、行動規則和決策規則,將每個作戰個體看成一個作戰智能體\\(combat agent,CA\\),建立的各類 CA 實體模型,并將各類 CA 模型置于相應的想定環境中,按照行動規則個體之間合作、協商和競爭,模擬出真實戰場上種種實際戰場態勢,建立戰場態勢評估模型,對當前狀態進行評估,最終實現基于效果的作戰能力的評估。
1、 作戰實體的仿真建模
1.1 戰場建模
戰場環境對作戰行動產生決定性的影響,離開戰場的作戰是無源之水。采用離散位置的二維柵格表示作戰戰場,柵格中每個位置可被不同的作戰實體 Agent\\(紅方、藍方武器等\\)所占有。通過參數設置,不同類型的智能體可以具有不同的行為能力和使命。依據一定的算法,Agent 在底層行為規則的驅動下,Agent 在戰場上移動并盡力完成其使命。
初始狀態,各種兵力兵器散布在指定的戰場中的某一位置,或是按照一定原則隨機分布在指定的區域內,從而形成基本的初始戰場態勢。在離散的二維柵格中可以抽象地形元素,地形可以是可穿越的,可以能是不能穿越的,通過地形對實體的影響來決定和調整 Agent 的行為,以適應特定的類型的地形。例如,Agent 機動在樹林中,其被發現的概率還會降低,同時其可見度也可能縮小??梢蕴崆坝嬎阍诳赡馨◤碗s地形地物元素或者是有其他威脅力量因素\\(如強干擾源、地可能敵空降、機降分隊等\\)的場景中 Agent 將試圖采用的最優路徑。
1.2 作戰實體建模
1.2.1 內部屬性特征
內部特征表示一個 Agent 特有的個性和經驗的靜態和動態因素,包括:所處位置、防護能力、射擊精度、機動速度、可靠性、狀態\\(受傷、死亡、正常\\)等武器平臺指標,操作人員的技術水平、心理素質、斗志等。在戰場上,武器完成射擊準備和實施射擊的過程都與在靶場上有很大的不同。要分析戰場上作戰 Agent 的內部屬性,并從中體現出不同平臺的作戰能力。
1.2.2 動作選擇
動作選擇邏輯有 2 個基本的原理:一是在對特性中的相關數值隨時間不斷變化的不斷評估中決定Agent 的動作,是基于一個全局的認知,這部分將在下面的部分加以研究;二是利用懲罰函數值矩陣定義局部狀態,對所有位置計算得到各個位置的數值,決定 Agent 下一步的動作,下面就此展開研究。
事實上,一般作戰 Agent 只執行 2 個基本動作:一是機動,Agent 從一個位置移動到另一位置,這種移動受武器系統本身機動性能的影響;二是射擊,Agent 與敵方 Agent 交戰,其中隱藏著使用 Agent攻擊規則。其他動作可以由這 2 個基本動作衍生出來。例如隱蔽待機,即 Agent 當前無任務指派,不需要移動位置,Agent 實現隱蔽待機。Agent 采取什么樣的動作,利用懲罰函數 Z\\(x,y\\)A來解決這一問題,使懲罰函數的數值最小,反映了執行基本任務的動機。懲罰函數的一般表達為:
其中: \\(A\\)\\(-1,+1\\)rw ,代表 Agent 采取動作 A 后最大化或最小的權重值,反映了 Agent 動機的強烈程度,值為正,表明 Agent 想執行動作 A;值為負,表明 Agent 抗拒執行動作 A,而且可以在一定范圍內容動態取值,并依賴于多個自身及戰場特征。m \\(A:x,y\\)代表采取動作 A 情況下的期望結的量度。
Agent 的特征可能因為規則而變化,規則決定了 Agent 怎樣根據動態環境中的場景改變默認的個性值。例如支援規則指定一個局部條件,給定 Agent在感知范圍內感知所支援的分隊遭受敵裝甲目標打擊的損失比例 R 大于或等于某一給定閾值,那么支援的動機 \\(A\\)rw 則為正值,將立刻提供火力支援,否則推遲提供支援。
2、 基于作戰能力態勢模型
武器的作戰能力,從構成角度來說體現在各個方面。然而,各種能力又作為一個整體體現在人與武器系統的融合之中,單純地評價某一方面的能力,就顯得很片面。另一方面,從最核心的作戰能力上講,火力打擊能力、機動能力、指揮能力、生存能力、夜戰能力都是為完成作戰任務,有效支援步坦作戰不可或缺的部分。最終的立足點則是考慮如何依托這種關鍵能力去完成特定任務。在作戰過程中,可以通過任務完成的結果評估其作戰能力。為此,筆者建立了基于態勢場的武器作戰能力評估模型。
2.1 基本原理
筆者將作戰單元看成電場中的電荷,那么這個電荷的電量,需要考慮很多的因素。由于問題的復雜性,在這里只考慮了以下幾種因素:一是指揮員的決策偏好;二是作戰單元的作戰能力指數;三是攻防效費比。改進后的勢場計算公式為:
式中:K 為決策偏好修正系數,用來反映不同控制Agent 的決策偏好對勢場最終計算結果的影響;R為攻防效費比,用來反映在攻防戰斗中,防御所具有的優勢的計算補償;r 為該點與要評估的武器裝備實體電荷的距離。由上式可以看出,這種影響是通過指揮控制 Agent 對己方和敵方的作戰單元作戰能力指數的放大和縮小來實現的。Q為作戰單元的作戰能力指數,反映不同武器系統之間的對抗。
2.2 離散態勢場模型的計算
假設整個戰場被分割成 N 個單元方格。所有單元格的初始值都為 0,戰場中有紅藍雙方各一個Agent。每個 Agent 相應值被抽象成“電勢場”中的“電荷”的帶電量。比如紅方 Agent 的作戰能力指數假設為+4,藍方 Agent 的作戰能力指數為-4。
Agent 在戰場中的位置如圖 1 所示。那么整個戰場的“復合電勢場”就可以按照公式 \\(2\\) 進行計算。
由于是離散表示方式,實際的計算過程可以看作是將 Agent 所在單元格中的值向鄰近的其他單元格進行擴散。擴散是逐漸衰減的過程。不一定與公式 \\(2\\)所示的反比關系相同,也可以按指數衰減或者是等比衰減等。在該例子中,為計算簡單起見,筆者采用指數衰減,并取指數為 0.5。則與 Agent 相鄰的單元格勢場值為 N×0.5,再相鄰為 N×0.25,依次類推,直到計算完所有的單元格為止。一旦計算出所有單元格的所有紅藍雙方 Agent 的“勢場”疊加值,即完成整個態勢場的計算。
如圖 1 所示,方框為紅方 Agent,菱形為藍方Agent。所有紅藍雙方 Agent 擴散值的最后計算結果,即形成的最終戰場態勢勢場模型。由上圖可以初步看出,勢場模型是一個由紅方 Agent 向藍方Agent 一個過渡過程。由 0 組成的方格連線,即可看作是雙方的前線位置。勢場取值最高和最低的點分別為戰場中紅籃方兵力相對集中的位置。
2.3 態勢場的評估指標
1\\) 力量平衡。利用力量平衡指標可以大致計算出整個戰場軍事力量的對比形勢。其計算方法是對戰場中某一區域所有的方格進行求和計算。如果匯總值 U 大于 0,則表示正值的一邊占優\\(如紅方\\);如果匯總值小于0,則表示負值的一方占優。該方法可以定性地描述雙方力量的對比情況。
2\\) 態勢優劣度。通過力量的對比反應優劣程度。計算方法是對戰場中某一區域所有的方格進行求和計算,其將和值與所有方格的電勢場值的絕對值之和的比值。公式為:
G 的取值范圍在+1 到-1 之間。若 G 值等于+1 或-1,說明一方完全占領該區域;如果 G 值等于 0,說明雙方勢均力敵;因此,通過G 數值可以判斷出雙方的力量對比關系。
3\\) 區域控制。利用區域控制指標可以放映紅藍雙方 Agent 實際控制區域的大小。其計算方法是分別計算戰場某一區域所有大于和小于 0 的方格數總和,對比二者大小,數值大的表明該方實際控制區域較大。
4\\) 態勢發展有利度。經過雙方的交戰行為,勢必使給定區域內紅藍雙方的力量平衡指標發生變化。假定一方初始時間0t的控制區域的方格數值之和為0S ,在時間it 控制區域方格數值之和為iS,那么發展有利度計算公式為:
發展有利度,代表利于己方發展行動的程度。
3、 作戰能力評估
3.1 評估的流程
首先按照戰場及作戰實體建模部分的方法,將作戰實體、戰場進行仿真抽象,紅藍雙方作戰 Agent根據規則,進行機動和交戰,利用態勢場模型的指標體系分析戰場態勢。然后將該武器分隊按照想定情況,注入仿真環境運行。最后,對比分析 2 種運行背景下的態勢評估指標的變化,研究該武器作戰能力對態勢的影響,如圖 2 所示。
3.2 基于態勢的作戰能力評估
武器作戰能力是在特定戰術背景和作戰對象等約束條件下完成任務程度的度量。利用多 Agent 評估方法,將涉及的戰術技術能力及指標等各個方面,聚合到作戰 Agent 中,Agent 這種能力\\(即作戰能力\\)最終體現為命中并毀傷目標的程度及完成作戰任務的結果。因此武器作戰能力評估是一個聚合涌現的過程。
3.2.1 任務達成度指標
任務達成度\\(D\\)是整個戰斗行動中完成既定戰斗任務程度的量度,可用力量平衡 U、態勢優劣度G 值、態勢發展有利度 \\(\\)if t和毀傷目標數等作為任務達成的判定條件綜合衡量。任務達成指標如表 1。
因此, rtMDM=,其中rM 為任務達成次數;tM為總仿真實驗次數。
3.2.2 任務時效性指標
時效性是指戰斗行動依賴于時間并有一定的時限,武器分隊能否按上級規定時限準時開始遂行任務、高效的完成戰斗任務,是衡量武器分隊戰斗能力優劣程度的另一個基本要素。
1\\) 遂行任務準時性程度的評估。武器分隊遂行任務準時性程度的評估公式為
式中:Pq 為武器分隊遂行任務的準時性程度;kt 為武器分隊實際開始遂行任務的開始時刻;st 為上級規定開始遂行任務時間的開始時刻。
2\\) 遂行任務高效性程度的評估。武器分隊遂行任務高效性程度可用武器分隊完成該項任務上級規定時限和實際所用時間來評估,其評估公式為:
式中:Pg為武器分隊遂行任務的高效性程度;Tf 為武器分隊實際完成該項任務的時間;Ts 為上級規定完成該項任務的時間。
3.2.3 時效性對任務達成影響\\(如表 2\\)
4、 某型武器分隊作戰仿真
在仿真設計中,藍方為坦克目標,依托陣地防守抗擊紅方沖擊突破,紅方攻擊受阻。某型武器分隊機動到指定位置,加入戰斗。根據雙方兵力情況,筆者僅對\\(50,50\\)到\\(110,81\\)之間地域的雙方力量情況進行統計分析。由于藍軍其依托陣地防御,有相當優勢,為此筆者設置藍軍坦克的火力能力指數為–100,紅軍攻擊坦克能力為 80。圖 3\\(a\\)顯示的是該狀態下的基于態勢場的作戰能力評估情況。仿真顯示紅方區域被壓制,在 31×32 的局部柵格網絡中,藍方控制區域\\(即該方格的勢為小于 0\\)為 527 個柵格,而紅方控制\\(即該方格的勢為小大 0\\)364 個,其余的柵格勢場值為零,平均勢場值為–1.323,顯示藍軍在控制區域和總體態勢上占優勢。圖中勢場值較高的區域為力量較強和兵力相對集中的區域,藍軍在防御前沿形成了較為強大的防守力量。
某型武器分隊接到支援命令,經過 3 輪的火力交戰,形成了新的戰場態勢,如圖 3\\(b\\)。紅軍實際控制區域為 592,藍軍控制區域為 368,其余的柵格勢場值為零,平均勢場值為 1.041,紅方初步形成力量優勢。藍軍前沿防守力量得到有效壓制。在 2 000 個仿真步長內,某型武器分隊的任務達成度有一定的波動,但隨時間增加,該指標趨近穩定值 0.88。圖 4 是某型武器分隊支援作戰任務達成度變化情況。
在指揮 Agent 的統一組織指揮下,作戰 Agent相互協同、密切配合完成作戰任務。作戰 Agent實現相互之間的信息共享,并相互之間協調行動,在進一步觀察戰場的基礎上,按照目標價值選擇打擊的目標。仿真結果顯示某型武器分隊可以很好地完成射擊任務,平均毀傷目標為 13.6,自身的生存能力也顯著提高,隨機交戰系統中被毀傷由 8.16降低到 6.33。
5、 結論
筆者通過基于智能體模型對某型武器分隊作戰進行仿真實驗,證明該方法可以有效地解決作戰能力復雜系統的評估問題,也能夠為部隊作戰行動提供有效的決策依據。
參考文獻:
[1] 劉博聯 . 基于博弈鏈的作戰 Agent 決策模型研究 [M].北京: 北京理工大學數學系, 2008: 42-45.
[2] 賀建民, 王元元, 閔銳. 作戰智能體模型研究[J]. 系統仿真學報, 2004. 16\\(10\\): 2140-2142.
[3] 陳之寧, 周存寶, 王安. 屬性權重不確知的區間直覺模糊群決策方法[J]. 兵工自動化, 2012, 31\\(1\\): 33-36.
[4] 楊槐,宮研生. 作戰數據在指揮決策中的作用評估方法研究[J]. 兵工自動化, 2012, 31\\(6\\): 25-27.
[5] 胡喜珍, 夏軍, 曹素平. 基于灰色熵權法的常規導彈部隊作戰能力評估[J]. 兵工自動化, 2012, 31\\(7\\): 27-30.