引 言
賽博空間\\( Cyberspace\\) 是哲學和計算機領域中的一個抽象概念,用于描述在計算機網絡中相互交流的虛擬世界; 其最早出現在加拿大作家 WilliamGibson 的《Burning Chrome》一書中,并被逐漸賦予新的含義。進入21 世紀,美國政府和軍方逐漸認識到賽博空間安全的重要性,相繼出臺了一系列賽博空間作戰的政策與計劃; 美國國防部與各軍種均成立了賽博司令部,并認為賽博空間作為一種新的作戰空間,貫穿于陸、海、空、天各個領域且同時存在。在戰場維度擴展的同時,以計算機網絡為代表的各種軍用、民用網絡也在不斷發展,各類信息交互構成了一個復雜的賽博信息空間,因此,開展賽博空間數據管理技術研究,對數據進行歸類、分析、組織、管理,建立賽博空間信息的有序組織,對確保賽博空間信息優勢,維護國家賽博空間安全有重要意義。
賽博空間作為美軍提出的第五維空間,被認為是美軍作戰的關鍵領域,賽博空間防護是國家安全的重要議題?,F階段,關于賽博空間的研究正處于起步階段,目前最具代表性的是美國國防預先研究計劃局\\( DARPA\\) 開展的 Plan X 項目,該項目從 2012 年開始執行,其基礎研究工作匯集了學術界、國防基礎工業、商業科技行業、人機交互等各方面的專家人才; 希望研發新的軍事技術,在保護己方賽博空間的同時,能夠攻擊敵方賽博空間系統,最終實現在賽博空間中完成關鍵使命、具備指揮控制能力的可操作系統。歐盟也逐步意識到賽博空間在國家安全方面的重要性,建立了歐洲網絡信息安全局并賦予其越來越多的職責; 此外,俄羅斯、韓國、印度、日本、中國臺灣等國家和地區也都開展了賽博空間對抗的研究。
由于賽博空間屬于一個全新的研究領域,需要不斷深入地了解,本文描述了賽博空間數據的主要類型,從總體和具體技術上,分析了賽博空間數據的特點; 針對這些特點,研究了規范化存儲、語義查詢、關聯分析、自動組織、共享分發等數據管理技術。本文是對賽博空間數據智能管理的初步探索,為賽博空間數據的相關應用提供了技術支持。
1 賽博空間數據研究
賽博空間是美軍提出的一個新概念,目前,各國對賽博空間的認識還處于發展中,從將電腦空間、網絡空間等同于 Cyberspace,到現在理解的不斷深入; 即使在該研究領域處于前沿的美國,對賽博空間的概念也沒有達成一致,仍處于摸索、研究、開發與利用并進的階段。由于賽博空間的概念與內涵在不斷拓展,這里引用美國國防部《四年職能與任務評估報告》對其描述為: “賽博空間是一個由信息基礎設施互聯網組成的全球信息環境,包括因特網、電信網、計算機系統及嵌入式處理器和控制器?!?/p>
作為賽博空間作戰四個組成部分之一,賽博空間態勢感知是指對能夠引起賽博空間態勢發生變化的要素進行獲取、理解以及預測發展趨勢的活動; 從一般程度的警示目標到高度敏感的機密對象,都屬于態勢感知的處理范圍,提供給決策者一種彈性支持,使各級別的決策有據可依。態勢感知需要依據大量數據與它們的分析結果以展示當前狀態和未來趨勢,然而賽博空間與電磁頻譜和網絡化系統密切相關,具有很多與陸、海、空、天領域所不同的特點,如網絡性、不確定性、無界性和高速性等。因此,需要對賽博空間探測數據的種類與特點進行分析,有效地組織與管理這些數據。
1. 1 賽博空間數據的種類
賽博空間涉及面廣,信息量大,為了能清晰地表達賽博空間態勢,可以將賽博空間態勢分為物理層、信息層、認知層、社會層來描述; 賽博空間主要的數據類型有: 節點類數據、軟硬件類數據、協議類數據、拓撲類數據、電磁頻譜類數據、多媒體類數據、輿情類數據、工作流程類數據、合作關系類數據、行為關系類數據等。
1\\) 節點類數據節點類數據主要用于描述賽博空間各實體節點的組成與位置情況,包括固定節點\\( 如信息中心、網絡弱電間、固定基站等\\) 與動態節點\\( 如導航衛星、通信衛星、移動基站等\\) 。此類賽博空間數據,一般通過離散數據的形式描述,以記錄的形式存儲在關系數據庫中。
2\\) 軟硬件類數據賽博空間作戰是一種多層次、多維度的作戰形式,軟硬件類數據用于描述賽博空間目標的軟硬件信息。例如,軟件版本、開發單位、運行環境、分類用途等。此類賽博空間數據能夠在更低的維度對實體類數據進行闡釋,并在賽博空間的對抗中發揮重要的作用,一般通過離散數據的形式描述,以記錄的形式存儲在關系數據庫中。
3\\) 協議類數據協議類數據是指遵循某一類協議進行傳輸的數據,比如按照 TCP/IPv4 和 TCP/IPv6 協議傳輸的網絡數據、按照 Link 16 和 Link 22 等戰術數據鏈協議傳輸的數據、按照 CDL 和 TCDL 等寬帶數據鏈傳輸的數據、按照 SADL 等態勢感知協議傳輸的數據,以及按照其它專用數據鏈協議傳輸的數據等。此類賽博空間數據,一般通過 XML 對協議類數據進行封裝,以文件的形式存儲。
4\\) 拓撲類數據賽博空間中通信網、傳感器網、軍事信息網等都存在不同的拓撲結構,拓撲類數據主要用于描述網絡中各節點在物理上或邏輯上的布局,一方面可以反映節點大小、形狀等基本屬性,另一方面能夠反映節點之間的相互關系。拓撲結構一般分為物理拓撲結構與邏輯拓撲結構。物理拓撲描述節點之間具體的物理連接方式,勾勒出目標系統中態勢要素物理連接的狀態; 邏輯拓撲不關心節點之間連接的具體細節,而是描述目標系統態勢要素之間的相互關系。此類賽博空間數據通常采用有向圖或無向圖進行展示,可以通過鄰接矩陣以記錄的形式存儲在關系數據庫中。
5\\) 電磁頻譜類數據電磁頻譜類數據主要用于描述電磁設備發射、吸收的電磁波在空域、頻域和能量域的時變場。例如,描述無線通信電磁波在三維空間中分布情況的體數據場等。此類賽博空間數據,一般通過非結構化數據的形式描述,以文件的形式存儲。
6\\) 多媒體類數據多媒體類數據主要用于描述數字化的視覺、聽覺媒體。例如,通過文本、圖形、圖像、聲音、動畫、視頻等數據。此類數據具有種類多、數據量大、格式復雜的特點,計算機一般無法直接理解其內容,可以通過非結構化數據的形式描述,以文件的形式存儲。
7\\) 輿情類數據輿情是一種集體現象,是社會公眾意見的集合。輿情同人的社會性緊緊聯系在一起,通常難以進行確切的科學分析。輿情類數據是按時間、地區、種群等多種維度分布的數據集合,難以用結構化數據的形式描述,一般通過 XML 對輿情數據進行封裝,以文件的形式存儲。
8\\) 工作流程類數據工作流程是指工作事項遵循一系列的過程規則,在不同的執行者之間進行傳遞和執行; 這種數據用于描述整個或部分工作過程在計算機支持下的全自動化、半自動化。賽博空間的工作流程具有多階段、多層次、復雜并發性、動態演化性等特點,可以采用形式化方法描述工作流程,一般通過XML 對工作流程對象模型進行封裝,以文件的形式存儲。
9\\) 合作關系類數據合作關系是指兩個或兩個以上獨立成員,為實現某個特定目標而形成的一種協調關系。賽博空間的合作關系有隸屬、配屬、支援、控制、指導、協同、委托代管等基本類型。一般從網絡模型的角度對成員間的合作關系進行網絡抽象,將各獨立成員作為網絡節點,合作關系作為網絡的邊,由此構建出合作關系的網絡模型; 此類賽博空間數據可以用鄰接矩陣描述,合作關系由矩陣中不同的數據來表示,以記錄的形式存儲在關系數據庫中。
10\\) 行為關系類數據行為是指在一定的條件下,個體或群體在生活中表現出的基本特征,或對內外環境因素刺激所做出的能動反應,有形式化、半形式化等多種行為建模方法。行為關系類數據可以按照行為主體、行為客體、行為環境、行為手段和行為結果進行描述; 此類賽博空間數據,一般通過離散數據的形式描述,以記錄的形式存儲在關系數據庫中。
1. 2 賽博空間數據特點分析
處于新的作戰領域,賽博空間數據具有一定的特點??傮w上,賽博空間數據具有數據來源多、格式差異大、種類多樣、關系復雜的特點。
1\\) 數據來源多數據來源多是指賽博空間數據有多種來源。除了已存在的多種賽博空間數據源外,還可以利用聲、光、電磁等主要技術手段,獲得賽博空間目標信息,并作為數據源。例如,可以通過通信協議分析、信道編碼分析、網絡拓撲分析、網絡嗅探器等多種探測手段獲取目標的賽博空間數據。
2\\) 格式差異大格式差異大是指賽博空間不同種類的數據,其格式存在較大的差異; 屬于同一種類的賽博空間數據,也可能因為設備種類、能力、型號、參數等因素的不同,具有不同的格式。例如,賽博空間中,計算機網絡數據、預警探測信息、衛星通信信息、導航定位信息、數據鏈信息等不同種類數據的格式一般存在較大差異; 對于 GPS、格洛納斯\\( GLO-NASS\\) 、伽利略這些同樣屬于導航定位信息的賽博空間數據,它們之間數據格式也存在差異。
3\\) 種類多樣種類多樣是指賽博空間目標涉及面廣、屬性各異、包括多種數據類型。賽博空間數據有計算機網絡數據、指揮控制信息、戰場通信信息、預警探測信息、衛星通信信息、導航定位信息、數據鏈信息、組織構成、社會輿情、主體行為等。例如,賽博空間存在種類、型號、方位、速度等節點類數據,導航系統的名稱、版本、廠商等軟硬件類數據,預警雷達的工作頻率、掃描頻率、極化類型等電磁頻譜類數據,編隊的隸屬、協同情況等合作關系類數據。
4\\) 關系復雜關系復雜是指賽博空間數據彼此之間可能存在一定的聯系,在賽博空間中,不同目標具有不同的功能,因此,數據之間的關聯關系比較復雜。例如,信息中心通過無線通信設備向各成員發出指令信息,則組織構成、無線通信信息、指揮控制信息、成員主體行為這些賽博空間數據之間存在著一定的關聯關系。
在賽博空間數據管理的具體技術上,需要考慮賽博空間數據的結構多樣性、主題獨立性、領域性、關聯性、可繼承性、可集成性等特點。
1\\) 結構多樣性賽博空間數據有多種存在形式,數據的結構具有多種類型,即賽博空間數據具有結構多樣性的特點。依據賽博空間數據主要的存在形式,數據的結構可以分為三類: 以離散數據形式描述的結構化數據、通過 XML 封裝的半結構化數據,以及不適于數據庫二維邏輯表描述的非結構化數據; 由于這三類數據的結構存在較大差異,具有不同的組織方法,所以,需要針對結構多樣性這一特點,采取能夠處理多種數據結構類型的賽博空間數據管理技術。
2\\) 主題獨立性主題獨立性是指由于賽博空間作戰的特殊性,屬于賽博空間的數據,具有賽博空間的主題屬性,與其它范疇的數據相對獨立。例如,賽博空間探測的數據,其模式信息一般是未知的,可以認為賽博空間探測的 XML 數據為半結構化數據。因此,在管理賽博空間數據時,需要充分考慮數據的主題獨立性。
3\\) 領域性賽博空間數據的領域性是指數據的組織與管理應該面向賽博空間這個主題,定位在該主題領域內。在數據查詢中,與通用本體庫相比,建立賽博空間領域本體庫,利用領域本體的知識可以得到更準確的查詢結果。因此,在管理賽博空間數據時,需要考慮數據的領域性這一特點。
4\\) 關聯性關聯性是指面向同一目標,處于同一流程中的賽博空間數據,彼此之間可能存在著一定的聯系。不同種類、不同數據類型的賽博空間數據之間可能因為面向同一目標而存在著關聯關系,也可能因為處于同一流程的某一階段而存在著關聯關系,所以,賽博空間數據管理技術需要能夠合理地分析與利用賽博空間數據的關聯性。
5\\) 整體性賽博空間數據需要具有聯系的數據項共同構成一個數據集合以描述目標某方面的整體信息,單個數據項的內容在賽博空間中意義不大,即賽博空間數據具有整體性的特點。例如,導航定位軟件的數據項有名稱、版本、產商、語言、操作系統、插件情況等,需要由這些數據項共同構成一個“軟件”數據集合以服務于態勢感知等應用,而不是關注單個數據項的內容。因此,需要采取與數據整體性相適的賽博空間數據管理技術。
6\\) 可集成性賽博空間數據的可集成性是指這些由數據項構成的、用于描述不同信息的數據集合可以相互組合成為新的數據集合,新的集合繼承了其組成部分的所有信息; 同時為滿足應用需求,也可以將新的集合拆分成原來的各個數據集合,不損失任何信息。
例如,導航定位系統具有軟件、補丁、漏洞、硬件等信息,可以由描述這些信息的數據集合共同組成導航定位系統信息目標集合,也可以將信息目標集合拆分為軟件、補丁、漏洞、硬件等數據集合。所以,需要針對可繼承性這一特點,采取靈活智能的賽博空間數據管理技術。
2 賽博空間數據管理策略
基于以上對賽博空間數據種類與特點的分析,這里研究了賽博空間數據存儲、查詢與自動組織策略,以服務于態勢感知,涉及自然語言處理、規范化存儲、語義查詢、關聯分析、自動組織、共享分發等關鍵技術。
2. 1 賽博空間數據的存儲策略
考慮賽博空間數據的主題獨立性和領域性,可以采用領域內數據規范化組織策略來存儲與管理賽博空間數據,如圖 1 所示?!緢D1】
依據賽博空間數據的主要存在形式,可以將網點空間數據劃分為結構化數據、半結構化數據、非結構化數據三類; 將其中的半結構化數據轉化為具有良好模式約束的結構化數據,然后,按照數據結構類型,分別對這三種類型進行處理; 最后,綜合三種數據處理的結果,完成賽博空間數據的規范化存儲。底層的存儲與管理可以采用基于關系數據庫和文件系統的組織方式,并提供統一規范的交互接口。
2. 2 賽博空間數據的查詢策略
針對賽博空間數據的領域性和主題獨立性,可以將本體論的知識引入賽博空間數據查詢中,采用基于領域本體的查詢擴展策略來檢索賽博空間數據,如圖 2 所示?!緢D2】
在基于領域本體的語義查詢中,利用本體對賽博空間領域進行建模,構建賽博空間領域本體知識庫; 通過概念語義相似度的計算,對查詢關鍵詞進行語義擴展; 由查詢粒度與查詢期望生成限制條件,對擴展查詢的結果進行篩除; 最后通過排序、判定得到最終的查詢結果。這種方法充分利用賽博空間數據的特點檢索數據,避免了只采用關鍵詞進行查詢的局限性,使賽博空間數據的管理更加智能。
2. 3 賽博空間數據的自動組織策略
考慮賽博空間數據的關聯性、整體性和可集成性,可以將軟件工程的思想引入到數據管理領域,采用基于數據構件的策略自動組織賽博空間數據,如圖 3 所示?!緢D3】
首先,通過自然語言處理用戶需求,可以得到需要檢索的關鍵詞,在賽博空間領域本體知識庫與賽博空間數據庫的支持下進行語義查詢; 然后,對語義查詢的結果進行關聯分析,并將語義查詢與關聯分析的結果通過數據構件進行封裝; 最后,采用XML 描述文件與數據文件等多種共享與分發的形式,提供用戶所需數據。自動組織技術通過提供一種自動組織賽博空間數據的方法,使數據的管理更加智能,用戶的使用更加方便。
3 結束語
賽博空間是一個激烈對抗的領域,各個國家已經把發展賽博空間對抗能力提高到了一個新的高度,以利用賽博空間、控制賽博空間、建立賽博空間作戰。本文分析了賽博空間數據的種類與特點,研究了賽博空間數據管理策略,從而支持賽博空間數據的相關應用; 由于賽博空間概念與內涵是不斷發展的,今后還需要研究更多技術以完善賽博空間數據的管理。