網絡空間作為一個新的作戰領域,有著自身獨特的規律。美軍評價這個作戰領域"是一片未經勘測的深海",要充分理解其運行機制,"需要想象力的跨越"[1].這個全新的作戰領域覆蓋全球,其中的網絡攻防行動快速、且會產生海量的網絡事件,這對傳統的網絡防御技術提出了以下挑戰: a) 網絡環境處在不停的動態演化過程中,通過態勢感知獲取的海量數據需要分析、篩選、提取,才能形成全維的網絡空間地圖,并且在網絡戰對抗過程中會產生大量的網絡事件,這些事件既包括網絡自身正常的業務,也包括敵我雙方的攻防行為,這些數據構成了整個網絡戰場的態勢,需要具有高效的數據處理和分析手段才能有效輔助決策,為網絡防御指揮決策形成及時、準確的反饋; b) 網絡戰武器在部署之后也要能夠具備在陌生網絡環境中的自主決策能力,正規化的網絡防御需多種防御手段在動態的網絡環境中實現分布式的協同以完成共同的使命[2].美軍賴桂曼中將認為,美國必須縮短在網絡防御中的決策-行動周期時間,這就意味著需要更多的自動化。自動化將解放有限的網絡防御部隊,聚焦關鍵網絡空間的重要威脅。網絡中心戰也對網絡防御提出更高的要求,使之能有效應對危險、變化的網絡攻擊手段[3].新的防御手段包括安全防衛圈的動態組建、復雜環境感知能力以及對網絡中攻擊行為的自主反應,這些防御手段都需要基于知識的人工智能技術的支撐。斯諾登披露了美國國家安全局研發的被稱做"怪獸大腦"的網絡戰秘密防御系統[4],該武器實際上是一種智能化的軟件操作系統,它可在特定網絡遭受攻擊時自主進行反擊,而不需要人工操作。為應對以上挑戰,研究人員借助人工智能技術解決這些難題,并推動了網絡空間安全防御方法和手段的發展。
1 網絡空間安全防御相關概念
為了更好地闡明人工智能技術在網絡空間安全防御中的應用,對網絡空間安全防御相關概念進行必要的解釋和說明。
1. 1 網絡空間
Cyberspace 是信息環境中的一個全球域,即由信息技術基礎設施互相依賴結網而形成的空間,這些網絡及基礎設施包括了互聯網、通信網絡、計算機系統和嵌入式處理器及控制器[5].從人工智能學科中 agent 的角度來說,網絡空間是網絡空間作戰中各方力量所處的環境,相比人工智能中傳統的環境概念,網絡空間有其獨有的特性,包括對環境的部分感知、動態、離散、極度復雜且對抗激烈等特性。網絡空間中對抗性極強,敵我雙方共存于網絡空間中,不僅要面對智能化的攻防技術手段,還面臨來自防火墻、入侵檢測系統和入侵防御系統等傳統威脅。
1. 2 進攻性網絡作戰
進攻性網絡作戰是在網絡空間領域對敵方信息系統和網絡采取的計算機網絡攻擊(computer network attack,CNA) 與計算機網絡刺探(computer network exploitation,CNE) 等軍事行動和活動[6].CNA 是針對計算機系統或網絡的數據、軟件或硬件的一種惡意行為,這種行為具有破壞性、擾亂性、降解性和拒絕訪問等特征。CNE 是指情報的搜集行為,它通過隱蔽的方式侵入計算機系統來獲取需要的數據。
1. 3 網絡防御
計算機網絡防御(computer network defense,CND) 是指保護信息、計算機和網絡免受擾亂或摧毀的措施,主要行動包括監視、檢測和響應所欲非法授權的計算機行動,其常用技術包括被動信息保障、主動誘騙、網絡空間沖突規避技術和入侵檢測技術等[7].
1. 4 網絡態勢感知
1999 年 Bass 等人[8]首次提出了網絡態勢感知(cyberspacesituation awareness) 的概念,并將網絡態勢感知與最早的交通監管(ATC) 態勢感知的概念進行了類比。目前,對于網絡態勢感知還未能給出一個公認的、準確的概念,但是普遍接受的理解是網絡態勢是指由各種網絡設備運行狀況、網絡行為以及用戶行為等因素所構成的整個網絡當前狀態和變化趨勢。
2 典型應用
一種被普遍接受的觀點是,人工智能技術被劃分為兩類:一類是去試圖探索智能的本質并開發通用的智能機; 另一類是用于解決難以通過非智能化手段解決的復雜問題提供方法的科學,如基于大量數據進行輔助決策的方法。本文面向第二種人工智能技術介紹幾種典型人工智能技術在網絡空間安全防御中的應用。通過對國內外研究現狀的分析,近年來,神經網絡、多 agent 系統、專家系統、搜索、機器學習、自然語言處理等人工智能技術在網絡空間防御中涌現出大量的研究和成果,其中較成體系、應用較多的技術主要有神經網絡、多 agent 系統和專家系統,適用于應對網絡空間防御面臨的輔助決策、快速響應以及海量數據處理等挑戰。本文重點介紹這幾種人工智能技術的應用。
2. 1 神經網絡
一個神經網絡是一個由簡單處理元構成的規模宏大的并行分布處理器[9],具有以下的特點: 信息分布存儲,有較強的容錯能力; 學習能力強,可以實現知識的自我組織,適應不同信息處理的要求; 神經元之間的計算具有相對獨立性,便于并行處理,執行速度較快,有軟件和硬件兩種實現方式。神經網絡這些特點尤其適合網絡安全領域中模式識別學習、分類以及對攻擊事件應對手段的選擇等方面的應用。
目前,神經網絡技術在網絡入侵檢測領域已得到了廣泛應用[10 ~13],如 DDoS 檢測、計算機蠕蟲檢測、垃圾郵件檢測、僵尸檢測、惡意軟件分類和法理調查等方面。文獻[10]使用神經網絡作為用于網絡檢測的 agent 決策算法,能根據有限的網絡狀態提高檢測能力并有效降低出錯率。文獻[11]在測量計算機行為的基礎上通過神經網絡技術來檢測蠕蟲病毒,與決策樹等傳統分類檢測技術相比,該方法具有較高的檢測效率,并能有效識別一些新出現的蠕蟲病毒。文獻[12]針對傳統入侵檢測方法存在的檢測效率低和識別準確度不夠等缺點,在不同的訓練數據集的基礎上,綜合了再循環網絡和多層感知器技術,提出了可用于入侵檢測的神經網絡體系結構。一些神經網絡系統基于硬件或圖形處理器實現,具備高速的處理能力,因此在網絡防御領域得到廣泛應用。神經網絡自身也在發展,如由于更真實地仿真生物神經而帶來的強化神經網絡被稱為第三代神經網絡,為網絡空間安全防御提供了更多的應用機會,而FPGAs(field programmable gate arrays,現場可編程門陣列) 的應用也促進了神經網絡技術的發展和應對動態威脅的調整能力。
神經網絡在網絡空間安全防御領域的應用研究還處于起步階段,有很多具有特色的人工神經網絡模型與算法還沒有得到很好的利用。隨著對神經網絡理論研究的進一步深入,其在網絡空間安全防御領域將會有更為廣闊的應用前景。
2. 2 多 agent 系統
Agent 是分布式人工智能領域的一門技術,agent 可以看做是一個自動執行的實體,它通過傳感器感知環境,通過效應器作用于環境[9].隨著多 agent 系統的發展和成熟,這一技術在網絡安全防御中得到廣泛應用。Agent 技術由于具備感知環境和具有規劃能力等特點,在網絡空間防御中主要用于網絡態勢感知、入侵檢測和入侵防御。在提升網絡態勢感知能力方面,美國國土安全部等機構斥巨資支持對互聯網空間的結構和拓撲進行測量,Archipelago[14]和 DIMES[15]是這方面的典型項目,通過部署在全球網絡空間內的用于網絡測量的大量 agent對互聯網進行連續測量,并通過信息匯總形成全球互聯網地圖,以提升美國在互聯網空間的網絡感知能力。
互聯網上的分布式網絡攻擊變得越來越頻繁,這類攻擊通常以自動化的手段對許多網絡服務系統進行攻擊。由于這些系統并不是由單獨機構或個人掌管,用來檢測并鑒別這類攻擊的信息常常分布在多個系統中,對某一系統的安全管理員來說,為了處理這種分布式攻擊,通常需要與其他系統的管理員進行溝通以獲得全面的網絡安全態勢信息,而這常常又是非常困難的。針對這種分布式網絡攻擊模式,文獻[16]基于 FIPA-OS 實現了一個多 agent 網絡安全監測系統,這些 agent 被部署在不同的網絡環境中,能夠就所在網絡的可疑事件與其他網絡中的 agent 進行交流,通過協同的方式判斷可疑事件是否是分布式網絡攻擊,并向其他網絡的 agent 告知可能存在的威脅。
文獻[17]基于多 agent 技術實現了分布式的入侵檢測系統,文獻[18]基于多 agent 和神經網絡結合來實現入侵檢測。美國海軍使用智能代理安全管理者(intelligent agent security manag-er,IASM) 監視網絡通信數據,能對數據進行收集、標準化、關聯和分析,實時判斷網絡攻擊的情況[19].網絡防御方不僅要處理海量的網絡態勢信息,經常還需面對不完整和不一致的信息,這給網絡安全事件的檢測帶來挑戰。針對這種挑戰,文獻[20]基于多 agent 的知識表達、知識管理和行為約束,提出了一種新型網絡入侵檢測方法。
在網絡入侵防御方面,文獻[21,22]使用基于 agent 的技術來應對 DDoS 攻擊,仿真模擬的結果顯示合作的多個 agent能有效抵御 DDoS 攻擊。
隨著 P2P(peer-to-peer) 網絡服務的廣泛應用,這種體系結構理念也逐漸被網絡安全研究領域所吸納。文獻[23]提出了一種基于 P2P 體系結構的多 agent 入侵檢測系統,分布式的安全檢測 agent,基于 overlay 網絡實現了分布式的元知識庫用于支持 P2P 分布式 agent 平臺對網絡攻擊的協同防御,還給出了對 P2P 分布式 agent 的訓練方式,基于這種訓練方式可以有效處理和應對新的威脅。無線傳感器網絡和移動 Ad hoc 網絡由于其開放性特征也面臨著各種網絡威脅,文獻[23]使用多agent 技術實現了一個協同式無線入侵檢測智能系統,通過強化的知識學習管理模塊能夠更有效地檢測開放網絡環境中的入侵行為。
在網絡防御行動的指揮和控制方面,agent 及其控制者的聯系方式既包括 agent 向控制者傳遞信息,也包括控制者向agent 發送反擊和自我摧毀等命令。在這類網絡防御系統的設計原則上,agent 的目標應該通過程序預設好,并盡可能控制在法律允許范圍內,也要兼顧對 agent 的自主性的發揮。美軍網絡戰 X 計劃的一項研究內容就是確定 agent 自主運行的級別,研究一種面向領域的特定語言,用來描述通信失效或降級的情況下 agent 如何自主決策及自主程度,這些描述語言需要在agent 部署之前就注入到 agent 的程序邏輯中去。
多 agent 技術也開始被廣泛應用于網絡空間安全演練平臺中,例如,DECIDE(distributed environment for critical infra-structure decision- making exercises)[25]是用于支持國家關鍵基礎設施網絡安全決策演練的分布式環境,通過多 agent 技術實現對虛擬對手非常真實的模擬,這些智能 agent 是在領域專家的協作下開發完成的,可以實現跟人類參演人員的實時交互。文獻[26]基于以服務為中心的 agent 平臺 JIAC 實現了一個網絡安全模擬環境 NeSSi2,可以分析攻擊事件并評估防御策略。
NetSim[27]是一個基于 Web 的分布式網絡仿真器,曾用于美國國土安全部組織的 Livewire2003 網絡安全演習,它支持沉浸式人機交互,基于 agent 技術實現了 UAA(user activity agent) 組件,能夠模擬網絡服務的使用者。當網絡服務由于受到攻擊而影響了可用性時,UAA 會模仿網絡服務的普通用戶向參演人員發送投訴郵件,而投訴的頻度和語氣也會隨著網絡服務可用性的進一步下降而增強,增加了參演人員的沉浸感。
基于 agent 技術的軟件系統在結構上分為集中式和分散式兩種?;诜稚⑹?agent 技術的網絡防御系統由于實現了分散式協作,不受集中控制節點失效的制約,抗毀性更強。
2. 3 專家系統
專家系統是發展較早、也是比較成熟的一類人工智能技術。專家系統主要由知識庫和推理機構成,它根據某個領域的專家提供的特殊領域知識進行推理,模擬人類專家作出決策的過程,提供具有專家水平的解答,知識表示多基于規則,而專家系統的能力取決于知識的質量。借助于網絡安全專家的經驗和知識所構建的專家系統可以有效支持網絡防御作戰中的決策制定和自動化的網絡防御系統開發,因此,在網絡空間安全防御中引入網絡作戰專家的經驗知識是十分必要的。
一些早期的入侵檢測系統也曾廣泛使用專家系統,這些入侵操作檢測系統通常使用基于規則的方法,這些系統通過建立大量 if-then 規則來實現檢測,這些規則是網絡攻擊和誤用分析領域的專家制定并轉換成入侵檢測模塊推理機可用的格式,通過檢測日志等信息來檢測可疑行為。一些實時的入侵檢測專家系統[28 ~31]都是經典的基于規則的入侵檢測系統。文獻[32]提出了用于入侵檢測的專家系統---NIDES,它是采用一種新型統計算法來實現異常檢測的綜合性系統,內嵌了將入侵場景編碼在內的專家系統,該系統使用多種統計學方法根據審計日志計算用戶行為的統計學特征,基于這些統計,系統建立不同權限用戶組的正常行為的描述模型,然后通過一個子系統來監控用戶行為并與以往的行為和專家制定的異常規則作比較,若差別超出閾值則認定該行為是入侵行為。
文獻[33]將專家系統應用于網絡空間的安全籌劃,主要用于輔助安全手段的選擇,并提供對有限資源最優化利用的指導。
文獻[34]認為嚴格形式化的模型來描述和分析網絡空間的沖突是十分必要的,也是基于人工智能開發網絡防御系統的基礎,提出了一種基于知識的框架用于管理網絡武器和沖突,框架通過形式化的方式描述了信息的摧毀、竄改、一致性、可信性和可用性等概念,定義了網絡武器、網絡攻擊、網絡事件、網絡沖突、網絡間諜活動及網絡沖突和戰爭等概念,為專家系統在網絡空間安全防御中獲得一致性、無歧義的應用奠定了基礎。
3 發展趨勢與展望
網絡空間安全防御研究是一個新興且蓬勃發展的領域,對海量動態信息的及時響應和自動化處理的需求是其面臨的主要挑戰,這將促使人工智能技術在網絡空間安全防御領域應用的不斷深入。目前,已有相當數量的人工智能技術應用在網絡空間安全防御領域,而且從發展上來說,網絡空間安全防御領域不斷涌現出來的問題需要更智能的解決方案。
可以預見,未來的人工智能技術將會為網絡防御中基于知識的態勢管理和輔助決策帶來新的方法和理念,這些新的方法包括輔助決策軟件中模塊化和層次化的知識體系結構的引入。
文獻[35]就在聯邦德國國防軍的聯合指揮控制系統中應用了此種體系結構來實現知識管理,文獻[36]認為一個具有挑戰性的研究領域是網絡空間安全防御中的知識管理,只有自動化的知識管理才能夠形成快速的態勢評估,從而在指揮控制層次上為指揮員帶來決策優勢。專家系統盡管已取得很多應用,但形式上往往以內嵌在其他系統中的子模塊來實現,文獻[37]就是把專家系統作為安全措施計劃軟件的一部分。然而,如果知識庫的開發可以更進一步完善,專家系統將得到更廣泛的應用,但這些需要加大對知識獲取和大型知識庫開發的力量投入,未來的專家系統在體系結構上要注重專家系統工具的模塊化設計和層次化的知識庫建設。
多 agent 技術盡管作為網絡防御手段已取得了很多研究成果,但現實網絡作戰中是否有真正的自主 agent 還未可知,并且在對已存在的網絡病毒自主程度的界定上還存在一些爭端,例如震網(Stuxnet) 作為目前已知的最先進的網絡病毒之一,其是否屬于自主 agent 就存在兩種不同的看法。支持者認為震網使用了不需要人類干預的松耦合算法,使得震網在一個封閉的網絡環境中能自主完成特定的任務,并且當震網與其控制者失聯之后具有自我摧毀的能力; 反對者[38]
認為震網不是典型的自主 agent,真正的自主 agent 能在紛繁復雜的環境中識別出目標,而根據賽門鐵克的報道,震網的程序邏輯是固定的,不能進行自主的目標評估和選擇,主要是利用西門子公司控制系統(SIMATIC WinCC/Step7) 存在的漏洞感染數據采集與監控系統(SCADA) 向可編程邏輯控制器(PLCs) 寫入代碼并將代碼隱藏,如果震網遇到了其他廠商的可編程邏輯控制器或是不同的西門子產品及網絡環境,它會無所適從,并且震網也不具備時間持續性和學習能力。為 agent 設定目標時需避免在程序邏輯里寫死,而應以一種像自然語言一樣靈活的方式,如"摧毀離心機"這樣的描述方式。
在互聯網空間的防御方面,相互協作的可移動智能 agent有可能被用于充當網絡空間警察的角色,除了需要相關法律的支持,在技術實現層面,需要網絡運營商的合作,使得基礎設施提供支持網絡空間警察的移動和通信的機制,也要有效抵御破壞者利用這種機制。由于多 agent 可以通過協同和分布式信息處理實現對大規模網絡的監控、通信、數據收集和分析,近年來,多 agent 在國家關鍵基礎設施保護方面也開始得到應用[39],比如電子商務、數字醫療、通信和交通網絡控制系統以及環境監控等國家關鍵基礎設施。
國際 FLAIRS(Florida Artificial Intelligence Research Socie-ty) 組織近年來每年度專門召開人工智能和網絡安全的專題會議,會議主要跟蹤基于人工智能的解決方案在網絡安全中的研究進展,2014 年會議的主題包括入侵檢測系統中的機器學習、網絡安全中的文本的自然語言處理、用于恐怖或犯罪活動檢測的音/視頻語義分析、人工智能和生物統計學,以及人工在數據采集與監控系統、網絡系統、嵌入式系統、云計算領域中安全方面的應用等[40].
上面所介紹的神經網絡、多 agent 系統以及專家系統等人工智能技術從不同途徑實現了對網絡空間安全防御不同方面的智能化支持,有著各自的長處,但同時也存在相應的不足。如何將這些技術結合起來形成一種綜合的網絡空間態勢分析和輔助決策系統,使網絡空間安全防御系統能夠將不同方法的優勢互補,揚長避短,是現在研究人員所關注的問題。
4 結束語
網絡空間安全防御是圍繞保護計算機系統和網絡中信息和資源的可信性、一致性和可用性展開的跨學科的領域,現代信息系統的復雜性和來自社會和技術多個維度威脅的多樣性需要具有智能化、自適應和多模式的解決方案,而人工智能技術恰恰適用于此。盡管很多研究還處于初期的探索階段,一些應用也存在許多爭論,但不可否認的是,人工智能技術在網絡空間安全防御領域正得到越來越廣泛的應用,相關的理論、系統與項目也將不斷面世。希望通過本文的分析討論以及對國際上與此相關研究工作的介紹,能夠引起國內研究人員對這一新興領域的關注與研究。
參考文獻:
[1] 黃維真,何荷。"X 計劃": 美軍網絡作戰線路圖[J]. 環球軍事,2013(19) : 23-25.