0 引言
網絡故障和網絡攻擊是計算機網絡中經常出現的事件.前者是由網絡硬件失效、使用者配置不當、設備設計時的缺陷等原因引起的.后者是人為的、有計劃、有目的破壞網絡通信的行為.因為二者引起網絡異常的表象相似,引發的報警信息相近,容易引起錯誤判斷.因此,有必要辨別其差異,洞察其本質.現將管理網絡過程中遇到的 3 個實例進行剖析,以資參考.
1 缺省參數引發的故障
江蘇省一政府部門最近部署了一套項目網絡申報和評審電子政務平臺,用戶有我省的科技創新企業和參與評審的各地專家.其結構包括:硬件系統由 4 臺 PC 服務器構成用戶訪問前臺,1 臺 IBM 的 Power6 小機作為數據庫后臺,1 臺 IBM 磁盤陣列做數據存儲介質.前臺運行 IBM 公司的 Websphere 中間件軟件,提供 web 訪問和負載均衡.后臺運行 ORACLE 數據庫軟件.按照設計方案,這樣的配置對有限的項目申報而言應該是足夠強大和穩定的.
平臺在測試過程中沒有發現任何問題.正式開通使用時卻發現用戶登錄服務器很困難,需要等待很長時間才能出現登錄窗口,并且不能順利完成后續的操作.開始以為是網站剛剛開通,登錄的人較多,出現擁堵在所難免,可幾天之后,狀況未見好轉.分析發現服務器網絡端口的流量非常小,明顯感到系統工作不太正常.由于時間緊迫,必須盡快解決問題,否則,項目申報、評審等一系列工作都會受到影響.
首先,技術人員根據服務器網絡端口流量小的情況,推測是否是交換機擁堵造成的.先后采取了一些措施:更換交換機端口;降低交換機負載;由該服務器獨占整個交換機;在防火墻上給服務器預留足夠帶寬等.這些手段沒有讓服務器網絡口流量顯著增加,用戶感覺依然太慢.
既然不是網絡擁堵的原因,應該還是服務器方面的問題.為什么網上有那么多用戶急于登錄而服務器卻如此"清閑"?
請教 IBM 的客服人員后,技術人員試著修改 WebSphere 的參數.當增加其中"最大連接數"參數值后,情況立馬改觀,服務器網絡端口流量大大增加,用戶訪問正常.
分析一下原因會發現其中奧妙,計算機系統和其他工業系統一樣,有許多參數需要控制和調整.一般情況下,都是使用廠家出廠設定的缺省參數值作為運行參數.這樣性能最佳、可靠穩定.但結合某個具體平臺觀察,由于使用的硬件不同,操作系統不同,中間件軟件、數據庫軟件及編程環境不同,平臺的綜合性能是與每個部分參數配置密切相關的.只要其中一個參數設置不當成為"短板",整個平臺的性能就會大打折扣.解決這些問題需要技術人員知識的積累,更需要實戰經驗的沉淀.
2 網絡廣播地址被劫持引發的故障
TCP/IP 協議族是當今互聯網通信的基礎.由于先天設計上的缺陷,造成今天互聯網很容易遭到黑客的攻擊.網關被劫持,DNS 被劫持,甚至網段的廣播地址也會被劫持.
一日,有人反映說:中午吃飯前計算機網絡還是正常的,吃飯以后就斷斷續續,不能上網了.根據以往的經驗,本人首先判斷網絡線、網卡、計算機等硬件設備應該沒有故障,應該是由計算機病毒、木馬或軟件安裝不當造成的故障.用 360 安全衛士掃測,發現有 DNS 解析等方面的網絡故障.用 360 自動修復功能修復后,故障還是會多次出現.不久,同一樓層的 30 多臺計算機都出現相同的網絡故障,網絡連接時通時斷,行為異常.
筆者猜測故障是否是樓層交換機或光纖收發模塊年久老化引起的.采用應急替換的辦法分別更換了交換機和光纖收發模塊,故障依舊.為什么該樓層 30 多臺計算機出現相同的故障?本人努力地在防火墻上四處搜尋,希望能找到一點故障線索.在查看 MAC 地址與 IP 地址對應表時,終于發現了原因所在:一臺計算機居然使用的是該網段的廣播地址,使該樓層網段內所有計算機均不能正常上網.
通過 MAC 地址查找到該計算機對應的交換機端口,再找到該計算機.查看計算機的 TCP/IP 連接,果然為該網段的廣播地址,修改后,故障消除.
隨意更改 IP 地址是不良的上網習慣,一般通過 MAC 地址以 IP 地址綁定即可解決.如果占用了網段的廣播地址,即廣播地址劫持,則該網段內的所有計算機就不能正常上網了.
3 設備固有缺陷引發的故障
網絡設備雖然作為產品已經投放市場使用,因其設計過程不可能探究到實際使用過程中的各種狀況,存在缺陷是在所難免的.就像"汽車召回"維修更換一樣,網絡設備需要不停升級.
一日,發現上網速度比往常慢許多,檢查防火墻發現其CPU 使用率已達 80%,網絡流量還不到 10%,正常情況下,CPU 使用率一般低于 5%.防火墻是專業網絡設備,不可能像一般計算機那樣,黑客不太容易在其中安裝"木馬"軟件,結合防火墻的日志和網絡流量,應該不是遭到黑客攻擊.防火墻是單位網絡的總出入口,影響很大.
經過與廠家技術人員溝通,對防火墻的參數和工作狀態進行了檢查,沒有發現內外網絡對防火墻的攻擊,故障原因應該來自防火墻自身.重新啟動防火墻后,CPU 使用率下降,暫時解決了網絡通信緩慢的問題.不久,防火墻廠家升級了防火墻內核軟件,故障徹底排除.
4 小結
隨著網絡速度的大大提升,網絡應用也越來越新奇.在網絡已經成為"不能斷"的今天,精準判斷網絡故障、防范網絡攻擊是網絡管理重要的日常工作.只有不斷積累網絡管理方面的經驗,才能眼明手快,保障有力.
參考文獻
[1]肖文軍.淺析計算機網絡故障分析及維護[J].電腦知識與技術,2009\\(18\\).
[2]張濤,董占球.網絡攻擊行為分類技術的研究[J].計算機應用,2004\\(4\\).
[3]尹紅.網絡攻擊與防御技術研究[J].計算機安全,2007\\(8\\).
[4]宋開旭.網絡攻擊與網絡安全分析[J].電腦編程技巧與維護,2009\\(10\\).