文章首先介紹了數挖掘技術,同時將該技術與軟件工程相聯系,指出了將數據挖掘技術應用到軟件知識庫中的重要性,并從軟件知識庫的開發與應用兩方面入手,對其具體應用手段與過程進行了分析。
引言
計算機以及信息技術的不斷發展,使得數據挖掘技術逐漸出現,將其應用到軟件工程的軟件知識庫中,能夠使知識庫中的數據得到優化管理與使用,對于軟件使用效率的提高極為有利,對該技術具體應用的研究,是提高其應用水平的基礎。
1 數據挖掘技術
數據挖掘即在大量模糊的、不完全的、有噪聲的數據中,提取出有效知識的一個過程,而數據挖掘技術,則是基于上述過程所產生的一種技術[1].數據挖掘技術與統計分析具有一定的類似性,但并不完全相同,相對于后者而言,前者具有更大的先進性與優化性,能夠實現對圖片乃至聲音的挖掘。
數據挖掘技術的應用包括數據預處理、數據挖掘以及模式評價與知識表示等步驟。數據庫、數據倉庫、萬維網以及其他信息存儲庫中的信息,會通過數據庫與數據倉庫服務器,進入到知識庫當中,通過數據挖掘引擎,實現數據挖掘,并在完成模式評估的基礎上,傳輸到用戶界面,最終完成數據挖掘過程。
2 數據挖掘與軟件工程
軟件的開發、應用以及維護過程,會產生大量的數據。以軟件開發為例,其中主要包括任務數據、資源數據以及源代碼數據等。而其應用過程數據量更大。如何對數據進行存儲處理,是軟件領域面臨的主要問題。采用軟件配置管理系統以及缺陷跟蹤系統等,能夠實現對數據的管理,但效率相對較低。采用數據挖掘技術,能夠實現對軟件整個生命周期的管理。從軟件的分析設計入手到密碼、調試、測試與錯誤檢驗的迭代開發過程,再到軟件的維護,均可以采用該技術對軟件工程數據進行處理,通過將其存儲到軟件庫中的方法,采用分類分析、關聯分析、聚類分析以及概念分析等方法,完成數據挖掘過程,提高軟件運行效率以及使用性能[2].
3 數據挖掘技術在軟件知識庫中的應用
3.1數據挖掘技術在軟件知識庫開發中的應用
在軟件開發過程中,為最大程度滿足用戶需求,開發人員需要不斷演化源代碼,這一過程需要以框架的形式,對軟件進行管理,因此通常需要大量的文檔數據作為保證[3].傳統開發過程中,文檔的缺乏會對開發過程造成極大的阻礙,增加其困難性。采用數據挖掘技術,可以使開發人員及時的獲取相應文檔,是提高軟件開發效率的主要途徑。
數據挖掘技術在軟件開發中的應用,需要經過構架理解過程以及系統反射框架過程,使源代碼注解到程序靜態依賴圖,進而使軟件的開發過程得以順利完成。在開發完成之后,需要采用實驗的方法,對結果進行評價,在建立評價標準的基礎上,對實驗結果進行分析,以判斷數據挖掘技術應用的有效性。實驗過程需要硬件作為支持,CPU、硬盤、軟件環境以及實驗軟件平臺均需要選用最新型的技術。以軟件環境為例,可采用Windows 7或以上,為軟件運行提供保證??刹捎胘ava語言編寫算法完成實驗。
3.2數據挖掘技術在軟件知識庫維護中的應用
軟件知識庫的維護對于軟件性能的保證極為重要,是需要貫穿與軟件整個生命周期的過程,采用傳統技術實現軟件的維護,難度較大,效率較低,且維護效果相對較差。計算機的運行所面臨的環境十分復雜,維護人員必須時時刻刻關注系統狀態,并對其加以優化,這樣才能維持軟件運行的穩定性。隨著軟件使用時間的延長,其中所包含的數據也越來越多,維護也就變得越來越困難。采用數據挖掘技術,實現對軟件知識庫的維護,能夠達到提高維護效率,降低維護成本的目的。
采用SVN作為版本控制工具,并采用Bugzilla作為主要的軟件跟蹤系統,能夠實現對軟件源代碼的跟蹤,但相對而言,跟蹤難度較大。采用數據挖掘技術,將決策樹學習應用到數據挖掘過程中,能夠使噪聲數據得到更加準確的識別與判斷,是提高數據識別準確度的主要算法之一。CART與ID3是使用較為廣泛的兩種決策樹形式[4].以ID3算法為例,基于信息增益方法,能夠確定每個節點時所需要的合適屬性,能夠使信息量達到最小化,進而最大程度的提高數據挖掘效率。
為判斷上述數據挖掘技術在軟件知識庫維護中應用的有效性,需要采用實驗的方法,對結果進行合理分析。實驗過程需要硬件作為支持,CPU、硬盤、軟件環境以及實驗軟件平臺均需要選用最新型的技術。實驗完成之后,要合理分析結果,并得出準確結論。
4 結論
傳統方法在軟件知識庫中的應用,具有較大的缺陷,主要體現在開發與維護效率不高以及成本過大方面,采用數據挖掘技術實現軟件知識庫的開發與維護,可以有效解決上述問題,不僅能夠提高效率、同時還能夠降低開發與維護難度,降低其成本。鑒于數據挖掘技術的上述優勢,應將該技術廣泛應用于軟件知識庫的開發與維護過程中,以提高開發與維護的整體水平,為我國計算機技術的長遠發現,奠定更加堅實的基礎。
引用:
[1] 毛澄映 , 盧炎生 , 胡小華 . 數據挖掘技術在軟件工程中的應用綜述 [J]. 計算機科學 ,2009,05:1-6+26.
[2] 王元卓 , 賈巖濤 , 劉大偉 , 靳小龍 , 程學旗 . 基于開放網絡知識的信息檢索與數據挖掘 [J]. 計算機研究與發展 ,2015,02:456-474.
[3] 王德光 . 應用數據挖掘技術構建掘進機故障處理知識庫的探討 [J]. 煤礦機電 ,2011,04:54-55+58.
[4] 檀朝東 , 岳晶晶 , 吳麗烽 , 檀竹南 . 數據挖掘技術在油藏挖掘者軟件中的應用 [J]. 中國石油和化工 ,2010,10:66-67.