二建水利復習:水利工程管理數據挖掘的實(shí)施步驟
導語(yǔ):建設工程教育網(wǎng)是國內超大型的工程類(lèi)遠程教育基地,憑借其多年輔導經(jīng)驗,聘請國內權威考試輔導專(zhuān)家,依托專(zhuān)業(yè)、龐大的教學(xué)服務(wù)團隊,采用高清課件、移動(dòng)課堂等先進(jìn)教學(xué)方式,強力推出二級建造師等網(wǎng)上輔導課程,點(diǎn)擊了解課程詳情>>>
(1)信息收集。信息收集要在對項目目標和需求的充分理解的基礎上進(jìn)行。也就是先根據數據分析的目標和需求.確定所需要的特征信息.選擇合適的信息收集方法.然后再將收集到的信息存人數據庫。
(2)數據集成。數據集成既為數據共享,對不同來(lái)源、不同格式、不同性質(zhì)特點(diǎn)的數據進(jìn)行邏輯上或物理上整理。
(3)數據規約。數據規約是為提高數據挖掘效率而對數據源所進(jìn)行的預處理。如果不對數據源進(jìn)行規約.那么即使在少量數據上執行多個(gè)數據挖掘算法.也需要很長(cháng)的時(shí)間。而在大量數據上執行多個(gè)數據挖掘算法時(shí)。幾乎就無(wú)效率可言。采用數據規約可以得到數據源的規約表示。數據源規約表示與數據源相比.容量雖然小了得多.數據的完整性卻保持接近。正因如此,數據規約后數據挖掘的結果幾乎相同.但數據挖掘的效率卻有了較大提高。
(4)數據整理。數據庫中有一些數據的屬性值不完整、表示方式不一致。因此,需要對數據進(jìn)行再加工,用科學(xué)方法,填補丟失的數據。處理噪音數據。使數據完整、一致。
(5)數據變換。利用數學(xué)、統計學(xué)手段,將參與分析的數據,轉換成為適合數據挖掘的數據形式。
(6)數據挖掘。選擇合適的數據分析工具,應用規則推理、統計方法、決策樹(shù)、事例推理、模糊集、遺傳算法、神經(jīng)網(wǎng)絡(luò )等方法,對數據倉庫中的數據信息進(jìn)行處理,得出數據處理成果。
(7)模式評估。為了取得更為有效的知識,請專(zhuān)家數據挖掘結果。在評估的基礎上反復提取,進(jìn)而取得更有效的知識
(8)成果表示。以專(zhuān)業(yè)的方式保存、傳遞、輸出、共享數據挖掘成果。
