數(shù)據(jù)挖掘技術(shù)在軟件開發(fā)信息管理中的應(yīng)用論文
文章通過介紹數(shù)據(jù)挖掘技術(shù)概述,分析軟件開發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn),對數(shù)據(jù)挖掘技術(shù)在軟件開發(fā)信息管理中的應(yīng)用展開探討,旨在為相關(guān)人員基于數(shù)據(jù)挖掘技術(shù)概述、軟件開發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn)的促進(jìn)軟件開發(fā)信息管理有序開展研究適用提供一些思路。
數(shù)據(jù)的挖掘是一項復(fù)雜的系統(tǒng)工程,其主要指的是在龐大數(shù)據(jù)中收集有價值信息數(shù)據(jù)的過程。對數(shù)據(jù)挖掘技術(shù)在軟件開發(fā)信息管理中的應(yīng)用展開研究,有著十分重要的現(xiàn)實意義。
1 數(shù)據(jù)挖掘技術(shù)概述
1.1 數(shù)據(jù)挖掘流程
通常而言,數(shù)據(jù)挖掘可劃分成四個階段,分別為選擇、預(yù)處理、挖掘以及吸收,如圖1所示。其中,選擇是就有著極強(qiáng)交互性的龐大數(shù)據(jù)而言的,在工作期間受信息數(shù)據(jù)不斷更新影響,通常要對數(shù)據(jù)展開重新選擇;預(yù)處理則是將沒有得到加工的信息數(shù)據(jù)變換成適宜挖掘處理的形式;挖掘是經(jīng)由科學(xué)計算方法將預(yù)處理數(shù)據(jù)輸入系統(tǒng),在龐大數(shù)據(jù)中收集有價值的信息內(nèi)容,從而完成分類、聚類等工作;吸收也就是數(shù)據(jù)的后處理,其是為了將有價值的信息數(shù)據(jù)反饋給用戶,使數(shù)據(jù)預(yù)處理、挖掘環(huán)節(jié)具備真實意義。
1.2 數(shù)據(jù)挖掘技術(shù)
現(xiàn)階段,在軟件開發(fā)中數(shù)據(jù)挖掘技術(shù)諸如分析、聚類、預(yù)測及統(tǒng)計等已經(jīng)得到較好的'應(yīng)用,這些技術(shù)的應(yīng)用能夠使數(shù)據(jù)挖掘繁雜工程得到一定的簡化,也就是在海量的數(shù)據(jù)中盡可能快的時間內(nèi)找出人們所需的信息,且對系統(tǒng)予以反饋供人們使用。在數(shù)據(jù)挖掘工程中,較為常見的技術(shù)包括關(guān)聯(lián)發(fā)現(xiàn)、分類樹、課時數(shù)據(jù)挖掘等,同時還有一些較為特殊的數(shù)據(jù)挖掘技術(shù)包括回歸建模、統(tǒng)計分析等。在軟件開發(fā)信息管理中應(yīng)當(dāng)對數(shù)據(jù)挖掘技術(shù)進(jìn)行科學(xué)合理的選擇,以完成好軟件開發(fā)信息管理工作。
2 軟件開發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn)
2.1 軟件開發(fā)數(shù)據(jù)較為復(fù)雜
現(xiàn)階段,軟件開發(fā)數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)為主,前一種數(shù)據(jù)多牽涉軟件版本對應(yīng)信息及缺陷報告等,后一種數(shù)據(jù)主要涵蓋相關(guān)軟件代碼及文檔等。該兩方面數(shù)據(jù)無法使用同一種算法,然而它們相互又有著很大的相關(guān)性。換而言之,在數(shù)據(jù)挖掘算法開發(fā)方面,為了盡可能權(quán)衡到兩方面數(shù)據(jù)的復(fù)雜關(guān)聯(lián),很大程度上提升數(shù)據(jù)挖掘難度。
2.2 分析手段并非傳統(tǒng)模式
軟件開發(fā)數(shù)據(jù)挖掘后續(xù)工作是把取得的信息提供給需要的用戶。在以往數(shù)據(jù)挖掘應(yīng)用期間,就好比電子商務(wù)或者金融行業(yè),就是把信息轉(zhuǎn)化為文字或圖表。然而,軟件開發(fā)人員所需信息并非如此簡單,其還涉及了缺陷定位、編程模板等用戶信息,所以對數(shù)據(jù)挖掘技術(shù)提供較高的要求。
2.3 數(shù)據(jù)挖掘結(jié)果評價標(biāo)準(zhǔn)不統(tǒng)一
現(xiàn)如今,數(shù)據(jù)挖掘技術(shù)在諸多行業(yè)得到普及推廣,同時在結(jié)果呈現(xiàn)及評價標(biāo)準(zhǔn)等內(nèi)容上相對完備。然而,在軟件開發(fā)新型管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用卻并非如此。軟件開發(fā)人員要獲取諸多、繁雜的信息,且信息表示方法各不相同,如此很大程度上提升了對數(shù)據(jù)挖掘結(jié)果展開定量準(zhǔn)確分析的難度。
3 數(shù)據(jù)挖掘技術(shù)在軟件開發(fā)信息管理中的應(yīng)用
在軟件開發(fā)信息管理過程中,經(jīng)對數(shù)據(jù)挖掘技術(shù)科學(xué)合理應(yīng)用,可為軟件開發(fā)帶來極有利的幫助,達(dá)到軟件開發(fā)信息管理低成本、高質(zhì)量、短工期的要求,消除軟件開發(fā)信息管理期間存在的一系列問題。全面軟件開發(fā)行業(yè)在時代發(fā)展新形勢下,要與時俱進(jìn),大力進(jìn)行改革創(chuàng)新,運(yùn)用先進(jìn)的科學(xué)技術(shù)不斷優(yōu)化數(shù)據(jù)挖掘技術(shù)研究。
3.1 數(shù)據(jù)挖掘技術(shù)在開源軟件開發(fā)中的應(yīng)用
開源軟件,即源代碼為開放的軟件,此類軟件現(xiàn)階段大部分對用戶是不收取費(fèi)用的,也正是受此影響提升了開源軟件控制管理難度,鑒于此,可應(yīng)用數(shù)據(jù)挖掘技術(shù)來改善開源軟件的資料。就好比,日本某高校學(xué)生推出了一個分布式數(shù)據(jù)挖掘系統(tǒng),該系統(tǒng)一方面可對大型系統(tǒng)開展數(shù)據(jù)挖掘,一方面能夠一系列開源軟件開展數(shù)據(jù)挖掘。
3.2 數(shù)據(jù)挖掘技術(shù)在軟件項目管理中的應(yīng)用
軟件項目管理中數(shù)據(jù)挖掘多表現(xiàn)于兩個方面,一方面為對組織關(guān)系開展的挖掘,一方面為對版本控制信息開展的挖掘。軟件項目管理作為一個系統(tǒng)工程,對組織關(guān)系開展挖掘主要是指對人力資源開展協(xié)調(diào)分配。就好比,一個龐大工程可能同時有千百余人參與,在工程運(yùn)行期間人員相互會出現(xiàn)頻繁的信息數(shù)據(jù)交互,經(jīng)對數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,能夠?qū)θ藛T組織關(guān)系展開合理劃分,積極促進(jìn)軟件項目管理的有序開展。同時,數(shù)據(jù)挖掘技術(shù)還可應(yīng)用于挖掘版本控制信息,能夠有效縮減系統(tǒng)維護(hù)成本,改善軟件項目管理水平。
3.3 數(shù)據(jù)挖掘技術(shù)在程序代碼及機(jī)構(gòu)中的應(yīng)用
在數(shù)據(jù)庫中收集有價值的代碼、構(gòu)件,現(xiàn)階段,較為常用的手段包括經(jīng)由關(guān)鍵詞開展索引、經(jīng)由記錄輸入-輸出關(guān)系索引以及以建立交互關(guān)系圖為基礎(chǔ)的方法等,我們常常使用的百度、搜狗等搜索引擎均能夠開展數(shù)據(jù)檢索。
4 結(jié)束語
總而言之,在軟件開發(fā)信息管理過程中,經(jīng)對數(shù)據(jù)挖掘技術(shù)科學(xué)合理應(yīng)用,可為軟件開發(fā)帶來極有利的幫助,達(dá)到軟件開發(fā)信息管理低成本、高質(zhì)量、短工期的要求,消除軟件開發(fā)信息管理期間存在的一系列問題。基于此,相關(guān)人員務(wù)必要明確認(rèn)識軟件開發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn),不斷鉆研研究、總結(jié)經(jīng)驗,積極促進(jìn)軟件開發(fā)信息管理有序開展。
【數(shù)據(jù)挖掘技術(shù)在軟件開發(fā)信息管理中的應(yīng)用論文】相關(guān)文章:
科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文10-21
數(shù)據(jù)挖掘在CRM中的應(yīng)用論文04-10
網(wǎng)絡(luò)營銷中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文07-07
高校管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用途徑論文10-28
數(shù)據(jù)挖掘在培訓(xùn)管理中的應(yīng)用論文07-02
在現(xiàn)代檔案信息管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)論文06-29
數(shù)據(jù)挖掘技術(shù)在科技期刊網(wǎng)站中的應(yīng)用論文11-04
數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情危機(jī)管理中的應(yīng)用論文10-20