發(fā)布時(shí)間:2022-11-26 08:23:02
序言:寫作是分享個(gè)人見解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了1篇的淺談軟件工程中的數(shù)據(jù)挖掘技術(shù)樣本,期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā),請(qǐng)盡情閱讀。
數(shù)據(jù)挖掘技術(shù)可以從龐雜的數(shù)據(jù)信息中提取、采集需要的信息,是企業(yè)運(yùn)營(yíng)中重要的應(yīng)用技術(shù)。尤其隨著各類電子產(chǎn)品的日益增多,為了讓海量的信息為人們提供更加優(yōu)質(zhì)的服務(wù),離不開對(duì)相關(guān)的數(shù)據(jù)展開深層次的挖掘與處理,為企業(yè)朝著繼定的目標(biāo)發(fā)展提供了必要的信息參考。
1數(shù)據(jù)挖掘的技術(shù)
1.1基本含義
數(shù)據(jù)挖掘就是指充分應(yīng)用科學(xué)、高效率的計(jì)算方法,在海量的數(shù)據(jù)信息中捕獲可用的信息的深入篩選過程?,F(xiàn)如今,隨著人類進(jìn)入了信息時(shí)代,數(shù)據(jù)挖掘的技術(shù)在諸多行業(yè)里獲得了人們的廣泛認(rèn)可,應(yīng)用范圍非常廣闊。
1.2操作方法
總體而言,數(shù)據(jù)挖掘的技術(shù)大體可以分為以下五種操作的方法。第一,神經(jīng)網(wǎng)絡(luò)法。這種方法的魯棒性較好,具有高度容錯(cuò)、并行處理的功能,對(duì)數(shù)據(jù)挖掘十分適用。具體是按照選擇的模型,確定適用范圍?,F(xiàn)階段,神經(jīng)網(wǎng)絡(luò)領(lǐng)域里普遍應(yīng)用連續(xù)、離散、art與koholon等幾種模型,主要在聯(lián)想記憶、聚類的自組織映射、計(jì)算優(yōu)化中進(jìn)行應(yīng)用。第二,決策樹的方法。這種方法指的是對(duì)海量的信息進(jìn)行分類、整理,并尋找?guī)в幸欢ㄟ\(yùn)用價(jià)值的信息。具有迅速分類、獲取可用信息的特點(diǎn)。因此,比較適合處理大量的數(shù)據(jù)。缺陷主要包括抵制噪聲能力弱、表達(dá)復(fù)雜的概念不夠具體。第三,統(tǒng)計(jì)分析法。通過這種方法可以有效地分析函數(shù)關(guān)系、相關(guān)關(guān)系?,F(xiàn)階段,可以具體劃分三種方法,即相關(guān)、回歸、差異等分析方法。第四,遺傳算法。指的是依托于遺傳激勵(lì)與生物的自然選擇規(guī)律的隨機(jī)性搜索的計(jì)算方法,這也是十分常見的數(shù)據(jù)挖掘法??梢耘c其他的模型建立一定的聯(lián)系,具有應(yīng)用范圍廣、隱含并行性的優(yōu)點(diǎn)。第五,挖掘?qū)ο?。結(jié)合信息儲(chǔ)存的格式,可以挖掘面向?qū)ο蟮奈谋緮?shù)據(jù)源、數(shù)據(jù)庫、空間數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、異質(zhì)數(shù)據(jù)庫、時(shí)態(tài)數(shù)據(jù)庫、Internet等。
2軟件工程中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
2.1挖掘結(jié)構(gòu)、程序代碼
數(shù)據(jù)挖掘的技術(shù)在結(jié)構(gòu)、程序代碼方面的應(yīng)用具體如下:其一,檢測(cè)克隆代碼的方法。所謂的克隆代碼是指按照相關(guān)的軟件工程正常運(yùn)行的標(biāo)準(zhǔn),復(fù)制或粘貼某個(gè)代碼段。如果存在特別的需要,還能夠酌情更改一些代碼,并且對(duì)以上的代碼加以嚴(yán)格地檢測(cè),目的在于以免相關(guān)故障的傳播,達(dá)到簡(jiǎn)單維護(hù)系統(tǒng)的目標(biāo)。有利于相關(guān)的軟件系統(tǒng)正常運(yùn)行?,F(xiàn)階段,克隆代碼的檢測(cè)可分為四種方法。即標(biāo)識(shí)符比較、文本對(duì)比、程序結(jié)構(gòu)、度量等。各種方法皆擁有各自的判斷標(biāo)準(zhǔn)與檢測(cè)程序,應(yīng)用的時(shí)候,還需要結(jié)合具體的狀況合理選擇。其二,Aspect挖掘法。這種技術(shù)就是人們經(jīng)常提及的橫切關(guān)注點(diǎn)的挖掘法,在軟件工程里,Asped挖掘法在改造系統(tǒng)中發(fā)揮關(guān)鍵性的作用。尤其在處理相關(guān)問題時(shí),可以提供很多的方法,其中,形式概念、度量分析法最具有針對(duì)性。以上的方法能夠通過重建候選集的形式,更好地解決橫切點(diǎn)的挖掘問題。而且,這種數(shù)據(jù)挖掘的技術(shù)在其他許多方面也可以發(fā)揮良好的性能。
2.2軟件項(xiàng)目管理方面
關(guān)于軟件項(xiàng)目的管理,應(yīng)用數(shù)據(jù)挖掘的技術(shù)可以表現(xiàn)以下兩點(diǎn)。其一,挖掘組織關(guān)系與控制版本的信息。因?yàn)檐浖芾韺儆谝豁?xiàng)系統(tǒng)化的工程,關(guān)于組織關(guān)系的挖掘就分為許多層面的內(nèi)容,其中,以合理地協(xié)調(diào)、分配人力資源最為重要。例如:在某一活動(dòng)舉辦期間,由于涉及諸多的參與人員,這樣,在統(tǒng)計(jì)有關(guān)信息時(shí),極易因信息的交互而影響活動(dòng)的正常秩序。而數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,能夠有效地區(qū)分各方面的組織關(guān)系,極大地提升了項(xiàng)目管理的效率。其二,控制版本的控制信息。版本信息的控制可以為相關(guān)的工作者查詢版本帶來便利。有效地應(yīng)用數(shù)據(jù)挖掘的技術(shù),不但可以對(duì)系統(tǒng)實(shí)際的修復(fù)狀況展開自動(dòng)化地檢測(cè),同時(shí)發(fā)出相關(guān)的報(bào)警信號(hào);而且還能夠輕松地規(guī)避大量的錯(cuò)誤,有利于維護(hù)系統(tǒng)的運(yùn)行秩序,進(jìn)而提升軟件項(xiàng)目的管理質(zhì)量。
2.3故障檢測(cè)方面
數(shù)據(jù)挖掘的技術(shù)在軟件工程中的另一個(gè)重要應(yīng)用就是檢測(cè)故障方面。長(zhǎng)期以來,軟件工程系統(tǒng)中,展開故障檢測(cè)的時(shí)候,通常選擇程序切片的方法,程序切片的檢測(cè)法盡管也可以在某種意義上達(dá)到系統(tǒng)正常運(yùn)行的標(biāo)準(zhǔn),然而,也會(huì)產(chǎn)生一些亟待處理的問題。例如:技術(shù)較為復(fù)雜、定位比較模糊等?,F(xiàn)如今,隨著軟件工程系統(tǒng)日益升級(jí)與優(yōu)化,一定要相應(yīng)地優(yōu)化故障檢測(cè)的技術(shù)。而應(yīng)用數(shù)據(jù)挖掘的技術(shù)恰好可以符合新的檢測(cè)標(biāo)準(zhǔn)。這項(xiàng)技術(shù)具體應(yīng)用于故障檢測(cè)方面可以從交互模式、程序說明進(jìn)行分析。挖掘程序的說明可以對(duì)軟件工程系統(tǒng)相關(guān)的運(yùn)行信息展開跟蹤式的檢測(cè)。以便迅速查找系統(tǒng)運(yùn)行中存在的問題,并及時(shí)進(jìn)行系統(tǒng)的檢測(cè)與維護(hù)。從現(xiàn)階段常見的挖掘法分析,一般應(yīng)用規(guī)則與自動(dòng)化的方法。這兩種方法,皆充分地按照相關(guān)的程序與API的規(guī)則進(jìn)行信息的挖掘。
3結(jié)束語
總之,在軟件工程系統(tǒng)中有效地應(yīng)用數(shù)據(jù)挖掘技術(shù),既能夠極大地提升軟件研發(fā)的工作效率,又能夠增強(qiáng)軟件的穩(wěn)定性能。伴隨信息技術(shù)的不斷發(fā)展,在未來,數(shù)據(jù)挖掘的技術(shù)在軟件工程領(lǐng)域中的應(yīng)用還會(huì)更加廣泛。這項(xiàng)技術(shù)改變了以往人們獲取數(shù)據(jù)的形式。而且從某種意義上優(yōu)化了軟件工程系統(tǒng),有利于軟件工程獲得更好的發(fā)展。