發(fā)布時(shí)間:2023-11-11 09:18:19
序言:寫(xiě)作是分享個(gè)人見(jiàn)解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了8篇的云計(jì)算技術(shù)發(fā)展現(xiàn)狀分析樣本,期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā),請(qǐng)盡情閱讀。
關(guān)鍵詞:云計(jì)算;云計(jì)算產(chǎn)業(yè);發(fā)展研究
中圖分類(lèi)號(hào):F425 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-291X(2013)17-0066-04
引言
2008年的世界金融危機(jī)給各國(guó)經(jīng)濟(jì)帶來(lái)了沉重打擊,其影響至今尚未消除。世界各發(fā)達(dá)國(guó)家為了擺脫經(jīng)濟(jì)困境,積極致力于發(fā)展戰(zhàn)略性新興產(chǎn)業(yè),以尋求新的經(jīng)濟(jì)增長(zhǎng)點(diǎn),占領(lǐng)未來(lái)全球競(jìng)爭(zhēng)的制高點(diǎn)。其中,云計(jì)算產(chǎn)業(yè)同智慧地球、物聯(lián)網(wǎng)等概念一起迅速成為全球各界的關(guān)注焦點(diǎn)。云計(jì)算產(chǎn)業(yè)的發(fā)展能夠節(jié)約用戶(hù)數(shù)據(jù)中心建設(shè)費(fèi)用、計(jì)算機(jī)軟硬件購(gòu)置費(fèi)用,大大提高資源的利用效率,促進(jìn)信息的高度共享,因而,云計(jì)算產(chǎn)業(yè)被視為信息產(chǎn)業(yè)的未來(lái)發(fā)展方向和革命性變革之一。
目前,中國(guó)的云計(jì)算產(chǎn)業(yè)發(fā)展正處于快速成長(zhǎng)期,預(yù)計(jì)在2015年之后將進(jìn)入成熟期,云計(jì)算模式將會(huì)被廣大用戶(hù)接受[1],未來(lái)市場(chǎng)非常廣闊。中國(guó)各級(jí)政府、電信基礎(chǔ)運(yùn)營(yíng)商和云計(jì)算應(yīng)用開(kāi)發(fā)商紛紛向云計(jì)算產(chǎn)業(yè)進(jìn)軍,以便在新一輪技術(shù)發(fā)展浪潮中抓住戰(zhàn)略機(jī)遇,占據(jù)國(guó)際產(chǎn)業(yè)分工制高點(diǎn)。基于此,本文在對(duì)云計(jì)算、云計(jì)算產(chǎn)業(yè)相關(guān)概念界定的基礎(chǔ)上,進(jìn)行了云計(jì)算價(jià)值鏈與服務(wù)模式介紹,歸納與總結(jié)中國(guó)云計(jì)算產(chǎn)業(yè)發(fā)展現(xiàn)狀以及主要制約因素,并為中國(guó)云計(jì)算產(chǎn)業(yè)的發(fā)展提出相關(guān)對(duì)策與建議。
一、云計(jì)算與云計(jì)算產(chǎn)業(yè)相關(guān)概念
(一)云計(jì)算的定義
盡管云計(jì)算概念進(jìn)入人們的視野已經(jīng)有一段時(shí)間,不少?lài)?guó)際IT企業(yè)如IBM、Google、Amazon等也紛紛從各種角度詮釋云計(jì)算。但云計(jì)算至今尚未出現(xiàn)確切的定義。
維基百科(Wikipedia)認(rèn)為,云計(jì)算是一種基于互聯(lián)網(wǎng)的計(jì)算新方式,通過(guò)互聯(lián)網(wǎng)上的異構(gòu)、自治的服務(wù)為個(gè)人和企業(yè)用戶(hù)提供按需即取的計(jì)算。中國(guó)賽迪顧問(wèn)認(rèn)為,云計(jì)算是一種IT資源的交付和使用模式,通過(guò)網(wǎng)絡(luò)以按需、易擴(kuò)展的方式獲得所需的資源(硬件、平臺(tái)、軟件及服務(wù)等),提供資源的網(wǎng)絡(luò)被稱(chēng)為“云”?!霸啤敝械馁Y源在使用者眼中是隨時(shí)可以獲取、按需使用,隨時(shí)可以擴(kuò)展、按使用付費(fèi)的。
綜合上述觀點(diǎn)本文認(rèn)為云計(jì)算是一種信息技術(shù)資源的交付和使用模式,計(jì)算機(jī)軟硬件與數(shù)據(jù)處理等功能可以作為一種商品在網(wǎng)絡(luò)上進(jìn)行流通,用戶(hù)可以通過(guò)網(wǎng)絡(luò)獲得所需的相應(yīng)資源;同時(shí)云計(jì)算也是一種新型的服務(wù)模式,云服務(wù)提供商將資源進(jìn)行整合,為用戶(hù)提供按需的服務(wù)形式。
(二)云計(jì)算產(chǎn)業(yè)
業(yè)界專(zhuān)家對(duì)云計(jì)算產(chǎn)業(yè)的概念也沒(méi)有一個(gè)統(tǒng)一的認(rèn)識(shí)?,F(xiàn)有研究只是形成了對(duì)云計(jì)算產(chǎn)業(yè)的產(chǎn)生路徑、基本特征和范圍形成了一些基本看法。
關(guān)于云計(jì)算產(chǎn)業(yè)產(chǎn)生的路徑,祝小云(2011)認(rèn)為,云計(jì)算產(chǎn)業(yè)由傳統(tǒng)的IT產(chǎn)業(yè)、通信產(chǎn)業(yè)、廣電傳媒和互聯(lián)網(wǎng)產(chǎn)業(yè)相互融合產(chǎn)生[2]。云計(jì)算產(chǎn)業(yè)對(duì)傳統(tǒng)產(chǎn)業(yè)技術(shù)和資源實(shí)現(xiàn)了整合,因而具有具有資源整合性和壟斷行的特征。
筆者認(rèn)為,云計(jì)算產(chǎn)業(yè)是傳統(tǒng)的計(jì)算機(jī)產(chǎn)業(yè)與互聯(lián)網(wǎng)產(chǎn)業(yè)相結(jié)合的產(chǎn)物,以云計(jì)算技術(shù)為基礎(chǔ),提供云服務(wù),具有強(qiáng)大的匯集整合資源能力,為社會(huì)各個(gè)部門(mén)提供軟硬件資源與信息處理能力的知識(shí)和技術(shù)密集的產(chǎn)業(yè),是信息產(chǎn)業(yè)的未來(lái)發(fā)展方向。
二、云計(jì)算產(chǎn)業(yè)價(jià)值鏈條與服務(wù)模式
(一)云計(jì)算產(chǎn)業(yè)的價(jià)值鏈
一般認(rèn)為,云計(jì)算產(chǎn)業(yè)價(jià)值鏈條主要包括以下幾個(gè)基本環(huán)節(jié):運(yùn)設(shè)施提供商、云平臺(tái)提供商、云應(yīng)用開(kāi)發(fā)商、云服務(wù)運(yùn)營(yíng)商以及云系統(tǒng)集成商云計(jì)算產(chǎn)業(yè)價(jià)值鏈如圖(見(jiàn)圖1)。由此可以出云計(jì)算產(chǎn)業(yè)價(jià)值鏈涵蓋了諸多傳統(tǒng)IT產(chǎn)業(yè),包括從芯片、服務(wù)器、PC、網(wǎng)絡(luò)設(shè)備、存儲(chǔ)等硬件設(shè)備,到平臺(tái)軟件、中間件、應(yīng)用軟件、信息安全廠商,到IT服務(wù)運(yùn)營(yíng)和外包服務(wù)商,再到電信運(yùn)營(yíng)商,最后面向政府、企業(yè)、個(gè)人用戶(hù)。
(二)云計(jì)算產(chǎn)業(yè)服務(wù)模式
根據(jù)目前國(guó)內(nèi)外云計(jì)算發(fā)展實(shí)踐,云計(jì)算產(chǎn)業(yè)大致可以劃分為三種服務(wù)模式,即IaaS模式、PaaS模式以及SaaS模式。其中:
1.IaaS(Infrastructure-as-a-Service:基礎(chǔ)設(shè)施服務(wù)模式。該模式主要為用戶(hù)提供基礎(chǔ)性的計(jì)算資源和存儲(chǔ)資源,用戶(hù)可以通過(guò)Internet獲得相對(duì)完善的計(jì)算機(jī)基礎(chǔ)設(shè)施服務(wù),其典型代表產(chǎn)品是亞馬遜的AWS(Elastic Compute Cloud)。
2.PaaS(P1atform-as-a-Service):平臺(tái)服務(wù)模式。該模式主要是指將軟件研發(fā)的平臺(tái)作為一種服務(wù),以SaaS的模式提交給用戶(hù)。軟件開(kāi)發(fā)者可以在這個(gè)基礎(chǔ)架構(gòu)之上建設(shè)新的應(yīng)用,或者擴(kuò)展已有的應(yīng)用,同時(shí)卻不必購(gòu)買(mǎi)開(kāi)發(fā)、質(zhì)量控制或生產(chǎn)服務(wù)器。其典型代表產(chǎn)品有的、Google的App Engine和微軟的Azure(微軟云計(jì)算平臺(tái))。
3.SaaS(Software-as-a-Service):軟件服務(wù)模式。該模式面向用戶(hù)提供簡(jiǎn)單的軟件應(yīng)用服務(wù)以及用戶(hù)交互接口等,如同一種軟件分布模式,是最成熟的云計(jì)算模式。其典型產(chǎn)品有、NetSuite、Google的Gmail和等。
三種云計(jì)算產(chǎn)業(yè)服務(wù)模式由低到高構(gòu)成了一個(gè)完整體系,從不同層次上為用戶(hù)提供資源服務(wù)(見(jiàn)圖2)。
盡管PaaS、IaaS和SaaS模式提供的服務(wù)內(nèi)容不盡相同,但是其核心經(jīng)濟(jì)目的是一致的:都是采用外包的方式,減輕企業(yè)負(fù)擔(dān),降低管理、維護(hù)服務(wù)器硬件、網(wǎng)絡(luò)硬件、基礎(chǔ)架構(gòu)軟件和/或應(yīng)用軟件的人力成本。從更高的層次上看,它們都試圖去解決同一個(gè)商業(yè)問(wèn)題——用盡可能少甚至是零的資本支出,獲得功能、擴(kuò)展能力、服務(wù)和商業(yè)價(jià)值。當(dāng)某種云計(jì)算的模式獲得了成功,這三者之間的界限就會(huì)進(jìn)一步模糊,成功的SaaS或IaaS服務(wù)可以很容易地延伸到平臺(tái)領(lǐng)域[3]。
三、中國(guó)云計(jì)算產(chǎn)業(yè)發(fā)展現(xiàn)狀
(一)云計(jì)算產(chǎn)業(yè)市場(chǎng)規(guī)模增長(zhǎng)迅速
中國(guó)云計(jì)算產(chǎn)業(yè)市場(chǎng)規(guī)模呈現(xiàn)快速增長(zhǎng)態(tài)勢(shì)。計(jì)世資訊提供了一種包含搜索引擎與網(wǎng)絡(luò)游戲的口徑較寬的統(tǒng)計(jì)數(shù)據(jù),認(rèn)為2009 年云計(jì)算應(yīng)用的市場(chǎng)規(guī)模已達(dá)403.5 億元,比2008 年的315.2 億元增長(zhǎng)了28%。另外,根據(jù)賽迪顧問(wèn)的統(tǒng)計(jì)結(jié)果,2009 年中國(guó)云計(jì)算市場(chǎng)規(guī)模為92.23 億元,比2008 年增長(zhǎng)26.85%。根據(jù)賽迪顧問(wèn)2012年的《中國(guó)云計(jì)算產(chǎn)業(yè)發(fā)展白皮書(shū)》,初步估計(jì)2012年中國(guó)云計(jì)算產(chǎn)業(yè)市場(chǎng)規(guī)模為606.78億元,相對(duì)于2009 年中國(guó)云計(jì)算市場(chǎng)規(guī)模92.23 億元,年復(fù)合增長(zhǎng)率為87.4%。由此可可見(jiàn),中國(guó)云計(jì)算產(chǎn)業(yè)正處于市場(chǎng)起飛期,未來(lái)發(fā)展前景廣闊。
(二)云計(jì)算服務(wù)模式相對(duì)單一
云計(jì)算服務(wù)分為硬件層的基礎(chǔ)架構(gòu)云(IaaS)、平臺(tái)云(PasS)和軟件應(yīng)用云(SaaS)三個(gè)層次,從長(zhǎng)期來(lái)看,在云計(jì)算的產(chǎn)值中應(yīng)該呈現(xiàn)均衡發(fā)展的格局。但是,中國(guó)目前云計(jì)算產(chǎn)業(yè)服務(wù)模式比較單一,大多數(shù)的云計(jì)算服務(wù)主要以PasS和SaaS的形式提供給用戶(hù),在IaaS層則主要依賴(lài)于技術(shù)實(shí)力強(qiáng)勁的IBM、谷歌等國(guó)際公司。計(jì)世資訊的研究提供了云計(jì)算應(yīng)用的細(xì)分市場(chǎng)結(jié)構(gòu),其中,以軟件即服務(wù)(SaaS)為代表的云應(yīng)用服務(wù)所占市場(chǎng)比例最大,是目前云計(jì)算服務(wù)的主要方式。2009 年,SaaS 在云計(jì)算服務(wù)中所占比例為87.8%,平臺(tái)即服務(wù)(PaaS)所占比例為11.8%,基礎(chǔ)設(shè)施即服務(wù)(IaaS)所占比例為0.4% [4]。這表明,中國(guó)云計(jì)算基礎(chǔ)設(shè)施與基礎(chǔ)服務(wù)領(lǐng)域非常薄弱,對(duì)國(guó)外企業(yè)的過(guò)度依賴(lài)很有可能在未來(lái)的國(guó)際競(jìng)爭(zhēng)中受制于人。
(三)云計(jì)算產(chǎn)業(yè)布局缺乏統(tǒng)一考慮
盡管云計(jì)算服務(wù)在中國(guó)尚未真正全面普及,但是國(guó)內(nèi)地方政府對(duì)云計(jì)算產(chǎn)業(yè)表現(xiàn)出了高度的熱情。各地紛紛建立云計(jì)算中心,投入相當(dāng)高,動(dòng)輒是幾千萬(wàn)或者是上億元;初步統(tǒng)計(jì),中國(guó)正有超過(guò)20個(gè)城市將云計(jì)算作為重點(diǎn)發(fā)展產(chǎn)業(yè),例如北京、上海、江蘇、廣東等很多省市都結(jié)合自身特色,推出了各自的云計(jì)算發(fā)展戰(zhàn)略。這種一哄而上的云計(jì)算產(chǎn)業(yè)發(fā)展局面已經(jīng)嚴(yán)重偏離了云計(jì)算的本質(zhì)。我們真的需要這么多云計(jì)算中心嗎?這些云計(jì)算中心真的能夠高效地為我們提供服務(wù)嗎?大多數(shù)的云計(jì)算中心建設(shè)項(xiàng)目不但未能對(duì)已經(jīng)過(guò)剩的計(jì)算資源進(jìn)行整合和高效利用,反而演化成為重復(fù)建設(shè)、重復(fù)投資,從而造成更大規(guī)模的IT資源浪費(fèi)。
因此,必須堅(jiān)持“以市場(chǎng)需求為導(dǎo)向”的原則來(lái)發(fā)展云計(jì)算產(chǎn)業(yè),需要從國(guó)家層面上統(tǒng)籌協(xié)調(diào)、統(tǒng)一考慮,參考各地實(shí)際需求來(lái)布局,避免重復(fù)建設(shè),造成資源浪費(fèi)。
(四)公有云難以“落地”
公有云是云計(jì)算服務(wù)的一種形式,在美國(guó)和世界很多地區(qū)已經(jīng)大范圍普及,對(duì)政府、企業(yè)和個(gè)人用戶(hù)提供了極大的幫助。然而公有云在中國(guó)一直難以“落地”,究其原因:一方面是客戶(hù)接受程度。根據(jù)埃森哲公司對(duì)100 多位IT 高級(jí)管理人員所做的問(wèn)卷調(diào)查結(jié)果顯示,中國(guó)企業(yè)已開(kāi)始探索使用云計(jì)算,但在態(tài)度方面依然謹(jǐn)慎,目前更傾向于創(chuàng)建私有云,而不是使用公有云服務(wù),只有不到20%的受訪企業(yè)在使用公有云服務(wù),構(gòu)建和運(yùn)行私有云平臺(tái)的比例要更高,愿意把核心應(yīng)用委托給云服務(wù)商的用戶(hù)極少[4]。另一方面,則是發(fā)展環(huán)境不成熟。機(jī)房基礎(chǔ)設(shè)施、網(wǎng)絡(luò)環(huán)境以及政策管制等都是公有云發(fā)展的絆腳石,國(guó)際上成熟的云服務(wù)比如亞馬遜AWS,微軟Azure和Rackspace等移植到中國(guó)困難重重;國(guó)內(nèi)土生土長(zhǎng)的阿里云和盛大云等,不僅面臨政策上的限制,也面臨很多基礎(chǔ)設(shè)施方面的問(wèn)題。
四、制約中國(guó)云計(jì)算產(chǎn)業(yè)發(fā)展的關(guān)鍵問(wèn)題
(一)安全問(wèn)題
安全問(wèn)題是影響云計(jì)算產(chǎn)業(yè)能否發(fā)展壯大的關(guān)鍵問(wèn)題,也是云計(jì)算服務(wù)用戶(hù)所關(guān)注的首要問(wèn)題。云計(jì)算安全問(wèn)題包括兩個(gè)方面:一方面是客戶(hù)層面的數(shù)據(jù)安全問(wèn)題。這些問(wèn)題表現(xiàn)為計(jì)算系統(tǒng)問(wèn)題造成的數(shù)據(jù)丟失、黑客攻擊隱私泄密,以及競(jìng)爭(zhēng)對(duì)手通過(guò)非法手段竊取商業(yè)秘密等。另一方面是國(guó)家方面的數(shù)據(jù)安全問(wèn)題。公有云計(jì)算環(huán)境下可能導(dǎo)致有關(guān)國(guó)家經(jīng)濟(jì)、軍事、政府部門(mén)的敏感數(shù)據(jù)以及科研成果失竊,從而威脅到國(guó)家的經(jīng)濟(jì)和社會(huì)安全。云計(jì)算中的數(shù)據(jù)對(duì)于數(shù)據(jù)所有者以外的其他云計(jì)算用戶(hù)是保密的,但是對(duì)于提供云計(jì)算的商業(yè)機(jī)構(gòu)而言確實(shí)毫無(wú)秘密可言。面對(duì)這些潛在危險(xiǎn),商業(yè)機(jī)構(gòu)和政府機(jī)構(gòu)選擇云計(jì)算服務(wù)、特別是國(guó)外機(jī)構(gòu)提供的云計(jì)算服務(wù)時(shí),考慮到安全問(wèn)題不得不放棄云計(jì)算服務(wù)。
(二)標(biāo)準(zhǔn)問(wèn)題
標(biāo)準(zhǔn)問(wèn)題是云計(jì)算產(chǎn)業(yè)發(fā)展中的又一個(gè)關(guān)鍵問(wèn)題。這個(gè)問(wèn)題首先表現(xiàn)在國(guó)際統(tǒng)一標(biāo)準(zhǔn)的缺位。雖然目前云計(jì)算在國(guó)際上已成為標(biāo)準(zhǔn)化工作熱點(diǎn)之一,但多個(gè)標(biāo)準(zhǔn)化組織互有交叉和重復(fù),云計(jì)算標(biāo)準(zhǔn)還處于草案規(guī)劃階段,國(guó)際上還沒(méi)有形成統(tǒng)一的云計(jì)算標(biāo)準(zhǔn)體系。另一方面表現(xiàn)為在國(guó)內(nèi)云計(jì)算的標(biāo)準(zhǔn)工作剛剛啟動(dòng),還處于起步階段,與國(guó)際相比較嚴(yán)重滯后,在標(biāo)準(zhǔn)競(jìng)爭(zhēng)中處于不利地位??傮w來(lái)說(shuō),云計(jì)算服務(wù)標(biāo)準(zhǔn)的缺失在很大程度上制約著產(chǎn)業(yè)的健康發(fā)展,只有通過(guò)一致的標(biāo)準(zhǔn)才能使得云計(jì)算的應(yīng)用更加廣泛。
(三)人才問(wèn)題
中國(guó)云計(jì)算產(chǎn)業(yè)的發(fā)展中的人才問(wèn)題突出表現(xiàn)為:一是軟硬件人才在數(shù)量上供不應(yīng)求;二是質(zhì)量結(jié)構(gòu)不合理,缺乏多層次、復(fù)合型、交叉型、國(guó)際化的綜合人才。 其主要原因在于:首先是人才培養(yǎng)模式問(wèn)題。目前中國(guó)的應(yīng)試教育體制使得大學(xué)生們?nèi)狈?chuàng)新的基本思維方式,創(chuàng)新型人才極度匱乏。其次是人才競(jìng)爭(zhēng)問(wèn)題。對(duì)于關(guān)鍵核心技術(shù)人才,國(guó)際大公司有較大的競(jìng)爭(zhēng)優(yōu)勢(shì)和吸引力,優(yōu)秀的畢業(yè)生首選外企工作,進(jìn)一步加劇了中國(guó)云計(jì)算企業(yè)人才短缺困境。
(四)網(wǎng)絡(luò)帶寬問(wèn)題
云計(jì)算是基于互聯(lián)網(wǎng)絡(luò)的應(yīng)用,網(wǎng)絡(luò)的是否流暢直接決定了云計(jì)算服務(wù)的質(zhì)量。足夠高的、可靠的、低成本的、容易獲取的帶寬資源,是云計(jì)算產(chǎn)業(yè)發(fā)展的前提和基礎(chǔ)。和國(guó)際上美國(guó)、日本、韓國(guó)等發(fā)達(dá)國(guó)家水平相比較中國(guó)互聯(lián)網(wǎng)帶寬差距較大,根據(jù)DCCI互聯(lián)網(wǎng)數(shù)據(jù)中心《中國(guó)寬帶用戶(hù)調(diào)查》報(bào)告,“網(wǎng)民使用的實(shí)際寬帶下載速率,低于運(yùn)營(yíng)商提供的名義寬帶速率,超半數(shù)用戶(hù)上網(wǎng)平均速度達(dá)不到標(biāo)定速度”,“使用4M寬帶的用戶(hù)中,平均速度在400KB/s以下的占91.2%;使用2M寬帶平均速度在200KB/s以下的占83.5%;使用1M寬帶在100KB/s以下的則占67.6%”。云計(jì)算環(huán)境下,數(shù)據(jù)交互大幅度增多,互聯(lián)網(wǎng)流量呈幾何式增長(zhǎng),會(huì)給本來(lái)就發(fā)展滯后的互聯(lián)網(wǎng)進(jìn)一步增加服務(wù)中斷、網(wǎng)絡(luò)延遲等問(wèn)題,從而嚴(yán)重制約云計(jì)算產(chǎn)業(yè)的發(fā)展。
(五)資金問(wèn)題
云計(jì)算產(chǎn)業(yè)屬于高風(fēng)險(xiǎn)、高收益的高技術(shù)產(chǎn)業(yè),傳統(tǒng)的融資渠道難以滿足云計(jì)算企業(yè)的資金需求,必須依靠風(fēng)險(xiǎn)資本的運(yùn)作來(lái)推動(dòng)云計(jì)算產(chǎn)業(yè)的發(fā)展??墒聦?shí)上,中國(guó)目前扶持高技術(shù)企業(yè)技術(shù)轉(zhuǎn)化的環(huán)境還不成熟。在美國(guó),一項(xiàng)創(chuàng)新技術(shù)很容易獲得風(fēng)險(xiǎn)投資順利地實(shí)現(xiàn)商業(yè)化;但是在中國(guó),同樣的技術(shù)卻難以獲得風(fēng)險(xiǎn)投資。資金問(wèn)題也將會(huì)嚴(yán)重制約中國(guó)云計(jì)算產(chǎn)業(yè)的發(fā)展。
五、結(jié)論與建議
(一)研究結(jié)論
本文在對(duì)云計(jì)算產(chǎn)業(yè)相關(guān)概念界定以及云計(jì)算產(chǎn)業(yè)價(jià)值鏈和服務(wù)模式分析的基礎(chǔ)上,歸納總結(jié)了中國(guó)云計(jì)算產(chǎn)業(yè)的發(fā)展現(xiàn)狀,認(rèn)為中國(guó)云計(jì)算產(chǎn)業(yè)市場(chǎng)規(guī)模發(fā)展迅速,但是存在服務(wù)模式單一、布局相對(duì)缺乏統(tǒng)籌考慮、公有云客戶(hù)發(fā)展滯后等問(wèn)題,而安全問(wèn)題、標(biāo)準(zhǔn)問(wèn)題、人才問(wèn)題、網(wǎng)絡(luò)帶寬問(wèn)題以及資金問(wèn)題是制約中國(guó)云計(jì)算產(chǎn)業(yè)的關(guān)鍵因素。
(二)對(duì)策建議
1.關(guān)于政府層面的對(duì)策建議。首先,政府要積極制定云計(jì)算產(chǎn)業(yè)發(fā)展政策,構(gòu)建寬松的發(fā)展環(huán)境。例如制定相對(duì)寬松的政策和標(biāo)準(zhǔn),細(xì)化云安全、云可靠性和市場(chǎng)準(zhǔn)入機(jī)制。 其次,提高中國(guó)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的質(zhì)量,尤其要提高中國(guó)寬帶網(wǎng)絡(luò)的速度和可用性,做好最基本的云計(jì)算產(chǎn)業(yè)發(fā)展保障工作。再次,政策引導(dǎo)與市場(chǎng)化運(yùn)作相結(jié)合,推動(dòng)中國(guó)云計(jì)算產(chǎn)業(yè)發(fā)展。例如重點(diǎn)扶持一批具有國(guó)際競(jìng)爭(zhēng)力的企業(yè)以及云計(jì)算產(chǎn)業(yè)的相關(guān)項(xiàng)目;政府率先應(yīng)用云服務(wù),支持諸如“政務(wù)云”、“公共服務(wù)云”的建設(shè),起到行業(yè)表率和帶動(dòng)作用。 最后,做好國(guó)際對(duì)接工作,構(gòu)建寬松的云計(jì)算產(chǎn)業(yè)發(fā)展國(guó)際環(huán)境。例如,政府積極參與國(guó)際上云計(jì)算相關(guān)產(chǎn)業(yè)政策和標(biāo)準(zhǔn)的起草,確保中國(guó)具有與國(guó)際接軌的相關(guān)政策與標(biāo)準(zhǔn);鼓勵(lì)中國(guó)企業(yè)和國(guó)際領(lǐng)先企業(yè)交流、合作,吸取國(guó)際云計(jì)算應(yīng)用和服務(wù)的成功經(jīng)驗(yàn),避免中國(guó)企業(yè)在發(fā)展道路上走彎路。
2.關(guān)于企業(yè)層面的對(duì)策建議。首先,云計(jì)算企業(yè)要致力于云計(jì)算理念普及,提高用戶(hù)云計(jì)算接受程度。云計(jì)算企業(yè)可以借助于各種技術(shù)論壇、產(chǎn)業(yè)峰會(huì)、高峰對(duì)話等活動(dòng),向潛在客戶(hù)展示先進(jìn)技術(shù)理念,可靠、安全、高效的解決方案,不斷擴(kuò)大企業(yè)在中國(guó)云計(jì)算應(yīng)用領(lǐng)域的影響力,培育潛在市場(chǎng)。其次,中國(guó)云計(jì)算產(chǎn)業(yè)要形成云計(jì)算產(chǎn)業(yè)戰(zhàn)略聯(lián)盟,壯大中國(guó)云計(jì)算產(chǎn)業(yè)實(shí)力。云計(jì)算產(chǎn)業(yè)企業(yè)可通過(guò)行業(yè)協(xié)會(huì)、產(chǎn)業(yè)聯(lián)盟等形式,解決行業(yè)發(fā)展的共性問(wèn)題,例如,為云計(jì)算產(chǎn)業(yè)發(fā)展提供策略、規(guī)劃及政策建議,積極維護(hù)聯(lián)盟的合法權(quán)益,引領(lǐng)行業(yè)自律發(fā)展等。最后,積極開(kāi)展云計(jì)算國(guó)際合作與交流,吸收借鑒國(guó)外的優(yōu)秀經(jīng)驗(yàn)。中國(guó)云計(jì)算產(chǎn)業(yè)還在發(fā)展初期,成功的云計(jì)算應(yīng)用案例還不多,經(jīng)驗(yàn)與技術(shù)的等方面都不成熟??梢越梃b國(guó)外政府、交通、教育、物流、制造、流通等各個(gè)行業(yè)的云計(jì)算成功應(yīng)用案例,為中國(guó)云計(jì)算產(chǎn)業(yè)的發(fā)展提供指導(dǎo)。
參考文獻(xiàn):
[1] 房秉毅,張?jiān)朴?,程瑩,?云計(jì)算國(guó)內(nèi)外發(fā)展現(xiàn)狀分析[J].電信科學(xué),2010,(8A):1-5.
[2] 祝小云.從云計(jì)算產(chǎn)業(yè)鏈探討中國(guó)云計(jì)算商業(yè)模式[J].經(jīng)濟(jì)視角,2011,(9):61-64.
關(guān)鍵詞:云平臺(tái);數(shù)據(jù)挖掘;數(shù)字圖書(shū)館
中圖分類(lèi)號(hào):G250.72 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1008-0821(2012)07-0046-04
信息技術(shù)的快速發(fā)展和圖書(shū)館服務(wù)模式的轉(zhuǎn)變?yōu)橐栽朴?jì)算為主的前沿技術(shù)在圖書(shū)館中的廣泛應(yīng)用拓展了空間。以云計(jì)算為平臺(tái)的數(shù)據(jù)挖掘技術(shù)適應(yīng)了用戶(hù)多樣化、迅捷化的需求,有利于用戶(hù)在圖書(shū)館的海量數(shù)據(jù)信息中更快、更準(zhǔn)確地發(fā)現(xiàn)所需信息。近年來(lái),國(guó)內(nèi)外諸多學(xué)者對(duì)數(shù)據(jù)挖掘技術(shù)及其發(fā)展趨勢(shì)進(jìn)行了研究,普遍認(rèn)為在圖書(shū)館中采用數(shù)據(jù)挖掘技術(shù),有助于數(shù)字圖書(shū)館的自動(dòng)化建設(shè),提升服務(wù)質(zhì)量。數(shù)字圖書(shū)館要適應(yīng)用戶(hù)特定需求,向用戶(hù)及時(shí)、準(zhǔn)確地提供所需信息,必須動(dòng)態(tài)地組織和呈現(xiàn)與用戶(hù)當(dāng)前信息需求相關(guān)的信息內(nèi)容,而數(shù)據(jù)挖掘可以實(shí)現(xiàn)這一功能?;谠破脚_(tái)的數(shù)據(jù)挖掘技術(shù)是數(shù)字圖書(shū)館信息資源整合的最佳方法,也是目前世界各國(guó)圖書(shū)館潛在數(shù)據(jù)技術(shù)挖掘的技術(shù)發(fā)展趨勢(shì)。
1、相關(guān)理論綜述
1.1 云計(jì)算概述
云計(jì)算是指基于互聯(lián)網(wǎng)的一種新型的計(jì)算模式,即把存儲(chǔ)于個(gè)人電腦、移動(dòng)電話和其它設(shè)備上的大量信息和處理器資源集中在一起,把信息資源、數(shù)據(jù)作為服務(wù)通過(guò)互聯(lián)網(wǎng)提供給用戶(hù)。云計(jì)算是一種新興的共享基礎(chǔ)架構(gòu)管理方法,能夠把大量的、高度虛擬化的資源管理起來(lái),形成巨大的系統(tǒng)池,統(tǒng)一提供各種IT服務(wù)。云計(jì)算依靠B/S架構(gòu),把計(jì)算壓力從客戶(hù)端轉(zhuǎn)移到服務(wù)器端,由技術(shù)提供商進(jìn)行遠(yuǎn)程服務(wù)支持,是分布式處理、并行處理和網(wǎng)格計(jì)算的新發(fā)展。其資源和計(jì)算都在異地的設(shè)備中完成,而自己的終端設(shè)備只需要一個(gè)顯示設(shè)備和操作設(shè)備。云計(jì)算主要運(yùn)用虛擬機(jī)(虛擬服務(wù)器)聚合形成同質(zhì)服務(wù),強(qiáng)調(diào)在某個(gè)機(jī)構(gòu)內(nèi)部的分布式計(jì)算資源的共享。
圖書(shū)館云計(jì)算服務(wù)是以虛擬化技術(shù)為基礎(chǔ)的,為用戶(hù)提供最大限度的信息數(shù)據(jù)資源。云計(jì)算技術(shù)能實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)、分析、處理、挖掘,提供高可靠性、高性能的數(shù)據(jù)挖掘分析,主要是基于數(shù)據(jù)挖掘平臺(tái)PDMiner(ParallelDistributed Miner),實(shí)現(xiàn)了對(duì)大數(shù)據(jù)集的處理、分析,向用戶(hù)提供高效的服務(wù)。云計(jì)算在對(duì)海量的數(shù)據(jù)存儲(chǔ)、讀取基礎(chǔ)上進(jìn)行大量的分析,數(shù)據(jù)的讀操作頻率遠(yuǎn)大于數(shù)據(jù)的更新頻率。
1.2 國(guó)內(nèi)云計(jì)算市場(chǎng)發(fā)展現(xiàn)狀分析
目前,我國(guó)已經(jīng)掀起了發(fā)展云計(jì)算的熱潮。從政府層面看,政府向來(lái)是IT服務(wù)方面最穩(wěn)定的市場(chǎng),面對(duì)社會(huì)經(jīng)濟(jì)發(fā)展的形勢(shì),政府部門(mén)已將云計(jì)算與政府的工作緊密結(jié)’合,從而成為經(jīng)濟(jì)社會(huì)發(fā)展的重要支撐;從企業(yè)層面看,國(guó)內(nèi)很多企業(yè)已利用云平臺(tái)對(duì)技術(shù)、產(chǎn)品、服務(wù)等進(jìn)行了大膽創(chuàng)新,取得了良好的應(yīng)用實(shí)踐效果;從圖書(shū)館內(nèi)部業(yè)務(wù)層面看,在云計(jì)算時(shí)代來(lái)臨之際,考慮到服務(wù)方式的轉(zhuǎn)變、信息數(shù)據(jù)的挖掘及未來(lái)數(shù)據(jù)庫(kù)的采購(gòu)等問(wèn)題,也已經(jīng)將云計(jì)算視為發(fā)展的重要保障。有學(xué)者認(rèn)為,當(dāng)前幾乎所有的云服務(wù)都可以在圖書(shū)館領(lǐng)域得到應(yīng)用,包括大量的軟件服務(wù)、云存儲(chǔ)服務(wù)、平臺(tái)服務(wù)和互聯(lián)網(wǎng)整合服務(wù)等。圖書(shū)館充分利用云計(jì)算技術(shù),推進(jìn)現(xiàn)代化建設(shè)和信息服務(wù)進(jìn)程,進(jìn)一步提升自身的信息資源建設(shè)與信息服務(wù)提供能力,顯然是一種不可回避的選擇。目前,圖書(shū)館界正在積極探討如何將云計(jì)算和云服務(wù)應(yīng)用到圖書(shū)館的資源建設(shè)與服務(wù)提供中。中國(guó)高等教育文獻(xiàn)保障系統(tǒng)正在完成CALIS數(shù)字圖書(shū)館云服務(wù)平臺(tái),構(gòu)建大型的分布式公共數(shù)字圖書(shū)館服務(wù)網(wǎng)絡(luò),力圖將分布在互聯(lián)網(wǎng)中各個(gè)圖書(shū)館的資源和服務(wù)整合成為一個(gè)整體,形成一個(gè)可控的自適應(yīng)的新型服務(wù)體系。這一系統(tǒng)架構(gòu)是以SOA規(guī)范為基礎(chǔ)。以O(shè)SGi標(biāo)準(zhǔn)對(duì)各個(gè)服務(wù)進(jìn)行統(tǒng)一封裝,為服務(wù)提供者提供統(tǒng)一的服務(wù)功能,為消費(fèi)者和提供者之間提供統(tǒng)一的通信方式。為實(shí)現(xiàn)來(lái)自不同服務(wù)平臺(tái)、系統(tǒng)的服務(wù)整合,CALIS整個(gè)云服務(wù)平臺(tái)提供了統(tǒng)一開(kāi)放API,統(tǒng)一的API托管以及統(tǒng)一的認(rèn)證服務(wù)。CALIS及其成員館提供了靈活的部署和應(yīng)用方式,既能滿足CALJS構(gòu)建公有云服務(wù)中心的需要,也能滿足圖書(shū)館構(gòu)建私有服務(wù)云的需要,還能實(shí)現(xiàn)對(duì)這兩類(lèi)服務(wù)云的整合。到目前為止,CALIS云服務(wù)平臺(tái)的基本框架已經(jīng)完成。國(guó)外較有代表性的云服務(wù)應(yīng)用先例主要有美國(guó)國(guó)會(huì)圖書(shū)館與DuraSpace公司共同啟動(dòng)的Dur-aCloud項(xiàng)目??梢哉f(shuō),云計(jì)算對(duì)圖書(shū)館而言并不顯得虛無(wú)縹緲,只有抓住這一大好機(jī)遇,明確自己在云計(jì)算環(huán)境中的發(fā)展定位,完善網(wǎng)絡(luò)服務(wù)設(shè)施,提高公共服務(wù)的水平,才能進(jìn)一步提升自身的社會(huì)價(jià)值與地位。
1.3 數(shù)據(jù)挖掘技術(shù)相關(guān)理論
數(shù)據(jù)挖掘(Dam Mhhg)技術(shù)是一種新興的信息處理技術(shù),源于20世紀(jì)90年代中期,作為知識(shí)發(fā)現(xiàn)的關(guān)鍵步驟,數(shù)據(jù)挖掘?qū)τ谟脩?hù)從海量數(shù)據(jù)中提取有用知識(shí)具有重要作用,這一新興技術(shù)涉及到多個(gè)學(xué)科領(lǐng)域,如模糊數(shù)學(xué)、人工智能、機(jī)器學(xué)習(xí)等。數(shù)據(jù)挖掘方法也在近年來(lái)不斷發(fā)展,從仿生算法、數(shù)據(jù)庫(kù)法(多維數(shù)據(jù)分析、OLAP等)到目前盛行的領(lǐng)域驅(qū)動(dòng)數(shù)據(jù)挖掘(DDDM)方法,可以說(shuō)日新月異。
數(shù)據(jù)挖掘也稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),就是有效地從大量的、不完全的、模糊的、圖書(shū)館數(shù)據(jù)倉(cāng)庫(kù)中,提取在隱含在其中的、人們感興趣的且事先不知道的、潛在的有用信息和知識(shí)的過(guò)程,并利用各種分析工具在這些海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系,從數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析,從中提取有用的知識(shí)、高層信息或輔助決策的關(guān)鍵性數(shù)據(jù)。隨著圖書(shū)館信息化程度的提高,數(shù)據(jù)量不斷積累膨脹,為進(jìn)一步的數(shù)據(jù)挖掘提供了豐富的數(shù)據(jù)信息資源??梢宰畲笙薅鹊貪M足各類(lèi)用戶(hù)的知識(shí)信息需求。用戶(hù)從數(shù)據(jù)庫(kù)中提取所需數(shù)據(jù),對(duì)其進(jìn)行進(jìn)一步的集成和合并,利用合適的數(shù)據(jù)挖掘技術(shù),對(duì)相應(yīng)信息資源進(jìn)行整合,從而為決策提供更為有效的幫助。
2、數(shù)據(jù)挖掘技術(shù)及在圖書(shū)館中的應(yīng)用
隨著圖書(shū)館數(shù)字化程度的推進(jìn),如何運(yùn)用新技術(shù)挖掘潛在的信息資源,為服務(wù)讀者和科學(xué)管理提供可靠的依據(jù),成為圖書(shū)館界關(guān)注的問(wèn)題。主動(dòng)發(fā)掘讀者需求,提供讀者所需信息,是現(xiàn)代圖書(shū)館的重要工作任務(wù)之一。由于每一種數(shù)據(jù)挖掘技術(shù)方法都有其自身的特點(diǎn)和實(shí)現(xiàn)步驟,因此,成功應(yīng)用數(shù)據(jù)挖掘技術(shù)達(dá)到最終目標(biāo)的過(guò)程相當(dāng)復(fù)雜。這一過(guò)程是基于約束的、人機(jī)結(jié)合、往復(fù)循環(huán)、不斷逼近目標(biāo)、深層次的知識(shí)發(fā)現(xiàn)過(guò)程。其基本處理流程包括:數(shù)據(jù)收集、數(shù)據(jù)整理、數(shù)據(jù)挖掘、知識(shí)的獲取等,數(shù)據(jù)挖掘的每個(gè)過(guò)程不是一次就能完成的,而是一個(gè)循環(huán)迭代的過(guò)程,只有這樣才有可能達(dá)到預(yù)期的效果。
2.1 建立數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)挖掘的技術(shù)基礎(chǔ)之一是數(shù)據(jù)倉(cāng)庫(kù),而數(shù)據(jù)倉(cāng)庫(kù)技術(shù)是源于數(shù)據(jù)庫(kù)的技術(shù),它主要的設(shè)計(jì)思想是將分析決策所需的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來(lái),把分散的,難以訪問(wèn)的操作數(shù)據(jù)轉(zhuǎn)換成集中的、統(tǒng)一的、隨時(shí)可用的信息而建立的一種數(shù)據(jù)庫(kù)存儲(chǔ)環(huán)境。人們對(duì)數(shù)據(jù)倉(cāng)庫(kù)的定義是面向主題的,集成的,具有時(shí)間特征的,穩(wěn)定的數(shù)據(jù)集合,用以支持經(jīng)營(yíng)管理中的決策制定過(guò)程。為什么要建設(shè)數(shù)據(jù)倉(cāng)庫(kù)的主要原因在于:數(shù)據(jù)倉(cāng)庫(kù)可以說(shuō)是決策支持系統(tǒng),它是在管理信息系統(tǒng)的基礎(chǔ)上發(fā)展起來(lái)的,數(shù)據(jù)倉(cāng)庫(kù)提供的經(jīng)過(guò)整理統(tǒng)計(jì)歸納的數(shù)據(jù)可以給決策者很多信息,并通過(guò)數(shù)據(jù)幫助決策者做出決策。所以建立數(shù)據(jù)倉(cāng)庫(kù)是很重要的事情。
建立圖書(shū)館的數(shù)據(jù)倉(cāng)庫(kù),用以收集信息。在學(xué)校圖書(shū)館管理系統(tǒng)中,全面實(shí)行校園一卡通,這樣為直接收集讀者的借閱數(shù)據(jù)提供了便利。下面本人簡(jiǎn)單說(shuō)明針對(duì)圖書(shū)館數(shù)據(jù)倉(cāng)庫(kù)事實(shí)表和維表的設(shè)計(jì)。
在借閱過(guò)程中,以學(xué)生、書(shū)籍、借閱時(shí)間三方面定義3個(gè)維度來(lái)建立維表,然后建立事實(shí)表,來(lái)收集信息。維表包含的是相應(yīng)維度的描述信息,這些信息用作查詢(xún)的約束條件,一般是離散的,描述性的,不具有可加性的。如圖1-3所示:根據(jù)圖書(shū)館數(shù)據(jù)倉(cāng)庫(kù)建立的3個(gè)維表:學(xué)生維表、圖書(shū)維表、借閱時(shí)間維表。
數(shù)據(jù)倉(cāng)庫(kù)多,一般多采用多維數(shù)據(jù)模型,這樣能更好的完成多維數(shù)據(jù)分析的需要。多維數(shù)據(jù)模型普遍采用的一種非常重要的模式就是星形模式,星形模式是由事實(shí)表和維表通過(guò)星形方式來(lái)連接而成,事實(shí)表包含的是借閱數(shù)據(jù)信息,這些信息用于分析型查詢(xún)。數(shù)據(jù)取值通常是可度量的。連續(xù)型的,且具有可加性,數(shù)據(jù)量可以達(dá)到幾百萬(wàn)甚至上億條記錄。事實(shí)表中的借閱數(shù)據(jù)信息可以從多個(gè)維度查看,每一個(gè)維度對(duì)應(yīng)一張維表。如圖4所示:
在數(shù)據(jù)倉(cāng)庫(kù)星形建模的基本工作完成之后,就應(yīng)該開(kāi)始進(jìn)行數(shù)據(jù)聚集的設(shè)計(jì)。數(shù)據(jù)聚集是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的必備內(nèi)容,它與分析型應(yīng)用的需求密切相關(guān),且與事實(shí)表和維表的設(shè)計(jì)緊密聯(lián)系。就工作的時(shí)間和內(nèi)容而言,它是數(shù)據(jù)倉(cāng)庫(kù)多維數(shù)據(jù)建模的后期工作,是事實(shí)表和維表設(shè)計(jì)工作的延續(xù)。
創(chuàng)建數(shù)據(jù)聚集首先確定數(shù)據(jù)聚集的內(nèi)容,步驟如下:
(1)確定在各個(gè)維的哪些屬性上需要進(jìn)行數(shù)據(jù)的聚集,這里以時(shí)間維的月份和年份,圖書(shū)維的圖書(shū)種類(lèi),學(xué)生維的專(zhuān)業(yè)建立數(shù)據(jù)聚集。
(2)確定不同維的屬性如何進(jìn)行組合。
數(shù)據(jù)聚集建立后,由于分析型查詢(xún)一般都比較復(fù)雜,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量一般有比較大,因此建立索引提高數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的訪問(wèn)速度具有重要意義。所以這里還要建立索引。
明確了數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)的基本方案,完成了數(shù)據(jù)模型的設(shè)計(jì)后下面考慮數(shù)據(jù)預(yù)處理問(wèn)題。對(duì)事實(shí)表和維表進(jìn)行一些數(shù)據(jù)凈化等工作。
數(shù)據(jù)倉(cāng)庫(kù)經(jīng)過(guò)以上經(jīng)過(guò)建設(shè)后。我們還要對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行運(yùn)行和維護(hù)。
2.2 在數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行數(shù)據(jù)挖掘
數(shù)據(jù)挖掘建立在數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,前面已經(jīng)介紹了一些數(shù)據(jù)倉(cāng)庫(kù)的相關(guān)知識(shí),它們二者之間有著緊密的聯(lián)系。數(shù)據(jù)倉(cāng)庫(kù)為數(shù)據(jù)挖掘提供了數(shù)據(jù)基礎(chǔ),數(shù)據(jù)倉(cāng)庫(kù)完成了數(shù)據(jù)的收集、集成、存儲(chǔ)、管理等工作,數(shù)據(jù)挖掘面對(duì)的是經(jīng)過(guò)初步加工的數(shù)據(jù),使得數(shù)據(jù)挖掘能更專(zhuān)注于知識(shí)的發(fā)現(xiàn);而且由于數(shù)據(jù)倉(cāng)庫(kù)所具有的新的特點(diǎn),又對(duì)數(shù)據(jù)挖掘技術(shù)提出了更高的要求??梢哉f(shuō),數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)結(jié)合起來(lái),能夠更充分的發(fā)揮數(shù)據(jù)的威力。
通過(guò)利用圖書(shū)館的數(shù)據(jù)倉(cāng)庫(kù),采用數(shù)據(jù)挖掘中的聚類(lèi)分析技術(shù)為解決圖書(shū)更新周期問(wèn)題和合理購(gòu)買(mǎi)新書(shū)的問(wèn)題提供了技術(shù)支持。本文主要應(yīng)用基于密度聚類(lèi)的分析方法。
基于密度的聚類(lèi)方法是以局部數(shù)據(jù)特征作為聚類(lèi)的判斷標(biāo)準(zhǔn),類(lèi)被看做是一個(gè)數(shù)據(jù)區(qū)域,在該區(qū)域內(nèi)對(duì)象是密集的,對(duì)象稀疏的區(qū)域?qū)⒏鱾€(gè)類(lèi)分隔開(kāi)來(lái)。多數(shù)基于密度的聚類(lèi)算法形成的聚類(lèi)形狀也可以是任意的,并且一個(gè)類(lèi)中對(duì)象的分布也是可以是任意的。這里主要介紹DBSCAN算法。
DBSCAN算法的主要思想是可以通過(guò)其要求的兩個(gè)輸入?yún)?shù):半徑r和對(duì)象最小數(shù)目MinPt來(lái)進(jìn)行描述,即一個(gè)對(duì)象在其半徑為r的鄰域內(nèi)包含至少NinPts個(gè)對(duì)象,那么在該區(qū)域內(nèi)的對(duì)象是密集的。DKSCAN算法中的類(lèi)被看做是一個(gè)個(gè)按一定的規(guī)則確定的最大密集區(qū)域,被稀疏區(qū)域分離開(kāi)來(lái)。沒(méi)有被包含在任何類(lèi)中,即存在于稀疏區(qū)域中的對(duì)象被認(rèn)為是噪聲。
采用DBSCAN算法的聚類(lèi)過(guò)程通過(guò)收集直接密度可達(dá)的對(duì)象來(lái)完成。針對(duì)聚類(lèi)對(duì)象集中的每一個(gè)對(duì)象p檢查其r鄰域內(nèi)是否至少包含MinPt個(gè)對(duì)象,也就是確定對(duì)象p是否為核心對(duì)象。如果p是核心對(duì)象,那么就創(chuàng)建一個(gè)初始類(lèi)C,C中包含對(duì)象p及從p直接密度可達(dá)的所有對(duì)象,也就是包含p及其鄰域r內(nèi)所有的對(duì)象。然后在確定該鄰域中的每一個(gè)對(duì)象q是否為核心對(duì)象。如果是核心對(duì)象,那么就將其r鄰域內(nèi)尚未包含在類(lèi)C中的所有對(duì)象追加到C中。并繼續(xù)確定這些新追加到c中的對(duì)象是否為核心對(duì)象,如果是,則繼續(xù)進(jìn)行上述對(duì)象追加過(guò)程。這一過(guò)程一直持續(xù)到?jīng)]有新的對(duì)象可以追加到C中為止。類(lèi)C也就完全確定下來(lái)了。DBSCAN算法的優(yōu)點(diǎn)是形成的聚類(lèi)形狀可以是任意的。并且不受異常值的影響。
通過(guò)數(shù)據(jù)挖掘技術(shù),我們可以分析出哪些圖書(shū)已經(jīng)利用價(jià)值不高;估算出每一種圖書(shū)大概的利用周期等。定期的對(duì)圖書(shū)館的圖書(shū)進(jìn)行更新,舊書(shū)入庫(kù),新書(shū)上架,使得圖書(shū)資源永遠(yuǎn)保持最高的利用率。在新書(shū)購(gòu)買(mǎi)問(wèn)題上,我們通過(guò)數(shù)據(jù)挖掘技術(shù)分析內(nèi)部的歷史采購(gòu)數(shù)據(jù),讀者數(shù)據(jù),數(shù)據(jù)流通,反饋信息等得出的信息,提煉出哪些書(shū)讀者最感興趣;哪些書(shū)是圖書(shū)館的主流;人們?cè)诓煌瑫r(shí)間都使用哪些書(shū)等,我們可以根據(jù)這些數(shù)據(jù)做出相應(yīng)決策。
3、基于云計(jì)算的圖書(shū)館數(shù)據(jù)挖掘平臺(tái)架構(gòu)
基于云計(jì)算的圖書(shū)館數(shù)據(jù)挖掘平臺(tái)架構(gòu)設(shè)計(jì)如圖5所示。自下往上每層都為上層提供服務(wù),模型數(shù)據(jù)層為云平臺(tái)提供相應(yīng)的應(yīng)用接口,應(yīng)用表現(xiàn)層提供用戶(hù)訪問(wèn)界面和開(kāi)放的應(yīng)用接口,可以向用戶(hù)提供共享平臺(tái)的數(shù)據(jù)集及相關(guān)算法,從而體現(xiàn)出圖書(shū)館云平臺(tái)的數(shù)據(jù)信息共享性和開(kāi)放性。
模型數(shù)據(jù)層是實(shí)現(xiàn)基于云圖書(shū)館數(shù)據(jù)挖掘平臺(tái)中的基本數(shù)據(jù)結(jié)構(gòu),把底層異構(gòu)數(shù)據(jù)庫(kù)中的異構(gòu)數(shù)據(jù)映射到圖書(shū)館平臺(tái)應(yīng)用表現(xiàn)層,調(diào)動(dòng)圖書(shū)館內(nèi)存儲(chǔ)的各種資源對(duì)象,包括資源文件、元信息數(shù)據(jù)、元數(shù)據(jù)目錄等等。應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)采集的評(píng)價(jià)數(shù)據(jù)進(jìn)行挖掘分析,發(fā)現(xiàn)隱藏在數(shù)據(jù)中有用的知識(shí),并將其提取出來(lái)供用戶(hù)借鑒。用戶(hù)可以根據(jù)系統(tǒng)挖掘出的規(guī)則,作出相應(yīng)的決策。根據(jù)系統(tǒng)已經(jīng)采集到的評(píng)價(jià)數(shù)據(jù),可以挖掘出自己需要的信息。
控制算法層是實(shí)現(xiàn)基于云圖書(shū)館數(shù)據(jù)挖掘平臺(tái)中的內(nèi)部數(shù)據(jù)處理,在模型數(shù)據(jù)層的對(duì)象層上建立圖書(shū)館平臺(tái)的內(nèi)部算法集,可分為多個(gè)模塊實(shí)現(xiàn),每個(gè)模塊完成一種功能。圖書(shū)館云服務(wù)平臺(tái)通過(guò)對(duì)數(shù)據(jù)庫(kù)的管理和部署,提供大規(guī)模原始數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和經(jīng)過(guò)處理的結(jié)構(gòu)化數(shù)據(jù),采取一定的挖掘規(guī)則(如關(guān)聯(lián)規(guī)則、聯(lián)機(jī)分析處理等),利用數(shù)據(jù)挖掘技術(shù)對(duì)這些經(jīng)過(guò)處理的數(shù)據(jù)進(jìn)行融合分析,有針對(duì)性地為用戶(hù)提供個(gè)性化服務(wù),這是數(shù)字圖書(shū)館的核心部分。個(gè)性化服務(wù)主要包括:發(fā)現(xiàn)新的相關(guān)信息或書(shū)目數(shù)據(jù)時(shí),及時(shí)告知用戶(hù);用戶(hù)訪問(wèn)時(shí),發(fā)現(xiàn)用戶(hù)的最新需要,提供相應(yīng)的預(yù)測(cè)報(bào)告、動(dòng)態(tài)分析等。圖書(shū)館控制算法層可判斷并爭(zhēng)取潛在用戶(hù),并將其轉(zhuǎn)化為當(dāng)前用戶(hù)等等。
應(yīng)用表現(xiàn)層是實(shí)現(xiàn)基于云圖書(shū)館數(shù)據(jù)挖掘平臺(tái)服務(wù)的方法,應(yīng)用表現(xiàn)層是對(duì)模型數(shù)據(jù)層和控制算法層的操作進(jìn)行抽象,利用“云圖書(shū)館”不同模塊的功能,對(duì)分布在不同地點(diǎn)的服務(wù)器聯(lián)接起來(lái),進(jìn)行統(tǒng)一調(diào)度管理,虛擬出一個(gè)統(tǒng)一的服務(wù)器系統(tǒng),同時(shí)可以不斷增加新的服務(wù)器和節(jié)點(diǎn),或刪除不必要的服務(wù)器和節(jié)點(diǎn),以實(shí)現(xiàn)較高的計(jì)算性能,滿足和保證不斷增長(zhǎng)的計(jì)算需要。
基于云計(jì)算的圖書(shū)館數(shù)據(jù)挖掘平臺(tái)將會(huì)為用戶(hù)帶來(lái)如下好處:
(1)用戶(hù)無(wú)需安裝任何軟、硬件,只需通過(guò)網(wǎng)絡(luò)配置接人系統(tǒng)網(wǎng)址,即可享受新技術(shù)帶來(lái)的便利。
(2)基于云計(jì)算體系,服務(wù)器集群可提供高可靠性,為用戶(hù)提供持續(xù)服務(wù)。
(3)可以有效地對(duì)服務(wù)器上的服務(wù)進(jìn)行有效監(jiān)控,第一時(shí)間發(fā)現(xiàn)問(wèn)題。通過(guò)挖掘異常數(shù)據(jù),進(jìn)行有效報(bào)警。
(4)云圖書(shū)館能將不同地域的數(shù)據(jù)、信息資源集成在一起,避免了資源重復(fù),同時(shí)形成資源互補(bǔ),有利于實(shí)現(xiàn)數(shù)字圖書(shū)館的數(shù)據(jù)信息資源共享。
4、數(shù)據(jù)挖掘技術(shù)應(yīng)用于“云”圖書(shū)館的未來(lái)展望
根據(jù)以上分析,我們可以發(fā)現(xiàn),應(yīng)用數(shù)據(jù)挖掘技術(shù)為圖書(shū)館的數(shù)字資源組織和管理、服務(wù)質(zhì)量提升和方式拓展等方面提供了技術(shù)支持?,F(xiàn)在,圖書(shū)館還處于云計(jì)算應(yīng)用的初級(jí)階段,云計(jì)算作為一種新的能體現(xiàn)互聯(lián)網(wǎng)精神的計(jì)算模式,未來(lái)必將會(huì)產(chǎn)生強(qiáng)大的生命力,最大限度地發(fā)揮圖書(shū)館的作用。