發(fā)布時間:2022-05-05 14:41:45
序言:寫作是分享個人見解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了8篇的大數(shù)據(jù)技術(shù)論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發(fā),請盡情閱讀。
PDA也可以稱為個人數(shù)字化助理,簡稱為掌上行機,它的優(yōu)點是形狀很小,攜帶很方便,可以把它放在手上或者口袋。很便于輸入數(shù)據(jù),操作結(jié)構(gòu)很簡單,使用起來很方便,可使用手接觸或者筆輸入信息,耗費功能很低,電池能使用的時間很長,通信里很強,可以使用藍(lán)牙、紅外接受發(fā)送信息,價格實惠。現(xiàn)在很多PDA使用windowsCE來進行操作,用來開發(fā)windowsCE系統(tǒng)功能,就像是在計算機的桌面進行開發(fā)軟件程序一樣,構(gòu)建一個比較有相對性的移動設(shè)備。
2分析PDA和全站儀中的數(shù)據(jù)
2.1串口技術(shù)
使用Wicrosoftwindows開發(fā)串口系統(tǒng),進行有以下方式:a.使用windows來進行通信函數(shù).b.windowsAPI對端口進行讀寫或者開發(fā)其它程序,對串口實行操作步驟。C.串口中的組件通信,比如Activek控制MSCcomm。根據(jù)以上介紹的幾種方法,比如b需要熟悉電路結(jié)構(gòu),驅(qū)動層次比較深,需要有比較強的專業(yè)技能,如C方式簡便,不能使EmbeddedVisualC++所接受,該程序就是應(yīng)用windowsAP來進行通信函數(shù)。
2.2串口施行步驟
windows的讀寫文件方式不一樣,它主要使用windows結(jié)構(gòu)中的多線程,然后再后臺進行串口讀寫,正常使用程序就要在前臺進行。進行改善1/0的速度,使用windows結(jié)構(gòu)中的多線程,可以使用它來進行開發(fā)非單一系統(tǒng),windows不能操作1/0的異常操作,可以使用它來進行操作串口,使用異步的方法,可以提高系統(tǒng)的操作能力。工作效能比較高的串口是事件驅(qū)動。應(yīng)用這種方法有比較高的時實性,主要是針對一些比較廣泛的串口,跟查詢的方式不一樣,不是只對那個串口進行查詢。是以中斷的形式來進行,一般運行中斷時,確定的事件發(fā)生變化時,windows系統(tǒng)就會發(fā)出信息,才能有針對性的進行處理,確保數(shù)據(jù)存在。
3開發(fā)通信程序
3.1串口通信應(yīng)用API函數(shù)
⑴串口進行打開關(guān)閉。在應(yīng)用程序中用Create-File函數(shù)把串口打開,注意事項主要有:A.串口名后面需要加個冒號(:)。B.PDA的串口就是全部已經(jīng)打開的串口,只含COM1。C.應(yīng)用的參數(shù)定為零,安全沒有危險性的參數(shù)定為NULL。應(yīng)用Close-Handle可以把串口關(guān)閉。⑵對串口進行配置。串口配置與PDA通信中的參數(shù)進行配置一起,這樣才能達(dá)到通信的效能,因此配置也是比較重要的一個步驟。LPDCB主要是針對DCB結(jié)構(gòu),DCB結(jié)構(gòu)是對串口的進一步描述,串口的波特率主要是由DCB中的BaudRate來確定,原因是CE對非二進制不能進行輸送,所以fBinary要設(shè)定為TRUE,ByteSize是指字節(jié)在進行發(fā)送時接受到的數(shù)據(jù)。Parity是奇偶校驗,StopBits是停止位數(shù),⑶對串口進行讀寫。串口進行讀寫時可以使用ReadFile和WriteFile函數(shù)實現(xiàn),主要是串口進行讀寫時速度不是很快,⑷對串口進行異步讀寫,CE不能進行操作輸入輸出的功能,因此只能應(yīng)用讀寫進行重復(fù)操作。第一,設(shè)定串口EV_RXCHAR要用SetCommMask函數(shù)來實現(xiàn),應(yīng)用WaitCom-mEvent阻攔線程,指直到把事件EV_RX-CHAR設(shè)定好,字符要應(yīng)用回調(diào)函數(shù)來進行處理,續(xù)等發(fā)生事件。
3.2隔開水平角、豎直角、距離及進行組合測量
在測量過后,需要測出水平角,偏心的水平角與距離不能合在一起測量,測量時要分開進行,因此應(yīng)用程序能進行水平角和豎直角及距離分開測量以及組合測量,進行測角時不能僅僅依靠棱鏡。所以,可以應(yīng)用水平角和、豎直角、距離重復(fù)選框來進行模擬。針對不一樣規(guī)模的全站儀,使用的方式也不一樣,索佳操作的模式只含有一種規(guī)模的全站儀,只需要點擊按鈕即可,假如選擇斜距就進行輸送測角距,沒有選中斜距進行輸送測角距,收到的數(shù)據(jù)后。在根據(jù)模塊來分析與選取有針對性的數(shù)據(jù),拓?fù)淇凳堑诙N模式,在選中斜距時,還要在斜距中的復(fù)選框中進行點擊,在進行輸送時改變測量距離的模式,進行發(fā)送時。進行驅(qū)動測量,跟讀取指令是一樣的。
3.3處理已經(jīng)接收到的字符串
⑴ASCII編碼是已經(jīng)收到的字符串,可以使用MultiByteToWideChar函數(shù)轉(zhuǎn)變成Unicode編碼然,在進行處理。⑵測量指令在進行發(fā)送出去后,全站儀中的數(shù)據(jù)不是一次性發(fā)完,應(yīng)該是分層次來進行發(fā)送,因此,字符串要直接連接到字符串,才能完成接受任務(wù)。⑶字符串的主要任務(wù)就是接收完后,要依據(jù)復(fù)合框進行有效的選擇,分析全站儀的字符串,也會顯示的很清楚。⑷拓?fù)淇凳堑诙N模式,符串后的任務(wù)就是接受,在輸送時顯示清楚。相反,就會把全站儀輸送數(shù)據(jù)全部給PDA,造成不良后果。
4應(yīng)用在實際生活中
VC++2005smartdevice的MFCsmartdeviceApplication,PDA與全站儀中的通信主要依靠多線程來完成,使他們能夠穩(wěn)定運行。根據(jù)太原市在進行測繪進行探索指出,外業(yè)進行采集時,效果是良好的。全站儀中的數(shù)據(jù)直接讀取,防止在讀、記方面存在有誤差。不過,對存在有誤差的數(shù)據(jù)要自動檢查,防止2C差、差互差、2C互差的影響產(chǎn)生誤差,而不能及時的進行檢查,而導(dǎo)致返工現(xiàn)象的發(fā)生,工作效率的提高,PDA儲存的文件就是測量的結(jié)果,外業(yè)任務(wù)完成之后把所得出的結(jié)果直接輸入到PC,經(jīng)過對程序的進一步分析,能直接評估精準(zhǔn)度及計算坐標(biāo),不使用人工來進行操作,從一定程度上減少了工作人員的工作量,也能減少造成不要的麻煩,有效的提高工作效率。
5結(jié)束語
(一)大數(shù)據(jù)增值價值巨大,商業(yè)價值、經(jīng)濟價值和社會價值不可估量,終極價值在于助力社會進步與升級。美國奧巴馬政府將數(shù)據(jù)定義為“未來的新石油”,是對其價值最生動的再現(xiàn)。大數(shù)據(jù)雖然價值密度低,但通過對數(shù)據(jù)的處理、整合和分析并使用,可創(chuàng)造出巨大的商業(yè)價值、經(jīng)濟價值和社會價值。面向大數(shù)據(jù)市場的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)已不斷涌現(xiàn),大數(shù)據(jù)成為經(jīng)濟高速增長的新引擎,正在“吞噬”和重構(gòu)傳統(tǒng)組織架構(gòu),必將引發(fā)政府、公共事業(yè)、制造業(yè)、流通等領(lǐng)域全方位變革。特別是人機“生命共同體”快速進化,大數(shù)據(jù)將為人類的生活創(chuàng)造前所未有的可量化的維度,成為當(dāng)代文明建設(shè)的助力器,讓社會得以革新與升級,最終改變未來。
(二)大數(shù)據(jù)橫空出世,源于個人全球化、記憶數(shù)字化、社會網(wǎng)絡(luò)資本化的全力驅(qū)動,是IT業(yè)發(fā)展演進的歷史使然。大數(shù)據(jù)不是突然產(chǎn)生的,是IT技術(shù)發(fā)展的必然產(chǎn)物。大數(shù)據(jù)浪潮主要源于三大驅(qū)動力推動。一是互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)及物聯(lián)網(wǎng)等新一代信息技術(shù),實現(xiàn)了信息、知識和社會關(guān)系網(wǎng)絡(luò)乃至“個人”全球化,為大數(shù)據(jù)提供了廣泛的數(shù)據(jù)來源。二是數(shù)據(jù)開放運動和數(shù)據(jù)民主化,實現(xiàn)了數(shù)據(jù)的分布式共享和全球性覆蓋,云計算等廉價、高效的存儲提取方式,讓數(shù)據(jù)成為“共享的社會記憶”,客觀上開啟了大數(shù)據(jù)時代大門。三是挖掘復(fù)雜社會網(wǎng)絡(luò)資本價值,加速了大數(shù)據(jù)技術(shù)的深度應(yīng)用,構(gòu)成了大數(shù)據(jù)的經(jīng)濟驅(qū)動力。全球化、數(shù)字化和社會網(wǎng)絡(luò)資本化齊力推動了大數(shù)據(jù)大發(fā)展。
二、大數(shù)據(jù):國家審計改革發(fā)展新動力
正在發(fā)生和演變的趨勢表明,大數(shù)據(jù)時代無論對于社會、組織還是個人,都是一次革命,一個巨大的挑戰(zhàn),一個重大的轉(zhuǎn)型機遇和飛躍的契機。國家審計無疑也是如此。1.飛速發(fā)展的經(jīng)濟社會新實踐,必將推進國家審計理論與時創(chuàng)新。當(dāng)前,人工智能、社交網(wǎng)站、RFID、語義網(wǎng)、云計算等技術(shù)或理念風(fēng)馳電掣一般闖入我們的工作生活,數(shù)據(jù)開放、軟件開源、普適計算、智慧地球等新思想令人眼花繚亂,新的技術(shù)和觀念層出不窮。在信息技術(shù)環(huán)境下,豐富多彩的經(jīng)濟社會實踐,通過信息交換、權(quán)能傳遞和功效聯(lián)動等方式,將先進的信息技術(shù)、網(wǎng)絡(luò)技術(shù)、網(wǎng)絡(luò)時空觀、數(shù)據(jù)挖掘、系統(tǒng)集成以及多媒體等多種學(xué)科理論和技術(shù)思想深層次地植根于審計理論,刺激審計理論的變革和創(chuàng)新。同時,國外一些先進管理理念,如企業(yè)再造工程、虛擬組織、穆爾法則(Mooreslaw)、基爾德法則(Gilderslaw)和麥特卡夫法則(Metcalfeslaw)等,與傳統(tǒng)審計理論進行分化、碰撞、對接與融合,必將從廣度和深度上推進審計理論不斷繁衍與創(chuàng)新,審計理論將呈現(xiàn)多樣性、交融性和虛擬性。2.審計客體內(nèi)涵和外延的擴張,必將呼喚國家審計權(quán)力邊界順勢突圍。近年來,經(jīng)濟社會實踐活動中,計算機、數(shù)據(jù)庫、網(wǎng)絡(luò)等現(xiàn)代信息技術(shù)得到了廣泛運用,實物流、資金流表現(xiàn)向無紙化、數(shù)字化和信息流的轉(zhuǎn)變,業(yè)務(wù)處理和財務(wù)管理逐步實現(xiàn)自動化和網(wǎng)絡(luò)化,國家審計的審計內(nèi)容、審計對象、審計資料、審計證據(jù)線索等都呈現(xiàn)出普遍電子化、數(shù)字化的特點。從而擺脫了傳統(tǒng)帳套、傳統(tǒng)財務(wù)信息、紙質(zhì)的業(yè)務(wù)軌跡,從被審計單位的財務(wù)收支及有關(guān)的經(jīng)營管理活動,會計資料和其他相關(guān)資料,擴展到電子數(shù)據(jù)、系統(tǒng)內(nèi)部控制和信息系統(tǒng)自身;從財務(wù)數(shù)據(jù)延伸到業(yè)務(wù)數(shù)據(jù);從內(nèi)部數(shù)據(jù)關(guān)聯(lián)到外部數(shù)據(jù),審計客體外延和內(nèi)涵的擴張,突破了以財政財務(wù)收支、紙質(zhì)載體為主的審計權(quán)限范圍。必然要求法律賦予審計部門數(shù)據(jù)采集、技術(shù)偵查、行政強制、訴訟等更多權(quán)力,以應(yīng)對大數(shù)據(jù)時代的高科技舞弊,確保審計職能的充分發(fā)揮。3.新型大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,必將推動國家審計作業(yè)流程優(yōu)化再造。聯(lián)機分析、數(shù)據(jù)挖掘、WEB2.0互聯(lián)網(wǎng)審計、云技術(shù)等大數(shù)據(jù)技術(shù)普遍運用,將所有的審計內(nèi)容、審計技術(shù)、審計方法納入大數(shù)據(jù)審計之中。傳統(tǒng)的現(xiàn)場審計作業(yè)流程必將改造優(yōu)化為:了解調(diào)查,獲取信息;采集數(shù)據(jù),整理數(shù)據(jù);進行數(shù)據(jù)轉(zhuǎn)換、清理和驗證;創(chuàng)建審計中間表;進行數(shù)據(jù)分析,找出審計重點;構(gòu)建審計分析模型,分析數(shù)據(jù);延伸落實,審計取證。數(shù)據(jù)分析成為審計作業(yè)的核心。信息技術(shù)還可以優(yōu)化審計項目管理,如利用信息技術(shù)為審計項目管理內(nèi)置一個標(biāo)準(zhǔn)的、符合質(zhì)量要求的審計作業(yè)流程,用以規(guī)范審計人員的審計作業(yè)行為,使不同背景、不同水平的審計人員能夠執(zhí)行相同的審計動作。通過虛擬組織形態(tài)和數(shù)據(jù)集成智能化管理,實行遠(yuǎn)程控制審計項目,包括審計方案的控制、分工控制和授權(quán)控制,為質(zhì)量控制和風(fēng)險預(yù)防搭建一個良好的、高效的管控平臺。4.國家審計供需矛盾更為激烈,必將要求國家審計主體能力自我革命。審計作為綜合性經(jīng)濟監(jiān)督部門,覆蓋領(lǐng)域之廣,涉及的經(jīng)濟社會活動之多,所產(chǎn)生和集聚的數(shù)據(jù)規(guī)模不可謂不大。大數(shù)據(jù)價值的發(fā)現(xiàn)和挖掘,必定給審計創(chuàng)造了更多需求,打開了更廣闊的市場,對審計供給能力提出了新挑戰(zhàn)。而決定審計供給能力的關(guān)隘就是國家審計主體能力。大數(shù)據(jù)時代,IT審計師將主導(dǎo)國家審計舞臺。而目前,大部分審計人員主要精通財會知識,計算機知識和技能比較欠缺,知識結(jié)構(gòu)還不能滿足大數(shù)據(jù)技術(shù)的要求,數(shù)據(jù)分析與管理高端人才緊缺。審計人員除了要有專業(yè)的審計、會計知識外,必須精通信息技術(shù),掌握網(wǎng)絡(luò)、數(shù)據(jù)庫、電子商務(wù)、信息系統(tǒng)的開發(fā)與管理和計算機輔助審計技術(shù)。優(yōu)化審計人員能力結(jié)構(gòu),增強審計干部信息化審計基礎(chǔ)能力、數(shù)據(jù)采集處理和分析能力、監(jiān)測指標(biāo)和模型的構(gòu)建和分析能力、信息系統(tǒng)內(nèi)部控制測評能力,尤為緊迫。
三、大數(shù)據(jù)背景下國家審計發(fā)展路徑
無論是組織結(jié)構(gòu),還是國家文明,只有充分發(fā)揮大數(shù)據(jù)時代的價值、迎接好大數(shù)據(jù)面臨的挑戰(zhàn)并積極應(yīng)對,才會處于不敗之地。因此,國家審計應(yīng)放眼未來,以大數(shù)據(jù)審計為目標(biāo),加快改革創(chuàng)新步伐,搶占審計發(fā)展的突破點和制高點,迎接新時代挑戰(zhàn)。
(一)加快理論創(chuàng)新,為大數(shù)據(jù)審計落地提供實踐指南。要堅持實踐上的“摸著石頭過河”與理論上的“頂層設(shè)計”相結(jié)合,加強審計理論和實務(wù)的研究,在理論上對大數(shù)據(jù)審計的性質(zhì)以及由此決定的審計職能與任務(wù)等基本問題進行深入研究,構(gòu)筑起適應(yīng)大數(shù)據(jù)時展的、可用于解釋和預(yù)測多種審計現(xiàn)象的審計理論。加強與國家信息化咨詢委員會、公安部、發(fā)改委、工信部、財政部和國家信息中心等相關(guān)部門的合作研討,多角度、更準(zhǔn)確地把握客觀現(xiàn)實及政策約束;組建由學(xué)術(shù)界專家、審計研究人員和實務(wù)骨干組成的團隊,承擔(dān)把握前沿?zé)狳c、規(guī)劃審計思路等工作,為加快大數(shù)據(jù)審計實踐提供操作指南。要制定大數(shù)據(jù)審計發(fā)展的長遠(yuǎn)規(guī)劃,堅持把大數(shù)據(jù)審計作為國家審計發(fā)展的核心戰(zhàn)略,從數(shù)據(jù)、制度、人才和技術(shù)等方面逐步積累基礎(chǔ)資源,有計劃、有步驟、長期不懈地堅持推進。要加大宣傳,營造數(shù)據(jù)審計文化氛圍,革新思想觀念,樹立正確數(shù)據(jù)觀,建立基于全數(shù)據(jù)模式、從整體到局部的審計思維模式,用大數(shù)據(jù)時代精神武裝頭腦。
(二)加快制度創(chuàng)新,健全完善大數(shù)據(jù)審計相關(guān)法規(guī)建設(shè)。目前,我國電子商務(wù)、網(wǎng)絡(luò)經(jīng)濟和計算機應(yīng)用相關(guān)法律法規(guī)制定相對滯后于經(jīng)濟社會實踐活動,有些甚至還是盲區(qū),導(dǎo)致大數(shù)據(jù)審計的法律地位和權(quán)限虛置。要加強電子商務(wù)、網(wǎng)絡(luò)經(jīng)濟等相關(guān)立法,把電子合同、電子憑證、電子證據(jù)、電子簽名的法律效力和保管要求,數(shù)據(jù)認(rèn)證機構(gòu)的管理,電子信息與網(wǎng)絡(luò)安全等相關(guān)問題,以法律法規(guī)的形式明確固化下來,為大數(shù)據(jù)審計提供法律依據(jù)。要強化審計權(quán)威,擴大審計權(quán)限,賦予審計審查審計對象計算機信息系統(tǒng)的功能與安全措施,利用網(wǎng)絡(luò)和審計軟件進行審計,接入、采集、存儲、提煉審計對象所有數(shù)據(jù)等的權(quán)力。要堅持本土自創(chuàng)與模仿移植相結(jié)合,建立健全與大數(shù)據(jù)時代相適應(yīng)的審計標(biāo)準(zhǔn)和準(zhǔn)則,如制定大數(shù)據(jù)審計評價準(zhǔn)則、技術(shù)標(biāo)準(zhǔn),數(shù)據(jù)挖掘分析指南,信息系統(tǒng)輸入—處理—輸出的符合性和實質(zhì)性測試的準(zhǔn)則,云計算以及網(wǎng)絡(luò)審計準(zhǔn)則等,確保大數(shù)據(jù)審計有法可依、有章可循。
(三)加快機制創(chuàng)新,積極構(gòu)造政府主導(dǎo)、審計主推、IT企業(yè)參與的大數(shù)據(jù)審計聯(lián)動機制。大數(shù)據(jù)技術(shù)在國家審計領(lǐng)域中的推廣應(yīng)用是技術(shù)進步的必然要求,但根據(jù)國家審計行業(yè)自身的特點,其無法自發(fā)地獨自實現(xiàn),必須積極構(gòu)造政府主導(dǎo)、審計主推、IT企業(yè)參與的多點支撐聯(lián)動機制,形成聚合效應(yīng)。對政府而言,要積極把握大數(shù)據(jù)戰(zhàn)略機遇,制定積極的政策法規(guī),提供高質(zhì)量的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,營造適度寬松的大數(shù)據(jù)發(fā)展環(huán)境,鼓勵企業(yè)、審計部門進行大數(shù)據(jù)相關(guān)的技術(shù)研發(fā)與應(yīng)用創(chuàng)新,從標(biāo)準(zhǔn)、法律和意識形態(tài)層面大力引導(dǎo)大數(shù)據(jù)審計發(fā)展。對審計部門而言,要制定戰(zhàn)略數(shù)據(jù)儲備計劃,加快與被審計單位數(shù)據(jù)實時互聯(lián)互通,消除“信息孤島”,為大數(shù)據(jù)審計提供數(shù)據(jù)載體;要逐步建立完善中央和地方的審計數(shù)據(jù)中心,構(gòu)建審計管理、審計業(yè)務(wù)、審計方法和評價信息資源庫,加快推進國家電子審計信息資源目錄體系和交換體系建設(shè),實現(xiàn)數(shù)據(jù)大集中。對IT企業(yè)而言,要深刻洞察大數(shù)據(jù)審計的需求,提供從硬件到軟件、從產(chǎn)品到服務(wù)的一體化解決方案;要專注細(xì)分領(lǐng)域創(chuàng)新,提供具有審計行業(yè)特色的大數(shù)據(jù)審計專家級方案。
(四)加快應(yīng)用創(chuàng)新,不斷研究、探索、實踐大數(shù)據(jù)審計技術(shù)方法??梢灶A(yù)見,大數(shù)據(jù)時代,審計人員時時刻刻都需要利用信息技術(shù)手段處理各種審計業(yè)務(wù)和工作。要結(jié)合審計工作實際,認(rèn)真研究并積極實踐A/B測試、關(guān)聯(lián)規(guī)則挖掘、分類、數(shù)據(jù)聚類、眾包、數(shù)據(jù)融合和集成、數(shù)據(jù)挖掘、集成學(xué)習(xí)等大數(shù)據(jù)分析技術(shù),BigTable、商業(yè)智能、云計算、Cassandra、數(shù)據(jù)倉庫、數(shù)據(jù)集市、分布式系統(tǒng)等大數(shù)據(jù)處理技術(shù),以及標(biāo)簽云、Clustergram、歷史流、空間信息流等可視化技術(shù)。要深度分析挖掘?qū)徲嫴块T的大數(shù)據(jù)價值,從“業(yè)務(wù)驅(qū)動”轉(zhuǎn)向“數(shù)據(jù)驅(qū)動”,實現(xiàn)審計決策和管理智能化。通過云計算的IaaS、PaaS和SaaS三大服務(wù)模式,建立國家層面的跨行業(yè)、跨領(lǐng)域的審計私有云和審計大數(shù)據(jù)分析平臺。要建立審計專家和信息技術(shù)專家合作的審計信息技術(shù)研發(fā)模式,加強審計大數(shù)據(jù)分析模型和軟件的研究開發(fā)。建立審計信息技術(shù)評選機制,對優(yōu)秀的審計技術(shù)創(chuàng)新進行表彰獎勵。建立審計信息技術(shù)庫,把現(xiàn)有審計信息技術(shù)分類整理錄入,實現(xiàn)網(wǎng)上查詢、培訓(xùn)和新技術(shù)添加功能,加快大數(shù)據(jù)審計技術(shù)的推廣和應(yīng)用。
一.大數(shù)據(jù)風(fēng)控發(fā)展迅速,但有效性不佳
在應(yīng)用層面,金融行業(yè)利用大數(shù)據(jù)進行風(fēng)控已經(jīng)取得了一定的成效。使用大數(shù)據(jù)進行風(fēng)控已成為美國等發(fā)達(dá)國家互聯(lián)網(wǎng)金融企業(yè)的標(biāo)準(zhǔn)配置。
美國Zest Finance公司開發(fā)的10個基于學(xué)習(xí)機器的分析模型,對每位信貸申請人的超過1萬條原始信息數(shù)據(jù)進行分析,并得出超過7萬個可對其行為做出測量的指標(biāo),而這一過程在5秒鐘內(nèi)就能全部完成。
為網(wǎng)上商家提供金融信貸服務(wù)的公司Kabbage主要目標(biāo)客戶是ebay、Amazon、PayPal等電商,其通過獲取這些企業(yè)網(wǎng)店店主的銷售、信用記錄、顧客流量、評論、商品價格和存貨等信息,以及他們在Facebook和Twitter上與客戶的互動信息,借助數(shù)據(jù)挖掘技術(shù),把這些店主分成不同的風(fēng)險等級,以此來確定提供貸款金額數(shù)量與貸款利率水平。
中國互聯(lián)網(wǎng)金融企業(yè)對于大數(shù)據(jù)風(fēng)控的運用也如火如荼。
阿里推出了面向社會的信用服務(wù)體系芝麻信用,芝麻信用通過分析大量的網(wǎng)絡(luò)交易及行為數(shù)據(jù),對用戶進行信用評估,這些信用評估可以幫助互聯(lián)網(wǎng)金融企業(yè)對用戶的還款意愿及還款能力做出結(jié)論,繼而為用戶提供相關(guān)的金融和經(jīng)濟服務(wù)。
騰訊的微眾銀行推出的“微粒貸”產(chǎn)品,其風(fēng)控核心就是,通過社交大數(shù)據(jù)與央行征信等傳統(tǒng)銀行信用數(shù)據(jù)結(jié)合,運用社交圈、行為特征、交易、基本社會特征、人行征信5個維度對客戶綜合評級,運用大量的指標(biāo)構(gòu)建多重模型,以快速識別客戶的信用風(fēng)險。
對于大數(shù)據(jù)風(fēng)控的理論研究尚處于萌芽階段,本文以“大數(shù)據(jù)風(fēng)控”為主題在CNKI數(shù)據(jù)庫進行搜索,與此相關(guān)的文獻(xiàn)數(shù)量可以從側(cè)面反映大數(shù)據(jù)風(fēng)控的理論研究現(xiàn)狀。
CNKI數(shù)據(jù)庫中以“大數(shù)據(jù)風(fēng)控”為主題的文獻(xiàn)共46篇。在這些文獻(xiàn)中,以報道性的文章較多,重要報紙全文庫和特色期刊總共為33篇,占比72%;而理論研究的文章較少,中國學(xué)術(shù)期刊總庫為12篇,占比26%;尚沒有CSSCI2014—2015年的來源期刊(如圖1)。
圖1 CNKI數(shù)據(jù)庫與大數(shù)據(jù)相關(guān)的文獻(xiàn)數(shù)量和分類
雖然大數(shù)據(jù)風(fēng)控在實踐上已經(jīng)有所進展,但是其有效性也受到一些挑戰(zhàn)。
例如,以大數(shù)據(jù)風(fēng)控為基石的P2P平臺就頻頻暴露出各種各樣的問題來。對于P2P平臺來說,由于其純線上操作的特點,大數(shù)據(jù)風(fēng)控的有效性是決定其經(jīng)營狀況的重要因素,如果大數(shù)據(jù)風(fēng)控有效性較差,則面臨的壞賬壓力較大,容易出現(xiàn)提現(xiàn)困難甚至跑路的問題。
網(wǎng)貸之家的數(shù)據(jù)顯示,2015年上半年新增問題平臺419家,是2014年同期的7.5倍,已超過2014年全年問題平臺數(shù)量。截至2015年10月底,全國問題平臺數(shù)累積已達(dá)1115家。
二.當(dāng)前大數(shù)據(jù)風(fēng)控有效性不足的原因分析
一些學(xué)者對于大數(shù)據(jù)風(fēng)控的有效性問題進行了研究。
王強(2015)指出當(dāng)前個人大數(shù)據(jù)征信的問題,一是數(shù)據(jù)的真實性,二是數(shù)據(jù)收集的法律障礙,三是壞賬的不可預(yù)測性問題。
甚至有作者認(rèn)為大數(shù)據(jù)風(fēng)控是無效的,陳宇(2015)援引各種證據(jù)認(rèn)為大數(shù)據(jù)風(fēng)控是無效的。
總體而言,當(dāng)前大數(shù)據(jù)風(fēng)控有效性欠佳的原因主要有以下幾個方面:
(一)數(shù)據(jù)的質(zhì)量問題
當(dāng)前大數(shù)據(jù)風(fēng)控的有效性欠佳,其首要原因就是數(shù)據(jù)的真實性不高,包括社交數(shù)據(jù)和交易數(shù)據(jù)兩個方面。
1.社交數(shù)據(jù)的真實性問題
美國lending club和facebook合作獲取社交數(shù)據(jù),在中國宜信也曾大費周折的收集借款人的社交數(shù)據(jù),最后兩者得出的結(jié)論都是社交數(shù)據(jù)根本就不能用。美國很多大數(shù)據(jù)征信公司的信息錯誤率高達(dá)50%,垃圾進、垃圾出。
2.交易數(shù)據(jù)的真實性問題。
當(dāng)前許多電商平臺的刷單現(xiàn)象非常嚴(yán)重,這將導(dǎo)致交易數(shù)據(jù)的嚴(yán)重失真。隨著網(wǎng)購的火爆,有關(guān)電商平臺“刷單”的報道屢見報端。
電商“刷單”有兩種方式,一種是商家找所謂的消費者進行“刷單”。賣家買快遞單號,其收件人和寄件人與實際的買家、賣家不一致。
另一種是快遞公司發(fā)空包,但快遞公司并未完成配送,而幫助商家完成平臺上的物流信息。
(二)大數(shù)據(jù)風(fēng)控的理論有效性問題
從IT技術(shù)層面論證大數(shù)據(jù)風(fēng)控的實踐性案例已經(jīng)很多,但是在經(jīng)濟金融的理論層面,大數(shù)據(jù)風(fēng)控還面臨一些問題需要解決。
1.金融信用與社會信用的相關(guān)性不確定
目前大數(shù)據(jù)主要來源于互聯(lián)網(wǎng),而人們在網(wǎng)絡(luò)中的表現(xiàn)并不能完全反映其真實的一面。相同的人群在不同場合呈現(xiàn)的特征是不一樣的,尤其是目前人們在線上、線下割裂的狀態(tài),其行為方式往往會出現(xiàn)強烈的反差。
例如有些人不善交際,卻將自己做的美食展示在微博上,吸引大量關(guān)注,粉絲暴增。因此網(wǎng)絡(luò)并不能確切地證明某人的社交圈子,也就是說互聯(lián)網(wǎng)的數(shù)據(jù)很難還原用戶現(xiàn)實中的信息。
2.大數(shù)據(jù)對于“黑天鵝”事件的滯后性
在現(xiàn)實世界,總會出現(xiàn)不可預(yù)測的“黑天鵝”事件,一旦出現(xiàn)則有可能沖擊大數(shù)據(jù)風(fēng)控模型的基本假設(shè),進而影響大數(shù)據(jù)風(fēng)控的有效性。大到美國的次貸危機,小到個人意外事件的發(fā)生,在某種程度上大數(shù)據(jù)風(fēng)控是無法預(yù)測的,但這些事件的發(fā)生,對宏觀經(jīng)濟和微觀主體都會產(chǎn)生重大的影響。
例如,2008年美國次貸危機后產(chǎn)生了一種“策略性違約”行為——貸款主體本身有能力還款,但是其在房價遠(yuǎn)低于貸款總額的時候,重新購買一套房子,并對之前的房貸斷供,貸款者可以此方法進行“套利”。
雖然此類違約者會因此有不良信用記錄,但是這對信用報告的影響有限,因為其他的債務(wù)按期償還。而大數(shù)據(jù)對這種突變事件的預(yù)測能力則非常有限。
(三)大數(shù)據(jù)收集和使用的制度問題
在數(shù)據(jù)收集和使用的過程中也面臨著合法使用的問題。如何高效、適度地開發(fā)和使用大數(shù)據(jù),不僅僅是一個技術(shù)問題,也是一個社會問題,這些泄露的數(shù)據(jù)大量流入數(shù)據(jù)黑市,造成了用戶安全、企業(yè)安全甚至國家安全方面的連鎖反應(yīng)。數(shù)據(jù)的收集和使用在很多時候都沒有征得數(shù)據(jù)生產(chǎn)主體的同意,這導(dǎo)致了數(shù)據(jù)的濫用和隱私的泄露。
近年來,個人數(shù)據(jù)泄露事件頻頻發(fā)生,因個人數(shù)據(jù)泄露而造成損失的新聞屢見報端。獵豹移動安全實驗室的《2015年上半年移動安全報告》顯示,截至2015年上半年,獵豹共監(jiān)測到496起數(shù)據(jù)泄露事件,影響超過544萬人。2015年10月19日,烏云網(wǎng)消息稱,網(wǎng)易的用戶數(shù)據(jù)庫疑似泄露。
圖2 2005-2014年國內(nèi)外數(shù)據(jù)泄密情況
資料來源:上海漢均信息技術(shù)有限公司《2005—2014年全球泄密事件分析報告》
數(shù)據(jù)安全問題也將越來越多的企業(yè)推向風(fēng)口浪尖。
上海漢均信息技術(shù)有限公司的《2005—2014年全球泄密事件分析報告》顯示,10年間,全球泄密事件中,我國泄密事件數(shù)量占比為58.5%,其中高頻發(fā)地域主要是東部沿海經(jīng)濟較發(fā)達(dá)、產(chǎn)業(yè)格局以高技術(shù)含量為主的一二線城市(如圖2)。
Verizon《2015年數(shù)據(jù)泄露調(diào)查報告》,報告覆蓋95個國家,其中有61個報告了問題,涉及79790個安全事件(Security Incident),超過2000個(2122個)確認(rèn)數(shù)據(jù)泄露(Data Breach)。
三.提高大數(shù)據(jù)風(fēng)控有效性的路徑
盡管大數(shù)據(jù)風(fēng)控的有效運用尚處在諸多障礙,但這并不能成為大數(shù)據(jù)風(fēng)控?zé)o效的理由。因為對于數(shù)據(jù)這個資源的挖掘尚處于初級階段,在消除障礙、解決問題中前行,是大數(shù)據(jù)風(fēng)控發(fā)展的必然趨勢。有效掃除當(dāng)前大數(shù)據(jù)風(fēng)控的障礙需要各方面的共同努力,其中金融企業(yè)、金融研究部門和政府監(jiān)管部門的角色尤為重要。
對于金融企業(yè)而言,要從基礎(chǔ)數(shù)據(jù)上保證客戶數(shù)據(jù)的多樣化、連續(xù)性和實時性,確保數(shù)據(jù)真實可靠。
對于金融研究者而言,可從經(jīng)濟學(xué)、數(shù)學(xué)等多個角度綜合論證大數(shù)據(jù)風(fēng)控的有效性,為大數(shù)據(jù)風(fēng)控提供理論支持。
對于政府監(jiān)管部門而言,需要從法律制度、會計制度等方面進行建設(shè),構(gòu)建數(shù)據(jù)合理運用的良好環(huán)境體系。
(一)對于金融企業(yè)而言,要構(gòu)建多樣化、連續(xù)性和實時性的基礎(chǔ)數(shù)據(jù)
1.多維度的收集數(shù)據(jù),互聯(lián)互通,打破數(shù)據(jù)的孤島
美國征信系統(tǒng)的完善是因為美國政府對其擁有的大數(shù)據(jù)資源的開放程度日益透明化。
目前我國的大數(shù)據(jù)風(fēng)控系統(tǒng)還沒有實現(xiàn)互通互聯(lián),阿里、銀聯(lián)、平安、騰訊以及眾多的P2P公司,都是各自為政,P2P公司拿不到央行的數(shù)據(jù),幾家大的互聯(lián)網(wǎng)平臺在相關(guān)大數(shù)據(jù)的分享上彼此也未互通有無。
因而,各金融企業(yè)要建立互聯(lián)互通機制,打破數(shù)據(jù)孤島,從而能多維度地收集數(shù)據(jù),確保數(shù)據(jù)之間能夠相互驗證。
2.從供應(yīng)鏈交易環(huán)節(jié)獲取數(shù)據(jù)
獲取真實數(shù)據(jù)最好的途徑就是要切入客戶的交易環(huán)節(jié),尤其是穩(wěn)定可持續(xù)的交易環(huán)節(jié),即供應(yīng)鏈。
一方面,經(jīng)過了幾十年的發(fā)展,當(dāng)前的供應(yīng)鏈都有一套完整上下游進入和退出機制,數(shù)據(jù)的真實性對于核心企業(yè)而言至關(guān)重要,因而這些數(shù)據(jù)的質(zhì)量非常優(yōu)異。
另一方面,這些數(shù)據(jù)和數(shù)據(jù)維度對于供應(yīng)鏈中的企業(yè)評價是可靠的,金融企業(yè)可以此為基礎(chǔ),加上自身的風(fēng)險控制經(jīng)驗,構(gòu)建一套全新的基于數(shù)據(jù)的信用評價機制。
3.積極布局“物聯(lián)網(wǎng)+”
物聯(lián)網(wǎng)覆蓋了產(chǎn)品生產(chǎn)、交易和使用的環(huán)節(jié),因而互聯(lián)網(wǎng)只是物聯(lián)網(wǎng)的一部分。在物聯(lián)網(wǎng)下,不僅要獲取交易環(huán)節(jié)的數(shù)據(jù),更重要的是獲取生產(chǎn)環(huán)節(jié)和使用環(huán)節(jié)的數(shù)據(jù)。
因而,金融企業(yè)要積極布局“物聯(lián)網(wǎng)+”,為獲取更為全面的數(shù)據(jù)打下基礎(chǔ)。例如,企業(yè)機器運行數(shù)據(jù),可以收集客戶汽車駕駛數(shù)據(jù),可穿戴設(shè)備的身體狀況數(shù)據(jù),等等。這些數(shù)據(jù)都是大數(shù)據(jù)風(fēng)控不可或缺的部分。
(二)對于金融研究部門而言,可從經(jīng)濟、金融等多個角度綜合論證大數(shù)據(jù)風(fēng)控的有效性,為大數(shù)據(jù)風(fēng)控提供理論支持
當(dāng)前對于大數(shù)據(jù)風(fēng)控模型的構(gòu)建大多是從技術(shù)的角度探討的。但是,從經(jīng)濟、金融角度進行的探討亟待加強,不同的經(jīng)濟假設(shè)會使模型推導(dǎo)的結(jié)果產(chǎn)生截然不同的變化。因而,從經(jīng)濟、金融等角度對大數(shù)據(jù)風(fēng)控有效性的研究就顯得很有必要了。比如大數(shù)據(jù)風(fēng)控如何順應(yīng)經(jīng)濟周期的變化,如何從統(tǒng)計上論證過去的數(shù)據(jù)對于未來行為判斷的準(zhǔn)確性,如何解決道德風(fēng)險所帶來的不確定性。例如,唐時達(dá)(2015)提出要把數(shù)據(jù)提升至與傳統(tǒng)抵質(zhì)押品同等重要的高度,建立“數(shù)據(jù)質(zhì)押”風(fēng)控體系。
(三)對于政府監(jiān)管部門而言,要推動和完善與數(shù)據(jù)相關(guān)的制度建
1.法律制度的建設(shè),對數(shù)據(jù)的收集和使用予以法律上的保護
我國對于數(shù)據(jù)保護的制度性舉措散見于多部法律中,如憲法、刑法、侵權(quán)責(zé)任法等,多是以保護個人隱私、通信秘密等形式出現(xiàn),尚缺乏一部數(shù)據(jù)保護的專門性法律。這導(dǎo)致了數(shù)據(jù)的法律邊界不明,數(shù)據(jù)保護法律的操作性不強、數(shù)據(jù)保護執(zhí)法機制滯后等問題,制約了數(shù)據(jù)收集和運用的發(fā)展。
對此,最理想的狀況是出臺一部《信息保護法》。在完善個人信息保護法律制度的道路上,應(yīng)出臺《個人信息保護法》,明確國家機關(guān)、商家和其他法人、自然人掌握個人信息的邊界和使用的范圍[6-7]。齊愛民、盤佳(2015)認(rèn)為要構(gòu)建數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)法律制度[8]。2014年最高人民法院頒布的《關(guān)于審理侵害信息網(wǎng)絡(luò)傳播權(quán)民事糾紛案適用法律若干問題的規(guī)定》(以下簡稱《規(guī)定》)就是此領(lǐng)域的進展之一,《規(guī)定》首次明確了個人信息保護的范圍。
2.會計制度建設(shè),對數(shù)據(jù)資產(chǎn)予以明確的計量
隨著數(shù)據(jù)重要性的提升,數(shù)據(jù)列入企業(yè)資產(chǎn)負(fù)債表只是時間問題,數(shù)據(jù)將和土地、勞動力和資本一樣,成為一種生產(chǎn)要素(Viktor Mayer-Sch?nberger,2013)。越來越多的理論界和實務(wù)界的研究者都傾向于認(rèn)為數(shù)據(jù)將成為個體的財產(chǎn)和資產(chǎn)。
2012年達(dá)沃斯世界經(jīng)濟論壇的《大數(shù)據(jù),大影響》報告認(rèn)為,數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟資產(chǎn)類別。
關(guān)鍵詞:大數(shù)據(jù)時代;科技期刊;出版;編輯
中圖分類號:G232 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-8122(2016)03-0105-02
20世紀(jì)80年代初,著名未來學(xué)大師及社會思想家阿爾文?托夫勒(Alvin Toffler)便預(yù)言大數(shù)據(jù)(big data)將成為“第三次浪潮的華彩樂章”。20世紀(jì)90年代以來,隨著計算機技術(shù)的迅猛發(fā)展,上至國家的重大決策,下至人民生活的衣食住行,方方面面的信息均被數(shù)字化,并得到有效的儲存。邁入21世紀(jì),人類社會進入了一個大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的時代――大數(shù)據(jù)時代,它強調(diào)信息技術(shù)的重點由“技術(shù)”轉(zhuǎn)變?yōu)椤靶畔ⅰ?。因此,在以信息為基礎(chǔ)的人文社會科學(xué)研究領(lǐng)域,大數(shù)據(jù)勢必引發(fā)其組織決策和業(yè)務(wù)流程等方面的根本性變革。而為學(xué)術(shù)研究服務(wù)的科技期刊在大數(shù)據(jù)時代浪潮中,又將面對怎樣的機遇和挑戰(zhàn)呢?
一、大數(shù)據(jù)的概念與特征
大數(shù)據(jù),又稱為巨量資料或海量資料;其是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型繁多的數(shù)據(jù)資料構(gòu)成的數(shù)據(jù)集合,是以“云計算”為基礎(chǔ)技術(shù)支持的數(shù)據(jù)處理和應(yīng)用模式。大數(shù)據(jù)技術(shù)是通過集成共享數(shù)據(jù),將分散的數(shù)據(jù)資源轉(zhuǎn)變?yōu)榧械闹橇Y源和知識服務(wù)能力。研究機構(gòu)Garter定義“大數(shù)據(jù)”為需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資源。簡而言之,從各種類型數(shù)據(jù)中,快速獲得有價值信息的能力,就是大數(shù)據(jù)技術(shù)。
大數(shù)據(jù)的特征通常表現(xiàn)為以下四個方面:數(shù)據(jù)體量巨大(Volume)、數(shù)據(jù)類型繁多(Variety)、價值密度低(Value)、處理速度快(Velocity)。這就是人們通常所說的大數(shù)據(jù)的4V特征,也是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)的顯著特征。
二、大數(shù)據(jù)時代下科技期刊面臨的機遇
1.出版形態(tài)的多樣化。大數(shù)據(jù)時代,在計算機、互聯(lián)網(wǎng)等技術(shù)的不斷發(fā)展和創(chuàng)新環(huán)境下,傳統(tǒng)科技期刊的出版模式已悄然向大數(shù)據(jù)平臺、多媒介及全媒體模式轉(zhuǎn)型??萍计诳瘮?shù)據(jù)化集群建設(shè)得以實現(xiàn)的一個重要條件就是大數(shù)據(jù)技術(shù)的成熟與推廣,隨著大數(shù)據(jù)平臺技術(shù)的建立,科技期刊實現(xiàn)了內(nèi)容的自主優(yōu)化、信息服務(wù)的個性化,以及出版發(fā)行模式的多元化,科技期刊將向著在線投稿及評議系統(tǒng)、編輯管理系統(tǒng)和增值服務(wù)系統(tǒng)一體化的方向發(fā)展。大數(shù)據(jù)期刊平臺的構(gòu)建將通過期刊內(nèi)容推薦系統(tǒng)、流計算、期刊數(shù)據(jù)庫和期刊信息整合與治理四大功能板塊完成[1]。大多數(shù)科技期刊所采用的紙質(zhì)媒介,在大數(shù)據(jù)時代背景下已不能滿足讀者的閱讀體驗,網(wǎng)絡(luò)、無線、手持閱讀器的全媒體出版要求凸顯。傳統(tǒng)紙質(zhì)科技期刊傳播媒介將呈多樣化、全媒體的發(fā)展態(tài)勢,物聯(lián)網(wǎng)、互聯(lián)網(wǎng)、移動智能終端等技術(shù)平臺,都已成為科技期刊傳播的重要媒介??萍计诳脭?shù)字化、多媒介、全媒體的出版模式,在為讀者提供平面媒體與數(shù)字媒體相結(jié)合的全新視聽閱讀感受的同時,也獲得了更多途徑和更深層次的推廣效果。
2.業(yè)務(wù)流程的智能化。隨著計算機技術(shù)的迅猛發(fā)展,以及云計算技術(shù)的成熟,使得任何復(fù)雜的數(shù)據(jù)都可以實現(xiàn)定量化分析[2]。因此,導(dǎo)致編輯工作流程中的信息收集、加工、傳遞等過程的智能化成為可能??萍计诳庉嫷哪繕?biāo)是將知識差大,且讀者或該領(lǐng)域從業(yè)人員感興趣的論文從眾多稿件中挑選出來,體現(xiàn)在編輯出版過程中就是組稿策劃和審稿過程[3]。而過去這一編輯流程基本依靠編輯人員的經(jīng)驗、價值觀或?qū)W術(shù)專家提出的建議完成。而現(xiàn)在大數(shù)據(jù)技術(shù)將科技期刊歷史出版物數(shù)據(jù)化,將全社會、全行業(yè)的科技成果數(shù)據(jù)化,并將這些數(shù)據(jù)進行整合、分析,從中獲得真實、客觀、準(zhǔn)確、全面的學(xué)術(shù)信息,從而為科技期刊的選題策劃、組稿及審稿提供依據(jù)。可以想象在大數(shù)據(jù)技術(shù)提供的真實、客觀、準(zhǔn)確、全面的學(xué)術(shù)信息下,那些“一稿多投”或?qū)W術(shù)不端、學(xué)術(shù)腐敗的問題稿件,將無處遁形。在信息的加工過程中,大數(shù)據(jù)及云計算技術(shù)將過去編輯流程中,因編輯習(xí)慣不同或各期刊要求各異,而無統(tǒng)一標(biāo)準(zhǔn)的編輯規(guī)則模式轉(zhuǎn)化為統(tǒng)一、有序的編輯規(guī)則模式。在這種編輯規(guī)則模式下,利用人工智能工具或軟件,有可能實現(xiàn)稿件的計算機“預(yù)編輯”。從而減少編輯的重復(fù)勞動和簡單勞動,提升編輯質(zhì)量和編輯效率。
3.評價規(guī)則的多元化。目前,對科技期刊及論文的質(zhì)量和影響力的評估,普遍采用基于文獻(xiàn)計量學(xué)的評價體系,如影響因子和被引頻次。然而,由于模擬數(shù)據(jù)時代采集的數(shù)據(jù)樣本量小、種類少,導(dǎo)致科技期刊界對定性或定量評價的優(yōu)劣爭議不斷[4]。大數(shù)據(jù)時代的到來解決了這一問題。通過文本分析、語義分析、專家印象評估及同行評估等方法,可以實現(xiàn)對科技期刊的定性評價。通過期刊影響因子動態(tài)跟蹤、論文被引動態(tài)跟蹤、論文瀏覽及下載量動態(tài)跟蹤等方法,可以實現(xiàn)對科技期刊的動態(tài)評價。通過專家反饋信息采集、同行引用反饋信息采集、讀者反饋與推薦信息采集、廠商應(yīng)用效果市場反饋信息采集等方法,可以實現(xiàn)對科技期刊客觀評價。因此,基于大數(shù)據(jù)平臺的科技期刊及論文評估是定性與定量、歷史與現(xiàn)代、靜態(tài)與動態(tài)、學(xué)術(shù)價值和經(jīng)濟效益、主觀與客觀相結(jié)合的多元化、綜合性科學(xué)評價機制[5]。
4.營銷模式以品牌營銷為主。大數(shù)據(jù)時代科技期刊的營銷模式是將文化價值、創(chuàng)新價值、版權(quán)價值和廣告價值融為一體的新型商業(yè)模式。文化價值即科技期刊的學(xué)術(shù)品牌,是科技期刊建設(shè)的最主要目標(biāo),有文化內(nèi)涵、科技含量及藝術(shù)價值的品牌形象,不僅保證了科技的發(fā)展和文化的繁榮,更是吸引讀者的關(guān)鍵,從而獲得更好的經(jīng)濟效益和社會影響力,實現(xiàn)科技期刊的良性發(fā)展。創(chuàng)新價值即是以創(chuàng)新為突破口的跨媒介融合出版,利用大數(shù)據(jù)技術(shù)獲取受眾群體的核心信息,通過大數(shù)據(jù)分析掌握市場動向,并及時提出有創(chuàng)新性的營銷策略,是科技期刊出版單位需要具備的專業(yè)能力。印刷時代建立的傳統(tǒng)版權(quán)原則和制度,在大數(shù)據(jù)時代受到了根本性動搖,傳統(tǒng)版權(quán)規(guī)則所確立的利益觀、價值觀,以及商業(yè)模式也被逐漸解構(gòu),特別是隨著數(shù)字出版的蓬勃發(fā)展,版權(quán)資源潛在的巨大市場和價值被重新挖掘和開發(fā)。版權(quán)產(chǎn)業(yè)迎來了前所未有的發(fā)展機遇,版權(quán)資源成為爭奪主戰(zhàn)場,版權(quán)資源的價值亟須重塑[6]。大數(shù)據(jù)時代,出版載體已向跨行業(yè)全媒體模式轉(zhuǎn)變,出版形態(tài)也更加豐富,廣告形式不僅僅局限在傳統(tǒng)期刊投放的平面廣告,聲音、動畫、影像等多媒體形式的廣告將有效地與科技期刊的主題報道內(nèi)容相結(jié)合,讀者在閱讀雜志內(nèi)容的同時,也反復(fù)接受了產(chǎn)品的展示與推廣,加強了品牌宣傳效果,真正達(dá)到廣而告知的目的。
5.出版編輯理念面臨的機遇。在大數(shù)據(jù)時代背景下,要求科技期刊的編輯工作從傳統(tǒng)的文字編輯加工,轉(zhuǎn)變?yōu)槿襟w新出版語境下的數(shù)字編輯。數(shù)字編輯的定義是:在數(shù)字圖書、數(shù)字報紙、數(shù)字期刊、網(wǎng)絡(luò)原創(chuàng)文學(xué)、網(wǎng)絡(luò)教育出版物、網(wǎng)絡(luò)地圖、數(shù)字音樂、數(shù)字視頻、網(wǎng)絡(luò)動漫、網(wǎng)絡(luò)游戲、數(shù)字音像制品、手機出版等出版過程中,從事選題策劃、組織稿件、審核把關(guān)和加工整理的專業(yè)技術(shù)人員[7]。這就要求科技期刊編輯首先從思想上樹立數(shù)字編輯理念,深刻理解大數(shù)據(jù)時代,數(shù)字出版背景下編輯工作不斷追求創(chuàng)新和數(shù)字技術(shù)應(yīng)用的要求??萍计诳瘮?shù)字出版編輯在推廣重要學(xué)術(shù)成果、傳播科技文化知識、促進科技期刊發(fā)展進程中,不僅是實現(xiàn)期刊全媒體化的先行軍,更是數(shù)字出版技術(shù)創(chuàng)新的開拓者。數(shù)字出版編輯應(yīng)順應(yīng)數(shù)字出版的潮流,更新數(shù)字化出版的編輯理念,主動參與文化、科技成果的數(shù)據(jù)化,并積極實現(xiàn)數(shù)字信息的加工與傳播。在讀者服務(wù)方面,編輯也利用大數(shù)據(jù)技術(shù)提供的精準(zhǔn)信息,實現(xiàn)對目標(biāo)消費群體的個體化信息推送,提供更為精準(zhǔn)服務(wù)。數(shù)字出版編輯要不斷適應(yīng)數(shù)字理念的創(chuàng)新,以適應(yīng)大數(shù)據(jù)時代不斷深化的移動互聯(lián)網(wǎng)終端輸入內(nèi)容智能化的趨勢[8]。
三、大數(shù)據(jù)時代下科技期刊面臨的挑戰(zhàn)
1.信息透明化導(dǎo)致期刊生存環(huán)境競爭激烈。通過大數(shù)據(jù)技術(shù),所有科技期刊都將在一個更為透明的環(huán)境中生存。所有科技期刊的評價指標(biāo),都將作為公共信息,而被公之于眾。例如,中國科學(xué)技術(shù)信息研究所每年都會將中國科技論文統(tǒng)計源收錄期刊的主要計量指標(biāo),如核心總被引頻次、核心影響因子、核心即年指標(biāo)等,以引證報告的形式,提供給大眾。在這些細(xì)化和量化的數(shù)據(jù)信息面前,科技期刊的優(yōu)劣勢一目了然。這必將造成優(yōu)秀期刊的良性發(fā)展和劣質(zhì)期刊的自我淘汰。這種數(shù)據(jù)公開機制,有可能導(dǎo)致某些優(yōu)質(zhì)期刊或優(yōu)勢學(xué)科領(lǐng)域的期刊獲得更多的讀者和作者資源,而對于新創(chuàng)辦的期刊和某些弱勢學(xué)科領(lǐng)域的期刊將進入一個更為不利的生存態(tài)勢之中。
2.對科技期刊編輯人才隊伍提出了新的要求。隨著大數(shù)據(jù)理念深入人心,大數(shù)據(jù)技術(shù)的日臻成熟,數(shù)字化出版必將成為科技期刊的主要出版形式[9]。因此,數(shù)字化編輯也將成為科技期刊編輯工作者的新要求。編輯工作者不僅應(yīng)具備組稿策劃、文字編輯加工能力外,還應(yīng)具備內(nèi)容擴展、內(nèi)容研究、內(nèi)容創(chuàng)作等能力,以適應(yīng)科技期刊在大數(shù)據(jù)時代下的數(shù)字化發(fā)展。
3.傳統(tǒng)的盈利模式不再滿足期刊的發(fā)展需求。在科技期刊數(shù)字化進程中,科技期刊文章無償向全社會提供閱讀已成為必然趨勢。因此,依靠紙質(zhì)發(fā)行、有償下載閱讀的傳統(tǒng)盈利模式,已不能滿足期刊的發(fā)展要求。然而,在將來期刊出版社或編輯部是否能成為數(shù)據(jù)運營的主體,也是一個懸而未決的問題。數(shù)據(jù)庫運營商有可能通過與科技期刊共同建立和運行數(shù)字化出版平臺,或開發(fā)數(shù)字化產(chǎn)品,來分享雜志的發(fā)行和廣告收入。
由此可見,在大數(shù)據(jù)時代背景下,科技期刊將面臨前所未有的機遇和挑戰(zhàn)。作為科技期刊的從業(yè)者,我們要抓住這些機遇,迎接挑戰(zhàn),完成科技期刊的完美轉(zhuǎn)型,盡早實現(xiàn)真正意義上的數(shù)字化期刊集群化。
參考文獻(xiàn):
[1] 丁田.大數(shù)據(jù)時代科技期刊的未來形態(tài)[J].中國科技期刊研究,2014(2).
[2] 賈曉青,王萍,陳清蓮.大數(shù)據(jù)時代科技期刊編輯思維拓展[J].出版科學(xué),2014(6).
[3] 張小強,張?zhí)O,呂賽英.從信息傳播角度看科技期刊編輯出版過程及其優(yōu)化[J].編輯學(xué)報,2007(3).
[4] 朱劍.量化指標(biāo):學(xué)術(shù)期刊不能承受之輕――評《全國報紙期刊出版質(zhì)量綜合評估指標(biāo)體系(試行)》[J].清華大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2013(1).
[5] 柴英,馬婧.大數(shù)據(jù)時代學(xué)術(shù)期刊功能的變革[J].編輯之友,2014(6).
[6] 張勤.試論大數(shù)據(jù)時代版權(quán)資源的價值重塑[J].中國出版, 2015(11).
[7] 李超.數(shù)字出版人才培養(yǎng):職稱評定的作用[EB/OL].中國數(shù)字出版信息網(wǎng),2013-05-23.
關(guān)鍵詞:大數(shù)據(jù) 環(huán)境 數(shù)字圖書館 安全威脅 對策 分析
中圖分類號:G250 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2017)02(c)-0219-02
大數(shù)據(jù)是當(dāng)前社會發(fā)展中非常重要的組成部分,在大數(shù)據(jù)時代下,我國的圖書館管理也實現(xiàn)了高新技術(shù)的層面,圖書館數(shù)據(jù)流量也呈現(xiàn)出了級數(shù)非線性增長,大數(shù)據(jù)環(huán)境的主要特點是數(shù)據(jù)量大,高速且高價值。這也使得圖書館數(shù)據(jù)系統(tǒng)的復(fù)雜程度以及數(shù)據(jù)的管理難度有了極大的增加,大數(shù)據(jù)平臺也逐漸成為廣大黑客攻擊的主要目標(biāo),基于此,如何保證在大數(shù)據(jù)時代下,圖書館數(shù)據(jù)平臺的安全問題也就成為了當(dāng)前主要的研究課題,怎樣有效利用大數(shù)據(jù)技術(shù)來構(gòu)建智能圖書館,這對于提升圖書館的市場競爭能力都是非常有幫助的。
1 大數(shù)據(jù)時代下數(shù)字圖書館說面臨的安全威脅
1.1 數(shù)據(jù)中心IT系統(tǒng)安全需求
隨著我國圖書館現(xiàn)代化的不斷深入,圖書館系統(tǒng)也在不斷的更新?lián)Q代當(dāng)中,在圖書館體系的運用上,系統(tǒng)要求安全檢測具備更加廣泛的深度和需求,這樣一來就會導(dǎo)致圖書館數(shù)據(jù)中心系統(tǒng)的能耗急劇增加,檔子運行的整體速度大幅度的下降,所以,我們在研究大數(shù)據(jù)的時候,一定要保證圖書館數(shù)據(jù)中心系統(tǒng)部署可以真正的滿足用戶服務(wù)的需求,進而創(chuàng)建一個科學(xué)高效的圖書館系統(tǒng)架構(gòu),這也是當(dāng)前圖書館系統(tǒng)深入部署的有效前提,一般來說,傳統(tǒng)的圖書館系統(tǒng)環(huán)境下,數(shù)據(jù)中心會設(shè)置相關(guān)的防范產(chǎn)品來控制數(shù)據(jù)流量的安全檢測,而由于這些傳統(tǒng)的安全策略對圖書館系統(tǒng)資源的耗能是非常大的,在加上圖書館數(shù)據(jù)流量總是出現(xiàn)延遲和數(shù)據(jù)丟失等問題也是非常的明顯,很明顯現(xiàn)在已經(jīng)不能適應(yīng)大數(shù)據(jù)時代下圖書館高校、快速的服務(wù)需求,在大數(shù)據(jù)環(huán)境下,圖書館在用戶服務(wù)的時候還有可能會面臨著木馬、病毒等安全方面的威脅,除此之外,黑客還可以利用云計算以及大數(shù)據(jù)等技術(shù)手段對新模式進行攻擊,所以,圖書館在復(fù)雜的大數(shù)據(jù)安全環(huán)境中,著呢用用加速、負(fù)載為單一的操作,對數(shù)據(jù)流在應(yīng)用過程中只是做單一的處理,這也是為了能夠進一步消除數(shù)據(jù)流在安全檢測中出現(xiàn)延遲故障。
1.2 大數(shù)據(jù)給圖書館帶來了新安全問題
隨著大數(shù)據(jù)技術(shù)在圖書館應(yīng)用的不斷加深,圖書館數(shù)據(jù)環(huán)境具有海量存儲、計數(shù)遞增等特點,與此同時,數(shù)據(jù)結(jié)構(gòu)模式以及數(shù)據(jù)類型的多樣性特點也是非常明顯的,這也導(dǎo)致數(shù)據(jù)處理的格式其可變性和處理速率也更加的不確定。
在大數(shù)據(jù)時代,圖書館對云計算計數(shù)的依賴性也在不斷的增強,因此要求圖書館與云服務(wù)商要簽署符合大數(shù)據(jù)環(huán)境的云服務(wù)租賃協(xié)議。明確雙方的權(quán)利和義務(wù)。除此之外,云服務(wù)的安全保障有效性和安全管理效率也要有本質(zhì)上的提升。這也與圖書館大數(shù)據(jù)應(yīng)用安全息息相關(guān)。
除此之外,虛擬化技術(shù)也是當(dāng)前我國圖書館大數(shù)據(jù)應(yīng)用中非常重要的技術(shù)手段之一,數(shù)據(jù)虛擬化技術(shù)是一種允許用戶訪問和管理的方法,圖書館在利用虛擬化技術(shù)來改善圖書館系統(tǒng)的同時,也極大的降低了運營的實際成本,面臨著數(shù)據(jù)中心系統(tǒng)設(shè)備異構(gòu)化等安全問題。
1.3 黑客會利用大數(shù)據(jù)技術(shù)對圖書館發(fā)起攻擊
在圖書館利用大數(shù)據(jù)技術(shù)提高服務(wù)質(zhì)量以及獲取讀者需求的時候,黑客會運用大數(shù)據(jù)技術(shù)向圖書館發(fā)起攻擊,首先,圖書館大數(shù)據(jù)平臺存儲著大量的系統(tǒng)管理以及用戶服務(wù)等數(shù)據(jù)信息,這些信息大部分都是客戶的私密信息,而黑客通過對獲取的大數(shù)據(jù)資源進行分析,能夠明確圖書館的系統(tǒng)運營特點以及安全防范的相關(guān)措施,能夠運用大數(shù)據(jù)決策對圖書館發(fā)起非常精準(zhǔn)的攻擊。
其次,由于大數(shù)據(jù)時代下的圖書館網(wǎng)絡(luò)具備非常強的社會化屬性,網(wǎng)絡(luò)數(shù)據(jù)還附帶復(fù)雜、敏感等特點,因此網(wǎng)絡(luò)數(shù)據(jù)平臺已經(jīng)完成了不同圖書館大數(shù)據(jù)平臺的數(shù)據(jù)整合與資源共享。
1.4 讀者自身面臨的威脅
在大數(shù)據(jù)時代下,圖書館主要是通過對用戶行為數(shù)據(jù)的健康和采集來獲取讀者的個體特征,這些數(shù)據(jù)在確保圖書館用戶服務(wù)質(zhì)量的同時,也面臨著泄露用戶信息的威脅,而為了進一步的提高系統(tǒng)管理與用戶服務(wù)決策的有效性,圖書館會通過擴展用戶數(shù)據(jù)采集的對象來不斷提升大數(shù)據(jù)幾何的數(shù)據(jù)價值。
首先,數(shù)據(jù)擁有者能夠通過對大部分無關(guān)的數(shù)據(jù)分析來獲取用戶的隱私信息,由于體術(shù)管對一些相對比較敏感的數(shù)據(jù)沒有一個明確的界定,這一狀況也使得很多機遇大數(shù)據(jù)的圖書館所有權(quán)和使用權(quán)也沒有明確的界定。
其次,隨著讀者個性化閱讀的不斷提升,讀者運用移動閱讀的頻率越來越高,現(xiàn)如今已經(jīng)成為大數(shù)據(jù)時代下消除時間、地域、閱讀環(huán)境以及閱讀能力的主要模式。但是由于移動月底在帶給讀者閱讀便利性的同時也間接的泄露了用戶的個人信息。
2 基于大數(shù)據(jù)的數(shù)字圖書館安全防范策略
2.1 增強安全防御能力
2.1.1 現(xiàn)安全威脅
首先,我們的圖書館在利用大數(shù)據(jù)技術(shù)保護系統(tǒng)與服務(wù)安全的時候,我們的研究人員要對提供監(jiān)控設(shè)備采集的大數(shù)據(jù)安全資源進行綜合的分析,明確惡意攻擊的來源,與此同時,還要通過對相關(guān)的安全指標(biāo)數(shù)據(jù)關(guān)系來挖掘數(shù)據(jù)信息的價值,進而實現(xiàn)對非法攻擊者的精準(zhǔn)預(yù)測。
其次,在構(gòu)建安全管理大數(shù)據(jù)平臺的時候,要盡量使用一些技術(shù)相對成熟且兼容性強的數(shù)據(jù)來分析圖書館數(shù)據(jù)流,針對圖書館大數(shù)據(jù)服務(wù)于安全管理的相關(guān)需求來制定專業(yè)的大數(shù)據(jù)資源,增強圖書館基于大數(shù)據(jù)安全威脅發(fā)現(xiàn)的主動性。
2.1.2 構(gòu)建基于大數(shù)據(jù)安全威脅與防御能力的評估評價體系
大數(shù)據(jù)安全威脅與預(yù)防能力的評價主要是針對當(dāng)前我國圖書館精準(zhǔn)評估安全威脅等級和安全防范能力的關(guān)鍵體系,圖書館基于大數(shù)據(jù)的安全威脅評估評價體系是圖書館服務(wù)信息與系統(tǒng)管理數(shù)據(jù)傳輸?shù)闹匾d體,由于網(wǎng)絡(luò)安全關(guān)系著圖書館管理與服務(wù)安全的可靠性,所以,圖書館在數(shù)據(jù)中心的網(wǎng)絡(luò)傳統(tǒng)評估中,要平均的在網(wǎng)絡(luò)上部署大量的安全檢測數(shù)據(jù)采集設(shè)備,進一步保證安全評估平臺的全面性和準(zhǔn)確性。
2.2 保證云計算計數(shù)和虛擬化數(shù)據(jù)的安全
在當(dāng)前的大數(shù)據(jù)環(huán)境下,圖書館一般都會采用租賃等方式來采集圖書信息,除此之外,我們的研究人員在對云服務(wù)平臺的數(shù)據(jù)進行管理的傳輸?shù)臅r候,圖書館最好是根據(jù)高校的計算機管理系統(tǒng)來實現(xiàn)對數(shù)據(jù)的自動化管理,不斷加強對讀者閱讀行為的安全管理,通過建立全面、高校的監(jiān)控網(wǎng)絡(luò)來進一步實現(xiàn)對數(shù)據(jù)流的全程較差監(jiān)管,這樣也能夠有效的避免數(shù)據(jù)出現(xiàn)非法監(jiān)聽和竊取。
2.3 制定實施科學(xué)的大數(shù)據(jù)安全管理策略
首先,大數(shù)據(jù)安全管理平臺想要真正的實現(xiàn)安全管理和相關(guān)流程的整合,讓我們的圖書館能夠根據(jù)大數(shù)據(jù)安全信息來完成相關(guān)安全事件的管理和分析工作,因此需要我們的研究人員在對圖書館監(jiān)控設(shè)備采集數(shù)據(jù)信息的時候,要對數(shù)據(jù)進行預(yù)先的處理,只有保證了數(shù)據(jù)格式的標(biāo)準(zhǔn)化之后,才能夠真正的用于圖書館管理和運用。
其次,圖書館安全管理平臺還要通過實時的監(jiān)督管理系統(tǒng)來對圖書館安全威脅問題進行檢測和評估,并根據(jù)安全管理平臺數(shù)據(jù)反饋來實現(xiàn)對圖書館大數(shù)據(jù)運用平臺的參數(shù)設(shè)置,提升圖書館安全管理的強度。增強圖書館管理系統(tǒng)的整體效率。
3 結(jié)語
大數(shù)據(jù)自身的復(fù)雜性和多樣性特點使得在大數(shù)據(jù)環(huán)境下的圖書館出現(xiàn)了很多的不可預(yù)測攻擊行為,導(dǎo)致圖書館大數(shù)據(jù)資源在采集的過程中經(jīng)常會出現(xiàn)很多的問題,我們此次主要針Φ鼻拔夜大數(shù)據(jù)時代下現(xiàn)代化圖書館的安全威脅問題進行了詳細(xì)的分析和研究,并針對出現(xiàn)的問題提出了幾點可行性的解決建議,希望可以為我國的圖書館安全問題提供有效的幫助。
參考文獻(xiàn)
[1] 蔡津津,郜新鑫,付建俐.基于業(yè)務(wù)元數(shù)據(jù)標(biāo)準(zhǔn)化的金融財經(jīng)數(shù)據(jù)倉庫及服務(wù)系統(tǒng)架構(gòu)探討[C]//中國新聞技術(shù)工作者聯(lián)合會2012年學(xué)術(shù)年會、五屆四次理事會暨第六屆“王選新聞科學(xué)技術(shù)獎”的“人才獎”和“優(yōu)秀論文獎”頒獎大會論文集.2012.
[2] 周為鋼,楊良懷,潘建,等.論智能交通大數(shù)據(jù)處理平臺之構(gòu)建[C]//第八屆中國智能交通年會論文集.2013.
[3] 喬向杰.基于大數(shù)據(jù)的旅游公共管理與服務(wù)創(chuàng)新模式研究[C]//北京兩界聯(lián)席會議高峰論壇文集.2013.
[4] 譚勝淋,陳曦.大數(shù)據(jù)的標(biāo)準(zhǔn)化研究[C]//市場踐行標(biāo)準(zhǔn)化――第十一屆中國標(biāo)準(zhǔn)化論壇論文集.2014.
[5] 包磊,羅兵,孫越林.大數(shù)據(jù)時代的態(tài)勢評估技術(shù)思考[C]//2014第二屆中國指揮控制大會論文集(下).2014.
[6] 尹素格,王健,張桂剛,等.大數(shù)據(jù)技術(shù)在精確空投系統(tǒng)中的應(yīng)用[C]//2014第二屆中國指揮控制大會論文集(下).2014.
[7] 劉春琳,冷紅.基于大數(shù)據(jù)挖掘的城市關(guān)注平臺的構(gòu)建與應(yīng)用[C]//城鄉(xiāng)治理與規(guī)劃改革――2014中國城市規(guī)劃年會論文集(04城市規(guī)劃新技術(shù)應(yīng)用).2014.
[8] 飛.大數(shù)據(jù)時代中國期刊的發(fā)展機遇與探索創(chuàng)新[C]//第十二屆2014全國核心期刊與期刊國際化、網(wǎng)絡(luò)化研討會論文集.2014.
[9] 朱力緯,劉麗勤,王健.高?;诖髷?shù)據(jù)時代的數(shù)字化校園建設(shè)研究[C]//中國高等教育學(xué)會教育信息化分會第十二次學(xué)術(shù)年會論文集.2014.
[10] 孫圣力,鄭志高,王平,等.RTDP系統(tǒng)網(wǎng)絡(luò)體系結(jié)構(gòu)及其關(guān)鍵技術(shù)[C]//.2013年全國通信軟件學(xué)術(shù)會議論文集.2013.
[11] 張嵐,郭俊杰.信息安全風(fēng)險評估的安全措施探討[C]//2011年通信與信息技術(shù)新進展――第八屆中國通信學(xué)會學(xué)術(shù)年會論文集.2011.
[12] 韓俊,劉曉婷.科技期刊在“云時代”所面臨的機遇和挑戰(zhàn)[C]//科學(xué)評價促發(fā)展,品質(zhì)服務(wù)謀共贏――第九屆(2011)全國核心期刊與期刊國際化、網(wǎng)絡(luò)化研討會論文集.2011.
(湖北省科技信息研究院 湖北 武漢 430071)
摘 要:大數(shù)據(jù)背景下信息服務(wù)工作發(fā)生較大變化。湖北省科技信息共享服務(wù)平臺順應(yīng)大數(shù)據(jù)挑戰(zhàn),利用云平臺和元數(shù)據(jù)倉儲技術(shù),從硬件、軟件層次上解決了大數(shù)據(jù)條件下的數(shù)據(jù)存儲與檢索問題。以湖北省科技信息共享服務(wù)平臺的功能特色為角度,研究了以信息平臺為基礎(chǔ)進行的信息服務(wù)內(nèi)容與模式創(chuàng)新,最后對信息平臺今后的服務(wù)方向進行了探討。
關(guān)鍵詞 :大數(shù)據(jù);信息服務(wù);信息共享平臺;元數(shù)據(jù)倉儲;云平臺
中圖分類號:G203 文獻(xiàn)標(biāo)識碼:A doi:10.3969/j.issn.1665-2272.2015.01.008
在大數(shù)據(jù)時代,信息服務(wù)工作的信息獲取、存儲、組織、分析等技術(shù),用戶獲取和利用信息的方式方法都發(fā)生了較大變化,如何進行大數(shù)據(jù)處理,為用戶提供更加專業(yè)的信息服務(wù)將成為挑戰(zhàn)。
湖北省科技信息共享服務(wù)平臺(以下簡稱信息平臺)是支撐湖北省內(nèi)科研機構(gòu)和科技型中小企業(yè)創(chuàng)新創(chuàng)業(yè)的綜合信息服務(wù)平臺,是全省科技進步和科技創(chuàng)新必不可少的支撐條件。信息共享服務(wù)平臺順應(yīng)大數(shù)據(jù)時代的挑戰(zhàn),利用元數(shù)據(jù)倉儲技術(shù),真正實現(xiàn)統(tǒng)一跨庫檢索,集產(chǎn)業(yè)追蹤、區(qū)域聚焦、個性定制、代查代借、特色服務(wù)等多功能為一體,能夠?qū)崿F(xiàn)多層次、全方位地為用戶提供信息服務(wù)。對促進全省科技創(chuàng)新體系建設(shè),推動科技創(chuàng)新驅(qū)動戰(zhàn)略實施具有十分重要的意義。
1 大數(shù)據(jù)環(huán)境下信息服務(wù)面臨的問題
1.1 大數(shù)據(jù)存儲管理問題
首先,隨著網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)爆增,巨大存儲空間需求給硬件存儲帶來壓力。大數(shù)據(jù)時代信息資源的建設(shè)已經(jīng)不止是簡單的網(wǎng)頁文本、照片或音頻、視頻文件。這就需要購置大量的存儲設(shè)備去滿足不斷增長的需求,而傳統(tǒng)模式的數(shù)據(jù)存儲方式不僅擴展能力有限,而且擴展方法很麻煩。
其次,對非結(jié)構(gòu)化數(shù)據(jù)存儲管理效率低。例如各種類型的數(shù)據(jù)如辦公文檔、圖像、音頻、視頻、電子郵件、超媒體等,數(shù)據(jù)處理操作不僅需要使用不同的文件處理軟件,而且要在人工參與下才能完成。過多的人工操作會大大增加數(shù)據(jù)處理的時間,致使信息管理中心無法快速獲得重要的信息,工作效率降低。
1.2 技術(shù)問題
面對指數(shù)級增長的數(shù)據(jù)目前PB級的存儲系統(tǒng)中,檢索數(shù)據(jù)無異于大海撈針。傳統(tǒng)的數(shù)據(jù)檢索是靠數(shù)據(jù)庫文件系統(tǒng)命名的。這種檢索方式在檢索和查詢影像文件時可能會遇到障礙,當(dāng)影像文件超過了文件系統(tǒng)的厚度時就會出現(xiàn)問題。此外,各種非結(jié)構(gòu)化的數(shù)據(jù)又增加了大數(shù)據(jù)的復(fù)雜性,即關(guān)于數(shù)據(jù)庫表結(jié)構(gòu)定義的不一致性和標(biāo)準(zhǔn)缺失也是數(shù)據(jù)庫檢索的另一大問題。
1.3 傳統(tǒng)服務(wù)模式出現(xiàn)的問題
傳統(tǒng)信息服務(wù)方式在大數(shù)據(jù)時代已經(jīng)不能滿足信息化發(fā)展的要求,信息管理中心不僅需要收集、存儲大量的數(shù)據(jù)信息,還要在這些原始數(shù)據(jù)的基礎(chǔ)上通過專業(yè)技術(shù)手段分析、挖掘數(shù)據(jù),得到更為有效的信息資源,為信息資源用戶的決策管理提供數(shù)據(jù)參考。而傳統(tǒng)的數(shù)據(jù)管理方式適用于存量不大并且實時性要求不高的結(jié)構(gòu)化數(shù)據(jù),面對大容量的非結(jié)構(gòu)化數(shù)據(jù)顯得力不從心。
2 信息平臺的功能特色
2.1 云平臺布署解決大數(shù)據(jù)存儲問題
信息平臺為解決大數(shù)據(jù)帶來的檢索和存儲問題,引入了云平臺技術(shù)。從硬件方面來說,云平臺采用了6臺高性能服務(wù)器作為6個底層節(jié)點,一臺普通服務(wù)器作為管理機,節(jié)點與節(jié)點之間部署了心中檢測線,而節(jié)點與管理機之前則用千兆交換機連接。從軟件方面來說,信息平臺部署了一個云平臺操作系統(tǒng),包括管理系統(tǒng)、門戶網(wǎng)站、運營系統(tǒng)各一套,3套存儲管理平臺。信息平臺從硬件和軟件功能上進行升級,保證了平臺虛擬機的穩(wěn)定運行,為信息平臺元數(shù)據(jù)倉儲提供了強有力的支持,促進信息平臺檢索、下載功能高效率進行。
2.2 實現(xiàn)統(tǒng)一跨庫檢索
信息平臺集成當(dāng)前國內(nèi)最大的幾家數(shù)據(jù)庫廠商資源,包括萬方數(shù)據(jù)、維普資訊、中國知網(wǎng)、國研網(wǎng)、NSTL、國家知識產(chǎn)權(quán)局等,同時還集成了湖北省科技信息研究院自建的特色數(shù)據(jù)庫,文獻(xiàn)類型包括科技期刊、學(xué)位論文、會議論文、專利、標(biāo)準(zhǔn)、國研報告、研究報告、法律法規(guī)、科技成果、年鑒、報紙、圖書等,用戶只需一次檢索便可得到所有數(shù)據(jù)庫的不同類型資源,而且具有去重功能,改變以往多個庫檢索、重復(fù)瀏覽的模式,節(jié)省大量寶貴時間與精力。
2.3 元數(shù)據(jù)倉儲技術(shù)保證查全率
元數(shù)據(jù)在眾多領(lǐng)域都有其具體的定義和應(yīng)用,其中得到最廣泛認(rèn)可的概述是:關(guān)于數(shù)據(jù)的數(shù)據(jù),即描述任意資源結(jié)構(gòu)化的數(shù)據(jù)。信息平臺利用元數(shù)據(jù)倉儲技術(shù),采用數(shù)據(jù)收割、數(shù)據(jù)整理、數(shù)據(jù)更新這一流程,利用先進的資源調(diào)度規(guī)則和資源調(diào)度配置,將最底層的元數(shù)據(jù)預(yù)先建立索引,進而將不同的異構(gòu)數(shù)據(jù)庫導(dǎo)入一個全新的數(shù)據(jù)庫,實現(xiàn)各類資源的快速檢索,大大提高檢索速度與檢索效率。信息平臺利用元數(shù)據(jù)倉儲技術(shù),整合4.7億條不重復(fù)的元數(shù)據(jù),并且每年保持大規(guī)模增長,數(shù)據(jù)量超過任何一個單一的數(shù)據(jù)庫廠商,大大保證了查全率,方便用戶快速找到文獻(xiàn)資源線索。
2.4 多渠道保證原文無障礙獲取
信息平臺獲取原文的方法多樣,包括直接下載、共建單位原文傳遞、云傳遞及代查代借。信息平臺整合了國內(nèi)幾大主流數(shù)據(jù)庫廠商的各類資源,基本保證了各類中文數(shù)據(jù)的原文下載,本著資源共建共享的原則,信息平合全省各大高校及科研單位參與共建共享,目前已有武漢大學(xué)圖書館、華中科技大學(xué)圖書館、中科院國家科學(xué)圖書館武漢分館等19家單位參與,開通共建單位原文傳遞窗口,方便用戶獲取本館沒有的文獻(xiàn)。同時,信息平臺還有云傳遞功能,此為全國范圍內(nèi)的參與單位實現(xiàn),從而更大幅度地保證原文獲取效率。
在以上三種方式都無法獲取原文時,系統(tǒng)也會引導(dǎo)用戶采用代查代借功能獲取,代查代借是信息平臺的輔助功能,主要解決以下兩類問題:一是在信息平臺檢索到文獻(xiàn)題錄,但是無法獲取全文,二是知道文獻(xiàn)相關(guān)信息,在信息平臺中未檢索到。用戶只需在代查代借頁面提交文獻(xiàn)題名、作者、來源等信息即可,所提交的信息越詳細(xì),獲取原文的機率就越大。提交請求后信息平臺共建單位服務(wù)人員會在五個工作日以內(nèi)將查詢結(jié)果反饋到用戶郵箱。
2.5 特色功能滿足用戶個性化需求
2.5.1 檢索功能操作方便快捷
信息平臺實現(xiàn)文獻(xiàn)類型和檢索字段同時可選的功能,而且文獻(xiàn)類型可多選。其實這一功能在單一的數(shù)據(jù)庫中實現(xiàn)并不難,然而在統(tǒng)一資源檢索平臺要實現(xiàn)此功能需要解決一些技術(shù)難題。筆者也比較其他省級科技信息平臺,如廣東、廣西、四川、上海等省的科技文獻(xiàn)共享服務(wù)平臺均只實現(xiàn)文獻(xiàn)類型單選。湖北省信息平臺可以在多選文獻(xiàn)類型的情況下選擇所需字段,這樣處理方便用戶進行簡單的計量分析,例如可以通過一鍵式檢索分析某一機構(gòu)或作者的文獻(xiàn)產(chǎn)出情況,通過
關(guān)鍵詞 檢索分析各種文獻(xiàn)類型的主題分布情況等,大大方便用戶進行科研研究。
2.5.2 多維度服務(wù)導(dǎo)航功能
多維度服務(wù)導(dǎo)航為用戶提供了強大的資源揭示功能,用戶可借此功能進行簡單的情報分析,如果沒有此功能,用戶檢索到數(shù)據(jù)后需耗費大量的時間與精力下載、加工、整理數(shù)據(jù),然后利用相關(guān)的數(shù)據(jù)分析工具來得到分析結(jié)果。同時,此功能又方便用戶進行二次選擇,快速找到有用的資源,例如可根據(jù)期刊刊種判斷論文質(zhì)量,對自己的研究會起到更大的作用。而其他類型資源檢索結(jié)果展示可方便用戶在不同的文獻(xiàn)類型之間進行切換,無需回到首頁重新檢索。
2.5.3 檢索結(jié)果排列方式多樣
傳統(tǒng)的檢索結(jié)果排列方式為表格排列,這樣方便用戶需要閱讀大量的文獻(xiàn)題名、作者、機構(gòu)、來源等信息時使用,通過對用戶閱讀習(xí)慣的研究發(fā)現(xiàn)許多用戶比較喜歡如百度式的自然排列方式,因而目前一些專業(yè)數(shù)據(jù)庫也改變以往的數(shù)據(jù)排列方式,選擇自然排列方式。調(diào)查發(fā)現(xiàn),不同類型的用戶習(xí)慣的排列方式不一樣,兩類排列各自都有用戶選擇,甚至同一類用戶在不同的檢索目的下也會采用不同的排列方式進行閱讀。信息平臺為用戶提供了較大的選擇空間,檢索結(jié)果可按列表和自然排列兩種方式,用戶可根據(jù)習(xí)慣或需要自行選擇。列表方式方便用戶閱讀大量文獻(xiàn)時使用,自然排列方式符合用戶自然的閱讀習(xí)慣。
2.5.4 本館館藏滿足快速獲取原文
信息平臺采用元數(shù)據(jù)倉儲技術(shù),大大保證的平臺的查全率,因而用戶檢索到的文獻(xiàn)會存大許多不能直接下載的情況,此時可以通過共建單位傳遞、云傳遞或代查代借三種方式獲取原文。然而通過用戶調(diào)研發(fā)現(xiàn),許多用戶檢索到文獻(xiàn)時希望立刻能夠獲取原文。信息平臺提供本館館藏功能,此功能將用戶檢索結(jié)果中可以直接下載的文獻(xiàn)聚類,此聚類中所有文獻(xiàn)均可直接下載,無需通過原文延遲獲取,滿足對獲取原文具有較高時效性要求的用戶的需求。
3 信息平臺服務(wù)模式研究
信息平臺保留了傳統(tǒng)的信息服務(wù)內(nèi)容,包括期刊論文、學(xué)位論文、會議論文、標(biāo)準(zhǔn)、專利等文獻(xiàn)的原文下載、原文傳遞、代查代檢服務(wù),這是科技信息共享服務(wù)平臺的基礎(chǔ)支撐,必須要充分保證。在此基礎(chǔ)上,信息平臺也探索了新的信息服務(wù)內(nèi)容,包括產(chǎn)業(yè)專題服務(wù)、區(qū)域特色服務(wù)、專業(yè)化服務(wù)。
3.1 產(chǎn)業(yè)專題服務(wù)
信息平臺根據(jù)地方重點產(chǎn)業(yè),追蹤產(chǎn)業(yè)的最新研究熱點,并分類整理入庫,方便用戶直觀了解產(chǎn)業(yè)最新研究熱點。通過對信息平臺各類用戶調(diào)查發(fā)現(xiàn),越來越多的用戶不僅僅滿足于信息平臺提供的簡單檢索、下載原文功能,為其提供專題服務(wù)是信息服務(wù)機構(gòu)要努力的方向。目前信息平臺已建立的產(chǎn)業(yè)專題是湖北省千億產(chǎn)業(yè),包括汽車、食品、機械、電子信息、鋼鐵、石化、紡織、建材。主要對各個產(chǎn)業(yè)的最新研究文獻(xiàn)進行了收錄,方便用戶跟蹤產(chǎn)業(yè)的研究方向。
3.2 區(qū)域協(xié)調(diào)化服務(wù)
為促進全省科技信息全面發(fā)展,省信息平臺采用二級服務(wù)站模式進行推廣服務(wù),即提供全省17個地市州的二級服務(wù)站窗口,聚焦各地市州的區(qū)域動態(tài),這樣為全省科技信息共享打下良好基礎(chǔ)。采用二級服務(wù)站模式進行服務(wù)是符合湖北省省情的,目前以武漢市為首,以宜昌、恩施、荊州為代表的地市州服務(wù)推廣效果都比較顯著,信息服務(wù)是一個循序漸進的過程,今后在服務(wù)推廣上應(yīng)該探討更加合理、更加專業(yè)的服務(wù)推廣模式,例如在二級服務(wù)站模式的基礎(chǔ)之上,以高企、孵化器、大型企業(yè)、中小企業(yè)、科研機構(gòu)、政府機關(guān)等多個角度,各有側(cè)重地推廣,使信息平臺能夠真正深入到省內(nèi)各個企業(yè)的各個科研人員中去。
3.3 專業(yè)化服務(wù)
作為省級專業(yè)的信息服務(wù)平臺,湖北省科技信息共享服務(wù)平臺不僅提供基礎(chǔ)性的科技文獻(xiàn)信息,同時還提供專業(yè)化的定制服務(wù)。包括行業(yè)研究報告、定制報告、委托檢索、科技查新及知識產(chǎn)權(quán)服務(wù)、科技決策咨詢、科技評估等深度服務(wù)內(nèi)容。如行業(yè)研究報告包括市場分析報告、技術(shù)研究報告、政策環(huán)境報告、綜合分析報告等內(nèi)容,滿足企業(yè)、科研機構(gòu)、政府部門的管理決策者、技術(shù)人員等各類情報需求。定制報告則根據(jù)企業(yè)用戶提出的具體定制需求,利用專門工具,可為企業(yè)定制關(guān)于行業(yè)競爭對手、企業(yè)自身狀況、特定技術(shù)領(lǐng)域、單項技術(shù)等的專題分析報告,專題推送。
3.4 個性化推薦服務(wù)
信息平臺具有合理的后臺管理系統(tǒng),將用戶分類明確,包括大型企業(yè)、中小企業(yè)、科研機構(gòu)、政府部門等不同類用戶。大型企業(yè)一般都具備自己的情報部門,因而信息平臺可為大型企業(yè)提供戰(zhàn)略研究、競爭情報、科技查新、科技評估與咨詢、知識產(chǎn)權(quán)等方面的服務(wù),從而為企業(yè)發(fā)展提供戰(zhàn)略性決策指導(dǎo)。針對中小企業(yè),信息平臺不僅為其提供期刊、學(xué)位論文、會議論文、專利、標(biāo)準(zhǔn)、政策法規(guī)等傳統(tǒng)類文獻(xiàn),而且為其提供行業(yè)信息,并為其量身打造了行業(yè)研究報告數(shù)據(jù)庫,解決了中小企業(yè)因資金、人才、資源等所限而無法自己獲取情報信息的困境。面向科研院所,信息平臺可為其提供知識產(chǎn)權(quán)相關(guān)的信息服務(wù)、培訓(xùn)、咨詢等內(nèi)容。針對政府機關(guān),信息平臺可為其提供全局性、深層次、科學(xué)化,比較宏觀的統(tǒng)計數(shù)據(jù)與研究報告,方便用戶宏觀把握其所關(guān)注的內(nèi)容。
總之,針對不同用戶提供個性化的服務(wù),要基于用戶分類、用戶行為研究的基礎(chǔ)之上,根據(jù)用戶的行為軌跡分析其所關(guān)注的內(nèi)容,定期為其推送信息服務(wù)內(nèi)容。
4 信息平臺服務(wù)發(fā)展方向
信息平臺采用元數(shù)據(jù)倉儲技術(shù),實現(xiàn)統(tǒng)一跨庫檢索,具有多種個性化的功能,然而要適應(yīng)新的服務(wù)模式還需要進一步完善。首先是個性化推薦實現(xiàn)智能化,目前的個性化推薦還基于人工分析用戶行為軌跡,今后應(yīng)該建立一種高級智能平臺,基于少量數(shù)據(jù)挖掘技術(shù),由系統(tǒng)智能完成對用戶的個性化決策支持和信息服務(wù)。其次是實現(xiàn)移動終端隨時隨地獲取文獻(xiàn),如今用戶更傾向于使用移動終端學(xué)習(xí)與工作,開發(fā)信息平臺移動終端是迫在眉睫的,然而如何開發(fā)簡單適用、符合用戶習(xí)慣、滿足個性化推送、方便進行用戶管理等也是下一步必須探討的。第三,實現(xiàn)更加專業(yè)化的產(chǎn)業(yè)追蹤功能,建立產(chǎn)業(yè)專題是一項任務(wù)艱巨的課題,目前信息平臺已進行了初步的探索,今后還應(yīng)深入完善產(chǎn)業(yè)專題內(nèi)容,例如建立更多的產(chǎn)業(yè)專題庫,根據(jù)地方特色打造不同區(qū)域的行業(yè)專題,為各個專題建立更加科學(xué)合理的子類目等。
參考文獻(xiàn)
1 陳甜遠(yuǎn).大數(shù)據(jù)時代的高校信息管理中心對策[J].網(wǎng)絡(luò)地帶,2013(8)
2 陳豫等.大數(shù)據(jù)影響科技信息工作未來的大背景[N].中國航空報,2012 -12-18
3 覃鳳蘭.個性化服務(wù)高校圖書館服務(wù)的新舉措[J].情報雜志,2005(7)
4 丁梅.大數(shù)據(jù)時代云平臺與大容量存儲——以湖北省科技信息共享服務(wù)平臺部署為例[J].軟件導(dǎo)刊,2014(5)
5 夏浩,李瑞雪.如何基于無數(shù)據(jù)倉儲技術(shù)構(gòu)建數(shù)字圖書館統(tǒng)一檢索平臺[J].科技創(chuàng)新導(dǎo)報,2014(14)
關(guān)鍵詞:大數(shù)據(jù);科研管理;數(shù)據(jù)處理
一、大數(shù)據(jù)技術(shù)引入高??蒲泄芾碇械膬?yōu)勢
大數(shù)據(jù)技術(shù)是現(xiàn)代多種信息技術(shù)的有效結(jié)合,具有相當(dāng)?shù)膬?yōu)越性。從科研管理的角度來看,大數(shù)據(jù)技術(shù)通過針對科研管理系統(tǒng)、財務(wù)系統(tǒng)、人事系統(tǒng)以及基于互聯(lián)網(wǎng)的大型科技文獻(xiàn)數(shù)據(jù)庫、專利庫等數(shù)據(jù)資源的關(guān)聯(lián)分析,找出數(shù)據(jù)的相關(guān)性,提取有價值的信息,可以為傳統(tǒng)專家定性決策管理提供廣泛、科學(xué)的理論依據(jù)。由于這些知識大 多直接來源于數(shù)據(jù)庫內(nèi)部,因此它較少受外部資源的限制和影響,具有相對的獨立性,對于科研決策的指導(dǎo)意義也較為重大。
二、大數(shù)據(jù)環(huán)境下的高??蒲泄芾硇畔⒒膽?yīng)用探索
(一) 為高??蒲性u估提供數(shù)據(jù)支持
隨著高校信息化的推進以及大型科技文獻(xiàn)、專利、論文數(shù)據(jù)庫系統(tǒng)等在科學(xué)研究領(lǐng)域的普及,全球范圍內(nèi)的科技數(shù)據(jù)信息量急劇增加。面對這些龐大、繁雜的原始數(shù)據(jù),需要快捷、有效的技術(shù)手段進行篩選,并從中獲得有價值的知識。
傳統(tǒng)的數(shù)據(jù)分析和統(tǒng)計方法,由于受到人力,物力及財力的限制,原始數(shù)據(jù)背后隱藏的深層次知識無法得以有效采集、分析和使用。
而大數(shù)據(jù)技術(shù)可以綜合內(nèi)部、外部以及網(wǎng)絡(luò)數(shù)據(jù)資料:從學(xué)??蒲泄芾聿块T獲得研究項目的類別和數(shù)量;從內(nèi)部數(shù)據(jù)庫得到人員、經(jīng)費、設(shè)備等信息;從網(wǎng)絡(luò)數(shù)據(jù)庫中獲得論文、專利的數(shù)量和質(zhì)量信息;結(jié)合往年項目成果報表中獲獎、專利成果轉(zhuǎn)讓情況,最終綜合集成各類數(shù)據(jù)。通過建立綜合數(shù)據(jù)評估模型將各類指標(biāo)進行整合,為科研評估的專家提供數(shù)據(jù)支持,最終得出科學(xué)、合理的評估結(jié)果。
(二)提升項目立項決策的科學(xué)性
從篩選項目角度看,可以利用大數(shù)據(jù)技術(shù),對項目的研究領(lǐng)域、預(yù)期成果,通過與外部文獻(xiàn)庫進行結(jié)合分析的方法檢驗課題的科學(xué)性、創(chuàng)新性,判斷得出該項目立項的必要性;從篩選申請者角度看,可以將申請者所涉及的各項因素進行多數(shù)據(jù)的聯(lián)合查詢和分析,發(fā)現(xiàn)并建立科學(xué)的指標(biāo)體系和篩選方法,最終得到候選人名單,從而達(dá)到提升項目立項決策的科學(xué)性的目的。
( 三) 為教師科研活動提供深層次服務(wù)
以科研人員欲向某單位進行項目申請為例。以往,科研人員只能夠通過自身了解或者往年申報情況對對方單位的需求進行分析,由于個人收集的信息不夠全面、不夠準(zhǔn)確以及信息傳遞的滯后性等問題,容易出現(xiàn)研究目標(biāo)偏離實際需求的問題,申報結(jié)果往往不夠理想。而隨著大數(shù)據(jù)技術(shù)的普及,通過對大型數(shù)據(jù)倉庫進行有效的挖掘,可以對相關(guān)單位所關(guān)注的關(guān)鍵技術(shù)、重點領(lǐng)域和發(fā)展方向進行分析和預(yù)測。通過建立模型、 數(shù)據(jù)可視化和生成文本報告等形式向科研人員提供可參考信息,了解各種影響之間的內(nèi)在聯(lián)系,指導(dǎo)科研人員開展研究工作, 達(dá)到為科研人員提供深層次服務(wù)的目的。
(四)優(yōu)化科研資源配置
第一,對數(shù)據(jù)進行采集和篩選,建立不同種類的數(shù)據(jù)庫,例如人員庫、 成果庫等;第二,建立適合本校的科學(xué)發(fā)展的評判模型,包括各類科研資源、科研成果的計算參數(shù)和規(guī)則庫;第三,以定量化績效考核作為基礎(chǔ)的資源配置工具和決策支持管理工具,以此通過大數(shù)據(jù)技術(shù)完成對學(xué)校科研資源的優(yōu)化配置。
三、大數(shù)據(jù)環(huán)境下提升高??蒲泄芾硇畔⒒降姆椒?/p>
(一) 加強數(shù)據(jù)采集基礎(chǔ)建設(shè)
高校應(yīng)當(dāng)采用先進、穩(wěn)定的技術(shù)確保數(shù)據(jù)的快速傳輸與儲存,選擇合適的綜合布線技術(shù)和設(shè)備,為數(shù)據(jù)儲存提供良好的基礎(chǔ)設(shè)施。面向未來數(shù)據(jù)爆炸式的增長,可以考慮采用FTYO模式,該模式的特點是帶寬大、速度快、節(jié)省成本和能源、減少電磁干擾。數(shù)據(jù)存儲中心的建設(shè)應(yīng)考慮虛擬化和云平臺,保證數(shù)據(jù)傳遞的速度與準(zhǔn)確度。
(二) 加強科研管理團隊建設(shè)
由于高??蒲泄芾矸矫娴南嚓P(guān)數(shù)據(jù)種類多樣且體量龐大,管理人員在平時就應(yīng)當(dāng)注意對這些數(shù)據(jù)的收集、整理工作。收集的數(shù)據(jù)可以方便管理人員及科研人員進行查詢,但是廣泛的原始數(shù)據(jù)往往來源多樣、良莠不齊??蒲泄芾砣藛T應(yīng)當(dāng)對所獲得數(shù)據(jù)的質(zhì)量進行評價,評估數(shù)據(jù)來源是否可靠、數(shù)據(jù)的收集方法是否科學(xué)、數(shù)據(jù)是否具有時效性等等,然后對數(shù)據(jù)進行校核,除去冗雜的干擾性的數(shù)據(jù),要注意清理或改正誤差數(shù)據(jù),最后將數(shù)據(jù)轉(zhuǎn)化為可共享的標(biāo)準(zhǔn)化信息??蒲泄芾砣藛T應(yīng)當(dāng)利用大數(shù)據(jù)技術(shù)深度挖掘原始數(shù)據(jù)背后具有啟示意義的信息,為管理層今后做出科學(xué)合理的決策提供依據(jù)。
(三) 改變科研管理理念
在大數(shù)據(jù)環(huán)境下,傳統(tǒng)的科研管理理念無法保證高??蒲惺聵I(yè)的健康發(fā)展, 因此需要我們有所改變。 首先, 在大數(shù)據(jù)趨勢下,信息挖掘要前傾,要從數(shù)據(jù)中來分析社會、國家的需求,使得科研目標(biāo)更有價值、更有針對性。其次,在大數(shù)據(jù)趨勢下,服務(wù)要前移,不能像過去那樣等著科研人員來要數(shù)據(jù)、 要結(jié)果。 而是應(yīng)該充分利用數(shù)據(jù)并且對數(shù)據(jù)進行分析、挖掘,掌握科研人員可能需要哪些數(shù)據(jù)或者結(jié)論,把服務(wù)工作前移。
(四) 推進數(shù)據(jù)的共享及利用
在大數(shù)據(jù)環(huán)境下,科研數(shù)據(jù)量激增,科學(xué)研究越來越依賴于系統(tǒng)的、高可信度的基礎(chǔ)科學(xué)數(shù)據(jù)分析。當(dāng)前全球科技活動不斷增強,一系列重大科學(xué)工程的興起、復(fù)雜科學(xué)問題的提出、大型科學(xué)研究計劃的產(chǎn)生,導(dǎo)致前所未有的國際合作局面的產(chǎn)生,也導(dǎo)致了全球范圍內(nèi)對科技資源交流、互通的客觀需求。因此,科研管理人員應(yīng)針對大數(shù)據(jù)技術(shù)體量大、數(shù)據(jù)來源豐富、數(shù)據(jù)更新速度快等特點,積極推進科研數(shù)據(jù)的共享、利用工作,以達(dá)到提升科研管理的水平。
結(jié)束語
高??蒲泄芾砉ぷ鞯馁|(zhì)量水平?jīng)Q定著高??蒲泄ぷ魇欠衲軌蛴行А㈨樌亻_展。隨著信息化技術(shù)的飛速發(fā)展,相應(yīng)地推動了大數(shù)據(jù)技術(shù)的拓展。人類通過使用大數(shù)據(jù)的交換、整合和分析這一過程,從而發(fā)現(xiàn)新的知識,實現(xiàn)新的管理、創(chuàng)造出新的價值。高??蒲泄芾硎切畔⒒瘧?yīng)用的前沿領(lǐng)域,應(yīng)當(dāng)具有可能依托大數(shù)據(jù)技術(shù)提升管理與決策的水平。
參考文獻(xiàn):
關(guān)鍵詞:大數(shù)據(jù)時代 數(shù)字圖書館 機遇與挑戰(zhàn)
中圖分類號:G25 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2016)10(b)-0150-02
在科學(xué)技術(shù)的影響下,學(xué)術(shù)資源建設(shè)速度越來越快。例如:中國最大的學(xué)術(shù)資源建設(shè)商――中國知網(wǎng),已經(jīng)從期刊論文向國內(nèi)外期刊論文發(fā)展,在圖書資源收藏方面收集了大量資源,可以給行業(yè)機構(gòu)、學(xué)術(shù)等提供大量文獻(xiàn)。在此種發(fā)展形式下,數(shù)字圖書館承受了較大壓力,如何在未來發(fā)展中更好生存,已經(jīng)成為人員研究的主要問題,必須及時對其進行分析。
1 國內(nèi)外研究與啟示
1.1 國內(nèi)外相關(guān)論述對我國的影響
隨著大數(shù)據(jù)時代的到來,人們對數(shù)據(jù)的需求量不斷增大。目前國外相關(guān)研究已經(jīng)從理念、技術(shù)和數(shù)據(jù)等方面進行了很多研究。美國加州大學(xué)伯克利分校圖書館的Huwe在《構(gòu)建數(shù)字D書館》一書中明確指出,大數(shù)據(jù)與數(shù)字化圖書館的發(fā)展方向吻合,可以借助數(shù)字圖書館進行信息采集和收集,進而挖掘用戶行為,幫助人們了解閱讀行為與信息的聯(lián)系。Borgman等人將嵌入式技術(shù)成功安裝于數(shù)字圖書館系統(tǒng)中,增加了數(shù)字圖書館功能,可以實現(xiàn)圖書分類、收集處理和關(guān)聯(lián)等各項操作,促進了數(shù)字圖書館與網(wǎng)絡(luò)技術(shù)的融合,發(fā)揮了大數(shù)據(jù)的作用。
國內(nèi)研究人員曾建勛曾在《數(shù)字圖書館論壇》中明確指出,大數(shù)據(jù)時代將數(shù)據(jù)數(shù)字圖書館數(shù)據(jù)管理、收集等服務(wù)的深層次發(fā)展,對數(shù)字圖書館人員提出了較高要求。另外武漢大學(xué)生陳傳夫等也從理念、發(fā)展知識和財政投入機制等,分析了圖書館素質(zhì)等問題,并提出了相關(guān)應(yīng)對措施。
從上述研究均可看出大數(shù)據(jù)對數(shù)字圖書館帶來的發(fā)展機遇和挑戰(zhàn),促進了數(shù)字圖書館和大數(shù)據(jù)的融合。為了促進高校圖書館和我國公共圖書館在大數(shù)據(jù)時代的發(fā)展,發(fā)揮數(shù)字圖書館在人們的生活或科學(xué)研究中的作用,必須深入思考,及時轉(zhuǎn)變觀念,提高數(shù)字圖書館的競爭力。
1.2 啟示與思考
從當(dāng)前的發(fā)展?fàn)顩r來看,學(xué)術(shù)資源建設(shè)商已經(jīng)在大數(shù)據(jù)時代取得了很大進展,不僅包含網(wǎng)絡(luò)資源與期刊,還涉及各種文獻(xiàn)資源,可以查找作者、文獻(xiàn)關(guān)系與學(xué)者等關(guān)系,給數(shù)字圖書館的發(fā)展帶來了很大壓力。所以圖書館相關(guān)人員必須提高思想認(rèn)識,將資源建設(shè)商帶來的威脅作為新的機遇。在實際工作中,必須積極吸取圖書館建設(shè)資源,擴展圖書館資源范疇,進行各種資源的有機結(jié)合,同時還要充分發(fā)揮資源價值,促使各種資源的整合,深入挖掘數(shù)據(jù)規(guī)律,認(rèn)真分析數(shù)據(jù)規(guī)律,發(fā)現(xiàn)數(shù)據(jù)潛在價值。從服務(wù)角度上分析,圖書館還要向眾多資源建設(shè)商學(xué)習(xí),從用戶角度探索問題,給用戶提供人性化服務(wù),滿足用戶對資源的需求。
經(jīng)過分析發(fā)現(xiàn),大數(shù)據(jù)時代,必須要改變傳統(tǒng)的思維模式,形成適合數(shù)字圖書館發(fā)展的模式,適應(yīng)大數(shù)據(jù)時代的發(fā)展,充分利用大數(shù)據(jù)促進數(shù)字圖書館的發(fā)展,讓數(shù)字圖書館在人們的生活、學(xué)習(xí)和工作中發(fā)揮更大作用。
2 淺析數(shù)字圖書館的大數(shù)據(jù)思維
數(shù)字圖書館的大數(shù)據(jù)思維主要表示從大數(shù)據(jù)角度思考并分析數(shù)字圖書館發(fā)展中存在的問題,實現(xiàn)數(shù)字圖書館和大數(shù)據(jù)時代的有機融合,增加數(shù)字圖書館產(chǎn)品種類,提高數(shù)字圖書館服務(wù)水平。
2.1 建設(shè)數(shù)字圖書館資源
第一,擴大數(shù)字圖書館資源范圍。資源是數(shù)字圖書館發(fā)展的基礎(chǔ),也是提高數(shù)字圖書館服務(wù)質(zhì)量的主要方法。在長期發(fā)展中,圖書館非常重視資源建設(shè),主要是圖書、期刊及學(xué)位論文等資源。為了在大數(shù)據(jù)時代下發(fā)展,必須創(chuàng)新思維,引入一些數(shù)據(jù)庫資源或一些社會熱點信息等內(nèi)容,以用戶的搜索習(xí)慣作為數(shù)字圖書采集參考,深入挖掘各種數(shù)據(jù)之間的聯(lián)系,實現(xiàn)可再生資源的生產(chǎn)、收集和儲存,擴大數(shù)字圖書資源范圍。第二,提高數(shù)字圖書館資源整合度。大數(shù)據(jù)時代的主要特點是數(shù)據(jù)類型較復(fù)雜,單純的文本信息已經(jīng)不能被大數(shù)據(jù)時展用戶吸取,可以實現(xiàn)資源整合向綜合信息服務(wù)轉(zhuǎn)變。為了滿足不同用戶的需求,還可以實現(xiàn)文獻(xiàn)和政府等信息的整合,擴大社會資源和數(shù)字圖書館的聯(lián)系,將公眾最關(guān)注的問題引入到社會資源整合中。第三,加強數(shù)字圖書館資源加工深度。在大數(shù)據(jù)時代,雖然數(shù)字圖書館結(jié)構(gòu)信息具有較強的表現(xiàn)形式,但主要體現(xiàn)在資源庫內(nèi)部。在大數(shù)據(jù)時代下,必須及時擴展數(shù)字資源和外界的聯(lián)系,構(gòu)建全社會數(shù)字圖書館資源架構(gòu)。同時進行圖書館資源深度加工時,必須從知識結(jié)構(gòu)向知識建構(gòu)加工方向發(fā)展。例如:從圖書館文獻(xiàn)資源中分析知識結(jié)構(gòu),利用知識單位和文獻(xiàn)建立知識建構(gòu),形成新知識。
2.2 靈活應(yīng)用數(shù)字圖書館技術(shù)
大數(shù)據(jù)時代,數(shù)字圖書館技術(shù)已經(jīng)開始從處理局部數(shù)據(jù)向更廣的區(qū)域發(fā)展。從圖書館技術(shù)體系分析主要進行信息處理、組織架構(gòu)、分析預(yù)測、服務(wù)技術(shù)等操作。
第一,應(yīng)用語義技術(shù)。大數(shù)據(jù)環(huán)境中可以采用語義實現(xiàn)復(fù)雜數(shù)據(jù)的聯(lián)系。當(dāng)前數(shù)字圖書面臨的主要問題是將語義加入數(shù)字文獻(xiàn)信息中。所以必須將本體技術(shù)、人工智能等先進技術(shù)應(yīng)用到實際工作中,讓數(shù)據(jù)間形成語義關(guān)系,促進收錄資源和知識挖掘等各項操作。目前語義技術(shù)已經(jīng)廣泛應(yīng)用到圖書領(lǐng)域中,如:漢語主題詞表、圖書分類法等均是依靠語義發(fā)展起來的。知識相互間的語義關(guān)系,不僅可以幫助用戶及時獲取知識,還可以獲得有用知識途徑。第二, 數(shù)據(jù)聚類技術(shù)。數(shù)據(jù)聚類是實現(xiàn)信息相互聚集的過程。在繁雜的數(shù)據(jù)中,只有靈活應(yīng)用聚類技術(shù),才能發(fā)揮信息服務(wù)、處理等各種功能。在大數(shù)據(jù)背景下,利用數(shù)據(jù)聚類可將不同數(shù)據(jù)劃分成相互聯(lián)系、主體相近的小數(shù)據(jù),給用戶信息檢索、選擇和分析提供很大方便,給用戶個性化服務(wù)提供了數(shù)據(jù)支持。第三,信息分析技術(shù)。大數(shù)據(jù)時代可以充分利用信息分析技術(shù)??梢詫⒋髷?shù)據(jù)技術(shù)融入到書籍圖書館中,拓展了數(shù)據(jù)分析工作,給用戶提供了高端服務(wù)。例如:聯(lián)機分析技術(shù)可給在線用戶提供數(shù)據(jù)支持;定量定性分析技術(shù)可以在數(shù)字圖書館中得到充分應(yīng)用。
2.3 數(shù)字圖書館的定位
第一,打破傳統(tǒng)資源框架束縛。大數(shù)據(jù)給圖書館提供了較廣闊的發(fā)展空間,滿足了用戶對不同信息的需求,在信息采集、收集和服務(wù)等方面均發(fā)生了變化。數(shù)字圖書館進行定位時,必須打破傳統(tǒng)資源框架,將數(shù)據(jù)理念融于到數(shù)字圖書館建設(shè)中,所以不僅要采用傳統(tǒng)的方法進行信息采集,還要進行網(wǎng)絡(luò)信息自動獲取,構(gòu)建語義關(guān)系、數(shù)據(jù)聯(lián)系等信息組織框架。
第二,建立全方位服務(wù)信息。傳統(tǒng)圖書館主要進行文獻(xiàn)服務(wù)。數(shù)字化圖書館服務(wù)資源發(fā)生了變化,服務(wù)形式開始從被動化向主動化發(fā)展。一方面向全社會提供服務(wù);另一方面,提供全新資源服務(wù);最后不斷擴展服務(wù)與傳播方式,全面擴展數(shù)字圖書館服務(wù)。
第三,定位數(shù)字圖書館員。大數(shù)據(jù)時代對圖書館員提出了更高要求,每館員都要有敏銳的數(shù)據(jù)分析能力;及時了解學(xué)術(shù)變化;掌握大數(shù)據(jù)分析技術(shù);熟練使用各種數(shù)據(jù)分析工具和軟件,準(zhǔn)確定位網(wǎng)絡(luò)資源,促進數(shù)字圖書館的發(fā)展。
3 結(jié)語
大數(shù)據(jù)時代給數(shù)字圖書館帶來了挑戰(zhàn),是數(shù)字圖書館的一種巨大轉(zhuǎn)型,可以擴展數(shù)字圖書館數(shù)據(jù)資源,提高數(shù)字圖書館服務(wù)功能;同時,還要不斷思考資源框架、技術(shù)應(yīng)用模式和服務(wù)功能,與廣大學(xué)術(shù)資源建設(shè)商共同發(fā)展。
參考文獻(xiàn)