發(fā)布時(shí)間:2023-03-21 17:09:54
序言:寫(xiě)作是分享個(gè)人見(jiàn)解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了8篇的數(shù)據(jù)信息論文樣本,期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā),請(qǐng)盡情閱讀。
城市軌道交通信號(hào)系統(tǒng)的DCS網(wǎng)絡(luò)包含有線部分和無(wú)線部分。有線網(wǎng)絡(luò)部分是指軌旁設(shè)備之間的數(shù)據(jù)通信,為信號(hào)系統(tǒng)提供專(zhuān)用有線信息傳輸,為控制中心、車(chē)站、場(chǎng)段之間提供有線傳輸通道,建立局域網(wǎng)連接。無(wú)線部分主要是列車(chē)上的移動(dòng)無(wú)線設(shè)備和地面軌旁無(wú)線單元之間建立的車(chē)地雙向通信。如上所述,在信號(hào)系統(tǒng)的DCS網(wǎng)絡(luò)中,可以根據(jù)不同的組網(wǎng)方式,構(gòu)建不同的網(wǎng)絡(luò)結(jié)構(gòu),形成連接信號(hào)系統(tǒng)相關(guān)設(shè)備的通信網(wǎng)。而在這樣的網(wǎng)絡(luò)中,傳遞的信息就包含大量的管理信息、行車(chē)數(shù)據(jù)信息、ATS信息、維護(hù)信息、數(shù)據(jù)記錄信息等。DCS系統(tǒng)網(wǎng)絡(luò)連接設(shè)備一般連接方式需要說(shuō)明的是DCS網(wǎng)絡(luò)結(jié)構(gòu)是多樣的,隨著實(shí)際地鐵線路情況、所連接的設(shè)備情況、以及技術(shù)發(fā)展和應(yīng)用情況有不同變化。從圖1中可以看出,信號(hào)系統(tǒng)DCS網(wǎng)絡(luò)具有連接設(shè)備類(lèi)型多、數(shù)量大,信息傳輸種類(lèi)繁多的特點(diǎn)。如果在DCS網(wǎng)絡(luò)中信息沒(méi)有合理的傳輸定義,使網(wǎng)絡(luò)中任何一個(gè)數(shù)據(jù)幀的傳輸都要遍及整個(gè)網(wǎng)絡(luò),導(dǎo)致所有與網(wǎng)絡(luò)連接的設(shè)備都接收到,這樣就會(huì)嚴(yán)重的消耗掉網(wǎng)絡(luò)整體帶寬。因此,在DCS網(wǎng)絡(luò)傳輸信息量較大時(shí)(如早、晚運(yùn)行高峰時(shí)等),如不對(duì)網(wǎng)絡(luò)進(jìn)行合理設(shè)置,就可能產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。網(wǎng)絡(luò)風(fēng)暴發(fā)生時(shí),與網(wǎng)絡(luò)連接的部分設(shè)備也可能會(huì)由于無(wú)法應(yīng)對(duì)網(wǎng)絡(luò)流量的大幅波動(dòng)導(dǎo)致故障,進(jìn)而引發(fā)故障面擴(kuò)大的情況發(fā)生,對(duì)運(yùn)營(yíng)產(chǎn)生嚴(yán)重影響,這就需要對(duì)網(wǎng)絡(luò)中的信息傳輸進(jìn)行合理優(yōu)化。
2VLAN技術(shù)特點(diǎn)及在DCS網(wǎng)絡(luò)中的應(yīng)用
VLAN技術(shù)是將局域網(wǎng)設(shè)備從邏輯上劃分成一個(gè)個(gè)網(wǎng)段,從而實(shí)現(xiàn)虛擬工作組數(shù)據(jù)交換。由于VLAN設(shè)置是在交換機(jī)上按邏輯來(lái)劃分,而不是傳統(tǒng)上的只能從物理上劃分,因此VLAN技術(shù)的出現(xiàn),可以滿(mǎn)足根據(jù)實(shí)際應(yīng)用情況,將同一物理局域網(wǎng)內(nèi)不同用戶(hù)邏輯地劃分成不同的廣播域需求。在設(shè)計(jì)VLAN并實(shí)現(xiàn)應(yīng)用時(shí),首先要確定如何劃分VLAN。較為常見(jiàn)的VLAN劃分方式包括:按照端口劃分,按照MAC地址劃分、基于網(wǎng)絡(luò)層劃分、以及基于IP廣播和基于規(guī)則等方式。其中應(yīng)用最為廣泛、也是最有效的,是按照端口劃分的方式,這種劃分方式是根據(jù)以太網(wǎng)交換機(jī)的交換端口來(lái)劃分的,將交換機(jī)上的物理端口分為若干個(gè)組,每個(gè)組構(gòu)成一個(gè)虛擬網(wǎng)。由于基于端口劃分VLAN的優(yōu)點(diǎn)是定義VLAN成員非常簡(jiǎn)單,只要在接入交換機(jī)上進(jìn)行相關(guān)設(shè)置即可,操作相對(duì)簡(jiǎn)單,適合任何大小的網(wǎng)絡(luò)。同時(shí),這種配置方式適用于網(wǎng)絡(luò)環(huán)境比較固定的情況,與DCS網(wǎng)絡(luò)構(gòu)建后即在運(yùn)營(yíng)中不會(huì)輕易改變的實(shí)際情況較為符合,因此在地鐵信號(hào)系統(tǒng)DCS網(wǎng)絡(luò)交換機(jī)的配置中,一般都可以使用按照端口劃分VLAN的配置方式。以赫斯曼交換機(jī)為例,按照端口劃分VLAN,為不同端口賦予不同ID后的界面顯示情況綜上所述,為了有效避免信號(hào)系統(tǒng)DCS網(wǎng)絡(luò)風(fēng)暴的發(fā)生,可以將交換機(jī)端口劃分到不同VLAN中。其原理為:在不同端口發(fā)出的所有數(shù)據(jù)幀上增加一個(gè)代表所屬VLAN編號(hào)的ID,各個(gè)交換機(jī)端口只有在接收到所屬VLANID的信息時(shí),才會(huì)對(duì)該信息進(jìn)行拆分處理,而在收到標(biāo)有其他VLANID信息時(shí),只會(huì)將該信息按照目的地址進(jìn)行轉(zhuǎn)發(fā)。這樣就實(shí)現(xiàn)了通過(guò)在DCS網(wǎng)絡(luò)交換機(jī)上應(yīng)用VLAN技術(shù),有效控制網(wǎng)絡(luò)流量、降低網(wǎng)絡(luò)風(fēng)暴發(fā)生概率的目標(biāo)。并且通過(guò)在交換機(jī)上進(jìn)行VLAN的劃分,可以起到減少項(xiàng)目建設(shè)的設(shè)備投資成本、簡(jiǎn)化DCS網(wǎng)絡(luò)管理、提高網(wǎng)絡(luò)安全性的作用。這里需要提出的是,有必要找到適合于信號(hào)DCS網(wǎng)絡(luò)的劃分原則,結(jié)合實(shí)際應(yīng)用情況,將不同級(jí)別的信息進(jìn)行合理區(qū)分。
3適用于DCS的VLAN劃分原則
由于地鐵信號(hào)系統(tǒng)DCS網(wǎng)絡(luò)具有連接設(shè)備數(shù)量、類(lèi)型較多,信息傳輸種類(lèi)繁多的特點(diǎn),在按照端口劃分的VLAN配置方法對(duì)信號(hào)DCS網(wǎng)絡(luò)交換機(jī)等進(jìn)行配置時(shí),需要尋找到合適的原則,將信號(hào)系統(tǒng)DCS網(wǎng)絡(luò)中不同設(shè)備、不同信息類(lèi)型進(jìn)行全網(wǎng)的統(tǒng)一配置,既能有效避免網(wǎng)絡(luò)風(fēng)暴,又有利于維護(hù)人員進(jìn)行維修檢查。這就需要根據(jù)網(wǎng)絡(luò)端口是否有用、該端口在網(wǎng)絡(luò)中的作用、所傳輸?shù)男畔?nèi)容和特點(diǎn)等特征,將網(wǎng)絡(luò)端口有序劃分。例如,在網(wǎng)絡(luò)的列車(chē)自動(dòng)控制(ATC)信息、列車(chē)自動(dòng)監(jiān)控(ATS)信息、維護(hù)管理信息等帶有不同功能及目地的信息,劃分到不同的VLAN中。在信息有效傳輸?shù)耐瑫r(shí),也可以提高網(wǎng)絡(luò)的安全性能。建議按照以下原則進(jìn)行層層劃分。
1)由于信號(hào)系統(tǒng)涉及列車(chē)行車(chē)安全,因此可先將交換機(jī)上多余端口統(tǒng)一劃入“無(wú)用端口”的VLAN中,這樣即使有其他設(shè)備接入到該端口上,也不會(huì)對(duì)有用端口間的網(wǎng)絡(luò)通信造成影響。
2)進(jìn)一步將有用端口進(jìn)行分類(lèi),如該端口在信號(hào)DCS網(wǎng)絡(luò)中只做收發(fā),不對(duì)信息進(jìn)行拆分和處理,即可將其劃入“管理類(lèi)”的VLAN中。
3)在DCS網(wǎng)絡(luò)中,與“管理類(lèi)”信息對(duì)應(yīng)的是“業(yè)務(wù)類(lèi)”信息,在此類(lèi)信息中,建議先將涉及到列車(chē)控制安全的ATC信息獨(dú)立劃分出來(lái),同時(shí)由于此類(lèi)信息較為重要,需設(shè)計(jì)兩路,可以劃分至兩個(gè)不同的VLAN中。
4)另外,“業(yè)務(wù)類(lèi)”信息還包含其他非ATC信息,也就是非安全信息。對(duì)這類(lèi)信息的劃分,首先將其中的ATS信息獨(dú)立劃分出來(lái),同樣建議為兩路。
5)同時(shí),非安全類(lèi)的信息也包含維護(hù)管理類(lèi)信息,如維護(hù)支持、電源監(jiān)控類(lèi)等信息也需要?jiǎng)澐值絾为?dú)一個(gè)VLAN中,此類(lèi)信息可以不進(jìn)行冗余設(shè)置。
6)其他非安全類(lèi)信息也可以通過(guò)實(shí)際情況進(jìn)行VLAN設(shè)置,可以獨(dú)立VLAN,也可統(tǒng)一劃入一個(gè)VLAN,根據(jù)實(shí)際情況進(jìn)行設(shè)置即可。建議的VLAN劃分原則,以及該原則對(duì)應(yīng)在信號(hào)系統(tǒng)中的傳輸內(nèi)容示意。
4總結(jié)
關(guān)鍵詞:信息技術(shù)教育。
信息技術(shù)教育的主要目的是讓學(xué)生在了解計(jì)算機(jī)文化、初步掌握一些計(jì)算機(jī)基本知識(shí)和技能的同時(shí),進(jìn)一步激發(fā)學(xué)生的學(xué)習(xí)興趣、增強(qiáng)信息意識(shí)和創(chuàng)新意識(shí)、有效培養(yǎng)學(xué)生對(duì)信息的收集、處理、應(yīng)用和傳輸?shù)哪芰?,培養(yǎng)學(xué)生的自學(xué)能力和創(chuàng)造能力,在開(kāi)發(fā)智力、實(shí)現(xiàn)學(xué)生信息素質(zhì)和創(chuàng)造素質(zhì)的教育。教學(xué)中要時(shí)刻注意信息技術(shù)教學(xué)不僅僅是傳授計(jì)算機(jī)的基礎(chǔ)知識(shí),更不能像社會(huì)上片面追?quot;學(xué)而致用"的職業(yè)培訓(xùn),而應(yīng)把計(jì)算機(jī)作為一種現(xiàn)代化工具,來(lái)提高學(xué)生的綜合素質(zhì),培養(yǎng)他們用信息技術(shù)手段來(lái)解決問(wèn)題的各種能力。
那么,怎樣才能做好信息技術(shù)課的教學(xué)呢?信息技術(shù)教學(xué)可分為三層臺(tái)階:一、理論課教學(xué),二、上機(jī)課教學(xué),三、課外實(shí)踐。所謂理論課教學(xué)主要內(nèi)容是課程的引入、基本知識(shí)與基本技能;上機(jī)課教學(xué)主要內(nèi)容是讓學(xué)生在鞏固性練習(xí)中,掌握知識(shí),形成技能;課外實(shí)踐主要內(nèi)容是教會(huì)學(xué)生如何將信息技術(shù)應(yīng)用到實(shí)際中去。理論課教學(xué)是前提,上機(jī)課教學(xué)是手段,課外實(shí)踐教學(xué)是根本。下面結(jié)合自己的教學(xué)實(shí)際,談?wù)勅绾翁ず眠@三層"臺(tái)階"。
一、理論課教學(xué)
1、上好第一節(jié)信息技術(shù)課。
俗話說(shuō):良好的開(kāi)端是成功的一半。教師為學(xué)生上的第一節(jié)信息技術(shù)課要結(jié)合典型事例(最好輔以相應(yīng)的多媒體演示)使學(xué)生對(duì)計(jì)算機(jī)的發(fā)展、應(yīng)用有一個(gè)比較系統(tǒng)、全面的了解,并從中感悟到學(xué)習(xí)信息技術(shù)的重要性,激發(fā)出學(xué)習(xí)的欲望,明確學(xué)習(xí)任務(wù)。在此基礎(chǔ)上,要讓學(xué)生明白:為了最大限度地利用有限課時(shí),一方面教師對(duì)學(xué)習(xí)內(nèi)容和學(xué)習(xí)目標(biāo)要做精心的設(shè)計(jì)和安排;另一方面,還需要他們?cè)鯓拥拿芮信浜系鹊龋寣W(xué)生有一個(gè)必要的心理準(zhǔn)備,為今后的學(xué)習(xí),尤其是上機(jī)課能充分利用好45分鐘開(kāi)個(gè)好頭。
2、課堂教學(xué)應(yīng)以能力的培養(yǎng)為主。
對(duì)于新的課程內(nèi)容,只要學(xué)生能自學(xué)弄明白的問(wèn)題,教師就不要用講授的方式進(jìn)行教學(xué)。教師可以設(shè)計(jì)出層次分明的思考題,引導(dǎo)學(xué)生認(rèn)真閱讀教材,用"自己學(xué)得"的知識(shí)解決"實(shí)際問(wèn)題",并提供讓學(xué)生"各抒已見(jiàn)"的機(jī)會(huì)。最后教師再通過(guò)課堂小結(jié)使教學(xué)內(nèi)容系統(tǒng)化、完整化。而對(duì)于新技術(shù)、新名詞的教學(xué),則要鼓勵(lì)學(xué)生大膽的設(shè)想與追蹤。從而培養(yǎng)學(xué)生的自習(xí)能力、綜合能力、創(chuàng)新能力。
3、利用多媒體教學(xué)手段,提高教學(xué)效率。
多媒體教學(xué)構(gòu)建了新型的教學(xué)模式,能給學(xué)生創(chuàng)設(shè)一個(gè)良好的認(rèn)知環(huán)境,可以加深學(xué)生的識(shí)記成效,培養(yǎng)和發(fā)展學(xué)生的思維能力、觀察能力、想象能力和創(chuàng)造能力。因此,信息技術(shù)學(xué)科教師要能熟練運(yùn)用多媒體教學(xué)手段,使自己的課堂教學(xué)內(nèi)容豐富而不繁雜,教學(xué)過(guò)程緊張但不忙亂,自身的教學(xué)效率與計(jì)算機(jī)的高效性和諧一致,使學(xué)生親身感受信息技術(shù)給人類(lèi)帶來(lái)的全新變化。
4、理論課教學(xué)課時(shí)應(yīng)遠(yuǎn)小于上機(jī)課。
信息技術(shù)是一門(mén)基礎(chǔ)工具課程,是用來(lái)處理其它事務(wù)的手段,因此培養(yǎng)信息技術(shù)基本技能是該課程的主要任務(wù)。所以傳統(tǒng)的課堂授課形式在信息技術(shù)教學(xué)中只適合完成像基礎(chǔ)知識(shí)、語(yǔ)言算法、小結(jié)討論等內(nèi)容的教學(xué)。上機(jī)課才是學(xué)生通過(guò)動(dòng)手來(lái)領(lǐng)會(huì)、鞏固和運(yùn)用知識(shí)的最有效的手段,是培養(yǎng)技能的基本途徑。
二、上機(jī)課教學(xué)
充分、有效的利用好學(xué)?,F(xiàn)有的計(jì)算機(jī)設(shè)備是信息技術(shù)教學(xué)的關(guān)鍵,因此教育部已擬定,上機(jī)課時(shí)應(yīng)占信息技術(shù)課教學(xué)的70%以上。
1、有關(guān)操作的教學(xué)內(nèi)容應(yīng)當(dāng)安排在機(jī)房進(jìn)行。
信息技術(shù)課是一門(mén)實(shí)踐性很強(qiáng)的課,因此有關(guān)操作性比較強(qiáng)的教學(xué)內(nèi)容(如:Windows98的操作、Word的操作)應(yīng)安排在機(jī)房進(jìn)行。對(duì)配有多媒體教學(xué)網(wǎng)或大屏幕投影機(jī)的現(xiàn)代化機(jī)房,能使教師有更多的機(jī)會(huì)營(yíng)造有利于學(xué)生"主動(dòng)發(fā)展"的空間。對(duì)暫不具備以上條件的機(jī)房,也應(yīng)常備一臺(tái)投影儀,教師要精心設(shè)計(jì)制作投影片以期最大限度地滿(mǎn)足高效率教學(xué)的需要。
2、采用任務(wù)驅(qū)動(dòng)的教學(xué)方法,培養(yǎng)學(xué)生自學(xué)能力。
在上機(jī)課之前,要向?qū)W生提出本節(jié)課學(xué)習(xí)的要求、明確學(xué)習(xí)任務(wù),解決好為什么學(xué)的問(wèn)題。學(xué)生通過(guò)自己閱讀教材,提出問(wèn)題,并引導(dǎo)學(xué)生進(jìn)行驗(yàn)證操作,使學(xué)生在自己不斷的解決問(wèn)題當(dāng)中體驗(yàn)成功的快樂(lè),可增強(qiáng)學(xué)生的自信,并逐漸養(yǎng)成求知探索的習(xí)慣。此后結(jié)合教學(xué)大綱要求,提出每一個(gè)學(xué)習(xí)階段的學(xué)習(xí)任務(wù)。可能將學(xué)習(xí)任務(wù)明確化、通俗化、具體化。同時(shí)注意將任務(wù)簡(jiǎn)化,同時(shí)將學(xué)生任務(wù)簡(jiǎn)化為基礎(chǔ)與技巧兩部分,便于讓學(xué)生抓住重點(diǎn),保持良好的學(xué)習(xí)情緒。比如:將Word使用分為基礎(chǔ)部分(常用菜單、常用與格式工具欄使用等)與技巧部分(專(zhuān)用工具欄、復(fù)雜選項(xiàng)、復(fù)雜格式等),基礎(chǔ)部分內(nèi)容嚴(yán)整量少,便于教學(xué),務(wù)必嚴(yán)格把關(guān),確保每位學(xué)生都學(xué)會(huì),技巧部分注意方法教學(xué),不必一一細(xì)講,要引導(dǎo)學(xué)生學(xué)會(huì)摸索學(xué)習(xí)。也要注意將任務(wù)分層,對(duì)不同程度的學(xué)生提出相應(yīng)難易的任務(wù),因材施教。
3、讓學(xué)生在鞏固性練習(xí)中,進(jìn)行知識(shí)的整合創(chuàng)造。
創(chuàng)造素質(zhì)教育的一大特點(diǎn)就是跨學(xué)科。傳統(tǒng)的學(xué)科教育往往強(qiáng)調(diào)了線性思維,而忽視了發(fā)散思維,這樣是很難培養(yǎng)出具有創(chuàng)造素質(zhì)的人才的。計(jì)算機(jī)的工具性,為以學(xué)生為主體的跨學(xué)科教育提供了極大的便利條件,教師應(yīng)讓學(xué)生在鞏固性練習(xí)中,多進(jìn)行知識(shí)的整合創(chuàng)造。如用"畫(huà)筆"進(jìn)行美術(shù)創(chuàng)作,用Word設(shè)計(jì)賀卡、辦報(bào),用Music作曲、用Excel分析班級(jí)成績(jī),用Internet進(jìn)行信息交流等。這種學(xué)以致用的教學(xué)方法既有利于完成信息技術(shù)課程的教學(xué)任務(wù),又有利于開(kāi)發(fā)學(xué)生智力、促進(jìn)學(xué)生主動(dòng)發(fā)展,使信息素質(zhì)和創(chuàng)造素質(zhì)的教育落到實(shí)處。
4、上好程序設(shè)計(jì)課,培養(yǎng)學(xué)生創(chuàng)造力。
學(xué)生用所學(xué)語(yǔ)句自己組合成程序,用來(lái)解決某些問(wèn)題:畫(huà)圖、奏曲、解趣味數(shù)學(xué)題、進(jìn)行成績(jī)分析等等。這個(gè)過(guò)程對(duì)學(xué)生而言就是創(chuàng)造,它對(duì)學(xué)生的思維能力、解決問(wèn)題的能力、規(guī)劃能力和創(chuàng)造能力的培養(yǎng)是其它課程不能替代的,是性能價(jià)格比非常好的培養(yǎng)學(xué)生創(chuàng)造力的有效手段和途徑。
三、課外實(shí)踐課
"用計(jì)算機(jī)處理信息是二十一世紀(jì)的公民應(yīng)具有的基本技能之一"已成為人類(lèi)的共識(shí)。因此,在中小學(xué)信息技術(shù)學(xué)習(xí)中會(huì)涌現(xiàn)出許多學(xué)生計(jì)算機(jī)愛(ài)好者,這些學(xué)生不滿(mǎn)足課堂所學(xué)的知識(shí),對(duì)計(jì)算機(jī)的許多專(zhuān)業(yè)知識(shí)和應(yīng)用技術(shù)(尤其是電子游戲)表現(xiàn)出濃厚的興趣。學(xué)校、教師、家庭應(yīng)通過(guò)有組織、有計(jì)劃的課外實(shí)踐活動(dòng)對(duì)這些學(xué)生的愛(ài)好給予保護(hù)、培養(yǎng)和正確引導(dǎo),以保證學(xué)生在全面發(fā)展的基礎(chǔ)上學(xué)有所長(zhǎng),學(xué)有所用。
課外實(shí)踐作為課堂教學(xué)的拓展和延伸,可分程序設(shè)計(jì)和應(yīng)用技術(shù)兩大類(lèi)進(jìn)行輔導(dǎo)。
1、程序設(shè)計(jì)小組
中小學(xué)各個(gè)階段的程序設(shè)計(jì)課外實(shí)踐應(yīng)與青少年信息學(xué)奧林匹克競(jìng)賽相結(jié)合。由于此類(lèi)競(jìng)賽對(duì)學(xué)生綜合素質(zhì)要求很高,只有心理素質(zhì)好、文化課成績(jī)優(yōu)異、熟練掌握一種計(jì)算機(jī)高級(jí)語(yǔ)言的學(xué)生才有可能在較高級(jí)的比賽中取得好成績(jī)。因此在課余可組織程序設(shè)計(jì)興趣小組。如Pascal語(yǔ)言的程序設(shè)計(jì),通過(guò)學(xué)習(xí)使學(xué)生掌握分析問(wèn)題、解決問(wèn)題的方法。為國(guó)家計(jì)算機(jī)高級(jí)人才的早期培養(yǎng)盡基礎(chǔ)教育的責(zé)任。
2、應(yīng)用技術(shù)小組
在應(yīng)用技術(shù)的課外實(shí)踐中可把計(jì)算機(jī)當(dāng)作信息處理的工具,讓學(xué)生在整合各科所學(xué)文化知識(shí)的基礎(chǔ)上進(jìn)行豐富多彩的創(chuàng)作和信息交流活動(dòng)。如用Frontpage自制網(wǎng)頁(yè);用Word設(shè)計(jì)公益廣告、賀卡;用"畫(huà)筆"或Photoshop創(chuàng)作美術(shù)作品、電子相冊(cè);用Authorware制作課件;普曲或合成音樂(lè);通過(guò)Internet進(jìn)行信息傳遞、資料查詢(xún)等等,這些活動(dòng)打破了學(xué)科界限,使學(xué)生在輕松愉快地學(xué)到、鞏固了相關(guān)學(xué)科的知識(shí)和技能的同時(shí),有效提高了應(yīng)用已有知識(shí)進(jìn)行創(chuàng)造和規(guī)劃的能力,深受學(xué)生喜愛(ài)。由于指導(dǎo)這些活動(dòng)對(duì)教師的綜合素質(zhì)要求較高,所以這樣做也有利于促進(jìn)教師不斷提高業(yè)務(wù)水平和綜合素質(zhì)。
總之,信息技術(shù)教育應(yīng)以培養(yǎng)學(xué)生的信息素養(yǎng)和實(shí)踐能力為主要教學(xué)目標(biāo),信息素養(yǎng)是信息技術(shù)教育的主要教學(xué)中心,信息技術(shù)教育必須圍繞這個(gè)中心開(kāi)展相應(yīng)的教學(xué)活動(dòng),使學(xué)生的信息素養(yǎng)成為與讀、寫(xiě)、算一樣重要的的終身有用的基礎(chǔ)能力,同時(shí),信息技術(shù)教育必須兼顧學(xué)生的全面發(fā)展和多種能力的培養(yǎng),注重學(xué)生的精神、道德、文化和社會(huì)等多個(gè)方面的發(fā)展,培養(yǎng)學(xué)生的批判性思維、創(chuàng)造性思維和問(wèn)題解決能力,因此,信息技術(shù)教育是以培養(yǎng)學(xué)生的信息素養(yǎng)為核心,面向?qū)W生全面發(fā)展的課程。
〖參考文獻(xiàn)〗
《中國(guó)電腦教育報(bào)》。
關(guān)鍵詞:?jiǎn)纹瑱C(jī)電話主叫信息識(shí)別FSK數(shù)據(jù)通信
電話主叫識(shí)別信息發(fā)送及接收(俗稱(chēng)來(lái)電顯示),簡(jiǎn)稱(chēng)CID(CallingIdentifyDelivery),是電信局向被叫電話用戶(hù)提供的一種服務(wù)項(xiàng)目,是指在被叫用戶(hù)終端設(shè)備上顯示主叫電話號(hào)碼、主叫用戶(hù)姓名、呼叫日期和時(shí)間等主叫識(shí)別信息并進(jìn)行存儲(chǔ),以供用戶(hù)查閱的服務(wù)項(xiàng)目。被叫用戶(hù)根據(jù)顯示的主叫識(shí)別信息而決定是否接聽(tīng)電話,可以避開(kāi)一些不愿接聽(tīng)或不友好的電話。利用這個(gè)功能可以進(jìn)行FSK信息解碼的電話網(wǎng)數(shù)據(jù)通信,應(yīng)用于實(shí)際生活中。
1電話主叫識(shí)別原理和傳送協(xié)議
實(shí)現(xiàn)電話主叫信息識(shí)別業(yè)務(wù)的基本方法是,發(fā)端程序交換機(jī)將主叫電話號(hào)碼等信息通過(guò)局間指令系統(tǒng)傳磅給終端交換機(jī),終端交換機(jī)再將主叫識(shí)別信息以移頻鍵控FSK(Frequency-ShiftKeying)或雙音多頻DTMF(DualToneMulti-Frequency)方式,在第一次振鈴或第二次振鈴間隔期前傳送給被叫用戶(hù)終端設(shè)備。我國(guó)的通信行業(yè)標(biāo)準(zhǔn)明確規(guī)定,統(tǒng)一采用FSK方式提供主叫電話來(lái)顯示服務(wù)。在一次呼叫中,若被叫用戶(hù)申請(qǐng)了CID業(yè)務(wù),則電信局的終端交換機(jī)就會(huì)向該被叫用戶(hù)傳送主叫識(shí)別信息數(shù)據(jù)。傳送流程與時(shí)序如圖1所示。
其中A、B、C、D、E為數(shù)據(jù)傳送時(shí)的狀態(tài)持續(xù)時(shí)間,各段時(shí)間值如表1所列。在數(shù)據(jù)傳送前或傳送過(guò)程中,如果用戶(hù)摘機(jī),則傳送停止,但呼叫處理正常進(jìn)行。
表1CID信號(hào)傳送各段時(shí)間值
符號(hào)時(shí)間值說(shuō)明
tA1s第一次鈴流信號(hào)
tB0.5s<tB<1.5s第一次振鈴結(jié)束與數(shù)據(jù)傳送開(kāi)始之間的時(shí)間間隔
tC≤2.9s傳送數(shù)據(jù)的時(shí)間,包括信道占用信號(hào)和標(biāo)志信號(hào)
tD≥200ms數(shù)據(jù)傳送結(jié)束與第二次振鈴開(kāi)始的時(shí)間間隔
tE1s第二次鈴流信號(hào)
tB+C+D≤3.6s各時(shí)段可根據(jù)具體情況確定
2主叫識(shí)別信息數(shù)據(jù)格式
FSK主叫識(shí)別信息數(shù)據(jù)的傳輸格式有兩種:?jiǎn)螖?shù)據(jù)消息格式SDMF(SingleDataMessageFormat)和復(fù)合數(shù)據(jù)消息格式MDMF(MultipleDataMessageFormat)。前者的結(jié)構(gòu)簡(jiǎn)單,可容納的信息內(nèi)容較少,如主叫號(hào)碼、日期和時(shí)間;后者的結(jié)構(gòu)比較復(fù)雜,可容納的信息長(zhǎng)度較長(zhǎng),除單數(shù)據(jù)格式內(nèi)容以外還可以主叫用戶(hù)的姓名等。本文主要介紹FSK主叫信息數(shù)據(jù)格式的接收。
單數(shù)據(jù)消息格式由消息頭和消息體組合,消息頭由消息類(lèi)型和消息長(zhǎng)度組成,它們均為8位字。消息類(lèi)型的值來(lái)識(shí)別消息的特征;消息長(zhǎng)度指明后面所跟消息字的長(zhǎng)度。消息體包括交換機(jī)需傳給終端用戶(hù)的消息。消息體可容納1~255個(gè)8位的消息字。每個(gè)字用8位帶校驗(yàn)位的7位ASCII編碼字符集表示。
一個(gè)完事的消息幀由信道占用信號(hào)、標(biāo)志信號(hào)、數(shù)據(jù)信息和校驗(yàn)字組成。信道占用信號(hào)和標(biāo)志信號(hào)用來(lái)提示電話終端準(zhǔn)備接收數(shù)據(jù);校驗(yàn)字用來(lái)作差錯(cuò)檢查,如圖2所示。
①信道占用信號(hào)。這是發(fā)送主叫信息時(shí)要首先發(fā)出的頭標(biāo)志,由一組300個(gè)連續(xù)的“0”和“1”交替地組成。其第一個(gè)位為“0”,最后一個(gè)位為“1”。在通話狀態(tài)下,此信號(hào)不發(fā)送。
②標(biāo)志信號(hào)。在掛機(jī)狀態(tài)下,程控交換機(jī)向用戶(hù)發(fā)送主叫信息時(shí)要先發(fā)送的第二個(gè)標(biāo)志信號(hào),由180個(gè)標(biāo)志位(邏輯“1”)組成。在通話狀態(tài)下,此信號(hào)不發(fā)送。
③標(biāo)志位。程控交換機(jī)根據(jù)線路使用情況隨機(jī)插入的標(biāo)志位,由0~10個(gè)邏輯“1”組成。
④數(shù)據(jù)字。主叫信息,每個(gè)數(shù)據(jù)字之前先行一次“0”作起始位,在最后加一位“1”作結(jié)束位,每個(gè)數(shù)字的最低位先發(fā)送。這樣,實(shí)際每個(gè)字為10位,即1PXXXXXXX0,其中P為奇偶校驗(yàn)位。
電話主叫信息數(shù)據(jù)傳送時(shí),信道占用信號(hào)首先發(fā)送,后接標(biāo)志信號(hào),最后連續(xù)發(fā)送數(shù)據(jù)字。根據(jù)數(shù)據(jù)傳送情況,間隔地插入一些標(biāo)志位。一般標(biāo)志位會(huì)加在如下字的傳送之間:
a.消息類(lèi)型字與消息長(zhǎng)度之間;
b.消息長(zhǎng)度字與第一個(gè)參考數(shù)字或消息字之間;
c.參數(shù)類(lèi)型字與相應(yīng)的參數(shù)長(zhǎng)度字之間;
d.參考長(zhǎng)度字與第一個(gè)參考字之間;
e.最后一個(gè)參數(shù)字與下一個(gè)參數(shù)類(lèi)型字之間;
f.最后一個(gè)參考字或消息字與校驗(yàn)字之間。
單數(shù)據(jù)消息格式數(shù)據(jù)傳送按消息類(lèi)型(04H)、消息長(zhǎng)度、消息字、月、日、時(shí)、分、主叫號(hào)碼(或“O”或“P”)的順序排列組成消息進(jìn)行傳送。所有的消息字和參數(shù)字都有奇數(shù)偶校驗(yàn)位,采用奇偶校驗(yàn)的方式傳送。
3電話FSK信息通信電路設(shè)計(jì)
本文以FSK信息解調(diào)器SM8220P芯片與單片機(jī)及外電路接口為例,介紹FSK信息的通信接收方法。SM8220P解調(diào)器是日本NPC公司生產(chǎn)的雙列直插、低功耗CMOS集成電路FSK解調(diào)芯片,其解調(diào)器的引腳功能如表2所列。
表2SM8220P引腳功能
符號(hào)引腳功能
TIP-RING1,2電話信號(hào)輸入端。信號(hào)輸入必須隔直流
AGND3模擬地,要通過(guò)一個(gè)電容接地
RDIN4振鈴檢測(cè)輸入。要把振鈴信號(hào)經(jīng)衰減后連接到此引腳
RDRC5振鈴檢測(cè)RC延時(shí)電路,低電平有效
RDET6振鈴檢測(cè)輸出,內(nèi)部接施密特觸發(fā)電路。當(dāng)為低電平時(shí),表明檢測(cè)到振鈴信號(hào)輸入;不用時(shí)應(yīng)接地
PWDN7掉電控制,平時(shí)應(yīng)保持為低電平。若為高電平,進(jìn)入掉電工作模式,COSCOUT、CDET和DOUT自動(dòng)被設(shè)置成高電平,AGND、FOUT被設(shè)置成高阻抗?fàn)顟B(tài)
GND8器件地
OSCIN/CLKIN9振蕩放大器輸入,外部振蕩放入器信號(hào)經(jīng)此引腳輸入
OSCOUT10振蕩放大器輸出,使用外部振蕩信號(hào)時(shí)必須開(kāi)路
CDET11載波檢測(cè)輸出端,低電平有效。為低電平時(shí),表明此時(shí)有FSK載波信號(hào)輸入
NC12空腳
DOUT13數(shù)據(jù)輸出,平時(shí)為高電平。當(dāng)CDET=0時(shí),表明此時(shí)電話經(jīng)上有一個(gè)有效的FSK信號(hào)輸入,經(jīng)解調(diào)后由該腳輸出
DMIN14解調(diào)器輸入端
FOUT15FSK帶通濾波器輸出端,通過(guò)一個(gè)電容耦合連接到DMIN
VDD16電源正極(3~5.5V)
SM8220P遵循Bell202和ITU-TV.23協(xié)議標(biāo)準(zhǔn),以連續(xù)二進(jìn)制脈沖頻移鍵控信號(hào)的方式傳輸,傳輸速率為1200bps。支持FSK號(hào)碼顯示和姓名顯示等多種功能;芯片內(nèi)部包含電源掉電檢測(cè)電路、振鈴檢測(cè)電路和載波檢測(cè)電路;信號(hào)輸入檢測(cè)靈敏度高,電源工作電壓較寬(3~5.5V),是進(jìn)行電話FSK信息解碼通信的較好的集成芯片。
為實(shí)現(xiàn)電話FSK信息的接收,采用P87LPC764單片機(jī)控制SM8220P電路,以完成電話FSK信息解碼通信的工作。電話FK信息通信具體電路如圖3所示。
從圖3中可知,對(duì)于從電話線上傳輸來(lái)的FSK信號(hào),信號(hào)傳送在第一次振鈴和第二次振鈴之間。振鈴信號(hào)經(jīng)過(guò)整流、分壓,加到TIL113光電耦合器件的發(fā)射管上,使發(fā)射管有電流通過(guò)而發(fā)光,照射到光敏三極管的基極,臻使光敏三極管飽和導(dǎo)通。在R6上得到大于1V的脈沖信號(hào),輸入到單片機(jī)外部中斷0,喚醒單片機(jī)準(zhǔn)備接收。0.5s后FSK信號(hào)經(jīng)過(guò)C3、C4、R1、C2的隔直和衰減,輸入到FSK接收器SM8220P的差分輸入端TIP和RING腳,將FSK信號(hào)讀取解調(diào)后從DOUT腳輸出ASCII碼的串行序列,由P87LPC764單片機(jī)接收處理,提取出相應(yīng)的電話FSK信息,發(fā)到多功能LED顯示模塊MAX7219驅(qū)動(dòng)數(shù)碼顯示和24C64保存。
4FSK信息接收通信軟件設(shè)計(jì)
單片機(jī)對(duì)SM8220P輸出的ASCII碼串行序列的識(shí)別過(guò)程,由接收和數(shù)據(jù)整合兩部分組成。由于FSK信號(hào)波特率為1200bps,每發(fā)1位的時(shí)間是833us,因此,可以設(shè)定定時(shí)器每833us接收1位,每10位提取出1個(gè)數(shù)字。如此反復(fù)循環(huán),直到接收完全FSK信息。當(dāng)有電話來(lái)時(shí),在第一聲振鈴后,單片機(jī)開(kāi)始準(zhǔn)備檢測(cè)接收信號(hào),SM8220P開(kāi)始接收300個(gè)由0、1組成的頻率為1200Hz的信道占用信號(hào)和180個(gè)“1”標(biāo)志信號(hào),緊接著接收主叫號(hào)碼和時(shí)間。每收到1個(gè)數(shù)字,SM8220P都把它變換成10位(1PXXXXXXXX0)的串行序列,由13腳輸出傳送給P87LPC764單片機(jī),P87LPC764經(jīng)過(guò)精確的定時(shí)編程將其檢測(cè)整合出相應(yīng)的FSK號(hào)碼、時(shí)間等數(shù)據(jù),完成FSK信息解碼、接收通信、接收到的電話號(hào)碼可以保存在24C64串行E2PROM中,也可以輸出到LCD上顯示。SM8220P的11腳用來(lái)提示電話線上是否有新的FSK信息的輸入。若有新的FSK信息輸入,此引腳將產(chǎn)生低電平。單片機(jī)接收FSK主叫信息可以采用定時(shí)中斷方式,也可以采用延時(shí)查詢(xún)的辦法進(jìn)行。電話FSK信息接收通信程序流程如圖4所示。
數(shù)據(jù)挖掘技術(shù)在企業(yè)的信息化建設(shè)中所擔(dān)任的角色是實(shí)現(xiàn)數(shù)據(jù)信息到商業(yè)知識(shí)的轉(zhuǎn)化。首先需要明確數(shù)據(jù)挖掘技術(shù)的處理對(duì)象,明白商業(yè)活動(dòng)的主題;其次,需要對(duì)商業(yè)的主題進(jìn)行分析,并搜集與之相關(guān)的數(shù)據(jù)利用各種技術(shù)對(duì)數(shù)據(jù)進(jìn)行整理分析,并載入適合的數(shù)據(jù)挖據(jù)的算法中,建立模型,再?gòu)哪P椭刑崛〕鲇杏玫纳虡I(yè)信息,再根據(jù)分析所得結(jié)果調(diào)整算法,以數(shù)據(jù)和信息的可靠性為依據(jù)對(duì)結(jié)果進(jìn)行判斷;再次,將獲得的商業(yè)知識(shí)融合到企業(yè)的信息平臺(tái),利用人機(jī)界面對(duì)企業(yè)的決策活動(dòng)予以支持。另外值得注意的是,由于數(shù)據(jù)挖據(jù)技術(shù)屬于高層次的技術(shù),又關(guān)系到企業(yè)的業(yè)務(wù)機(jī)密,因此,需要極為專(zhuān)業(yè)的技術(shù)人才專(zhuān)業(yè)管理。
2如何實(shí)現(xiàn)數(shù)據(jù)挖掘在企業(yè)的信息化建設(shè)中的應(yīng)用
在企業(yè)進(jìn)行業(yè)務(wù)的操作過(guò)程中往往會(huì)產(chǎn)生大量需要處理的數(shù)據(jù),這就為數(shù)據(jù)挖掘的應(yīng)用提出了要求,數(shù)據(jù)挖掘的運(yùn)用使企業(yè)的大量的數(shù)據(jù)得到了梳理,分析信息的能力提高,在企業(yè)今后的市場(chǎng)開(kāi)拓記憶日常的運(yùn)行中發(fā)揮了重要的作用,促進(jìn)企業(yè)的競(jìng)爭(zhēng)力的提高,那么,數(shù)據(jù)挖據(jù)具體在企業(yè)的信息化建設(shè)中如何應(yīng)用呢,下文將予以介紹。
2.1利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)客戶(hù)信息的有效管理具體來(lái)說(shuō)就是通過(guò)對(duì)客戶(hù)信息進(jìn)行分析,為客戶(hù)建立一個(gè)合適的購(gòu)物模式,以滿(mǎn)足客戶(hù)的需求為重,這是處理好企業(yè)與客戶(hù)之間的關(guān)系的關(guān)鍵。有相關(guān)數(shù)據(jù)顯示,企業(yè)在獲得一個(gè)新的客戶(hù)過(guò)程中所花費(fèi)的成本比維系一個(gè)老客戶(hù)的成本高出6倍-9倍之多,一個(gè)老客戶(hù)的流失是以10個(gè)新客戶(hù)的獲得為代價(jià)的,由此可見(jiàn),對(duì)于企業(yè)來(lái)說(shuō)老客戶(hù)的維護(hù)工作至關(guān)重要。通過(guò)數(shù)據(jù)挖掘技術(shù)可以得到老客戶(hù)的大量的信息,并對(duì)其交易記錄、統(tǒng)計(jì)信息進(jìn)行分析后,可以有目的性的對(duì)流失的客戶(hù)進(jìn)行分析,找出客戶(hù)流失的原因并為新客戶(hù)的建立提供模型和經(jīng)驗(yàn),有效地對(duì)意向客戶(hù)和流失客戶(hù)進(jìn)行判斷,起到企業(yè)與客戶(hù)的關(guān)系的改善的作用。
2.2利用數(shù)據(jù)挖掘技術(shù)進(jìn)行市場(chǎng)營(yíng)銷(xiāo)的分析與管理在市場(chǎng)營(yíng)銷(xiāo)中,數(shù)據(jù)挖掘的作用在于可以促進(jìn)市場(chǎng)的分工,以“客戶(hù)過(guò)去的消費(fèi)行為可以說(shuō)明今后的消費(fèi)傾向”為假設(shè),然后對(duì)客戶(hù)的信息進(jìn)行分析,確定某一群體客戶(hù)的消費(fèi)興趣,消費(fèi)的趨向于需要,進(jìn)而對(duì)消費(fèi)者的下一次或者下一步的消費(fèi)行為作出判斷,然后再以此為基礎(chǔ),將識(shí)別出來(lái)的客戶(hù)作為一個(gè)消費(fèi)群體,以此制定營(yíng)銷(xiāo)計(jì)劃,這與傳統(tǒng)的不以消費(fèi)者的實(shí)際需求為參考而進(jìn)行大規(guī)模營(yíng)銷(xiāo)的手段相比較,在成本的節(jié)約方面貢獻(xiàn)極大,可以帶給企業(yè)更多的利潤(rùn)。在市場(chǎng)營(yíng)銷(xiāo)中的應(yīng)用上,各種數(shù)據(jù)挖掘算法都得到了廣泛的應(yīng)用,每種不同的操作手段都可以引導(dǎo)商家做出滿(mǎn)足消費(fèi)者需求的決策與判斷。
3結(jié)束語(yǔ)
近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)越來(lái)越受到關(guān)注,其應(yīng)用逐步滲透至多個(gè)行業(yè),開(kāi)啟了全新的數(shù)據(jù)時(shí)代。數(shù)據(jù)是征信業(yè)務(wù)開(kāi)展的基礎(chǔ)資料,征信活動(dòng)主要是圍繞數(shù)據(jù)進(jìn)行采集、整理、保存、加工,并最終向信息使用者提供。大數(shù)據(jù)不僅為征信業(yè)發(fā)展提供了極為豐富的數(shù)據(jù)信息資源,也改變了征信產(chǎn)品設(shè)計(jì)和生產(chǎn)理念,成為了未來(lái)征信業(yè)發(fā)展最重要的基石。我國(guó)征信業(yè)發(fā)展尚處于起步階段,在大數(shù)據(jù)時(shí)代存在征信法律制度和業(yè)務(wù)規(guī)則不夠完善、征信機(jī)構(gòu)數(shù)據(jù)處理能力有待提高等問(wèn)題。未來(lái)征信業(yè)面臨的機(jī)遇和挑戰(zhàn)并存,研究大數(shù)據(jù)時(shí)代征信業(yè)的發(fā)展具有重要意義。
大數(shù)據(jù)時(shí)代征信業(yè)面臨的機(jī)遇和挑戰(zhàn)
目前,對(duì)大數(shù)據(jù)無(wú)公認(rèn)的定義,一般認(rèn)為大數(shù)據(jù)是指所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為服務(wù)于經(jīng)營(yíng)決策的資訊。大數(shù)據(jù)的出現(xiàn),使征信業(yè)發(fā)展面臨的外部環(huán)境發(fā)生了巨大的變化。
(一)大數(shù)據(jù)時(shí)代征信業(yè)面臨的機(jī)遇。
1.優(yōu)化征信市場(chǎng)的格局。
隨著征信機(jī)構(gòu)市場(chǎng)化運(yùn)營(yíng)機(jī)制的確立,將會(huì)有更多信息資源優(yōu)勢(shì)的企業(yè)借助互聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術(shù)的創(chuàng)新進(jìn)步,從征信業(yè)薄弱環(huán)節(jié)切入,通過(guò)服務(wù)創(chuàng)新或產(chǎn)品創(chuàng)新打破原有的征信市場(chǎng)格局。一是電商企業(yè)將組建征信機(jī)構(gòu)。以阿里巴巴為例,其利用淘寶、天貓、支付寶平臺(tái)上的行為數(shù)據(jù)和信用情況,建立成了涵蓋數(shù)十萬(wàn)企業(yè)的數(shù)據(jù)庫(kù),具備了開(kāi)展網(wǎng)絡(luò)征信服務(wù)的基礎(chǔ)和實(shí)力。二是金融機(jī)構(gòu)建立征信機(jī)構(gòu)。例如平安集團(tuán)擬整合網(wǎng)貸信息、銀行信貸信息、車(chē)輛違章信息等,建立金融數(shù)據(jù)挖掘中介機(jī)構(gòu)。三是新型征信機(jī)構(gòu)應(yīng)運(yùn)而生。一些大數(shù)據(jù)公司依靠技術(shù)手段,以電子商務(wù)、社交網(wǎng)絡(luò)為平臺(tái),采集信息,提供信用信息服務(wù),可能成為新型的征信機(jī)構(gòu)。
2.推動(dòng)征信業(yè)的轉(zhuǎn)型升級(jí)。
大數(shù)據(jù)給征信業(yè)帶來(lái)轉(zhuǎn)型升級(jí)的歷史機(jī)遇,未來(lái)的征信業(yè)將以智能數(shù)據(jù)分析系統(tǒng)為平臺(tái),利用大數(shù)據(jù)挖掘技術(shù),支持征信業(yè)發(fā)展創(chuàng)新。大數(shù)據(jù)支持征信業(yè)升級(jí)和轉(zhuǎn)型主要體現(xiàn)在二個(gè)方面。一方面大數(shù)據(jù)促成征信業(yè)建立全新的風(fēng)險(xiǎn)控制體制,向有效監(jiān)管轉(zhuǎn)型。大數(shù)據(jù)技術(shù)對(duì)客戶(hù)信用信息進(jìn)行深度挖掘,實(shí)時(shí)監(jiān)控,防范潛在的信用風(fēng)險(xiǎn)。另一方面大數(shù)據(jù)支持征信機(jī)構(gòu)向精細(xì)化管理轉(zhuǎn)變。大數(shù)據(jù)的核心優(yōu)勢(shì)在于信息挖掘,精細(xì)化管理的首要條件是充分信息化,包括業(yè)務(wù)信息化和管理信息化。
3.促進(jìn)征信業(yè)差異化競(jìng)爭(zhēng)。
征信機(jī)構(gòu)通過(guò)采用不同的數(shù)據(jù)來(lái)源,不同的數(shù)據(jù)處理方式,針對(duì)不同的客戶(hù),開(kāi)發(fā)出不同的產(chǎn)品,滿(mǎn)足不同層次客戶(hù)的市場(chǎng)需求,實(shí)現(xiàn)差異化競(jìng)爭(zhēng)。例如,金融機(jī)構(gòu)對(duì)征信服務(wù)的需求將從單個(gè)借款主體的信用報(bào)告,擴(kuò)展到運(yùn)用信用信息拓展網(wǎng)絡(luò)影響和金融服務(wù)渠道。P2P網(wǎng)絡(luò)借貸、電商金融等業(yè)態(tài)需要借助信用信息共享防范風(fēng)險(xiǎn),降低交易成本。
4.拓展征信數(shù)據(jù)來(lái)源。
大數(shù)據(jù)使征信數(shù)據(jù)來(lái)源呈現(xiàn)多元化、多層化和非結(jié)構(gòu)化的特點(diǎn),更加全面和真實(shí)地反映信息主體的信用情況。征信機(jī)構(gòu)從在政府部門(mén)、金融機(jī)構(gòu)等實(shí)體機(jī)構(gòu)中采集信息,轉(zhuǎn)向從互聯(lián)網(wǎng)等虛擬世界中獲取信息。在數(shù)據(jù)采集的廣度和深度上,征信數(shù)據(jù)量將激增,采集包括證券數(shù)據(jù)、保險(xiǎn)數(shù)據(jù)、商業(yè)信用數(shù)據(jù)、消費(fèi)交易數(shù)據(jù)和公共事業(yè)繳費(fèi)數(shù)據(jù)等,全面地覆蓋與信息主體相關(guān)的各項(xiàng)因素。
(二)大數(shù)據(jù)時(shí)代征信業(yè)面臨的挑戰(zhàn)。
1.現(xiàn)有征信業(yè)務(wù)規(guī)則與大數(shù)據(jù)時(shí)代不匹配。我國(guó)有關(guān)征信業(yè)的法律法規(guī)的規(guī)制對(duì)象主要是傳統(tǒng)金融領(lǐng)域,《征信業(yè)管理?xiàng)l例》及其配套制度初步構(gòu)建了我國(guó)征信業(yè)的法律法規(guī)框架,但是《征信業(yè)管理?xiàng)l例》是否滿(mǎn)足大數(shù)據(jù)時(shí)代征信業(yè)務(wù)的規(guī)則要求,尚未得到市場(chǎng)驗(yàn)證。目前,缺少對(duì)大數(shù)據(jù)時(shí)代征信活動(dòng)的規(guī)范,如有關(guān)大數(shù)據(jù)采集、整理、保存、加工和處理的制度要求。因此,還需要進(jìn)一步細(xì)化和完善征信業(yè)務(wù)規(guī)則,以更好促進(jìn)大數(shù)據(jù)時(shí)代征信市場(chǎng)的發(fā)展。
2.征信業(yè)監(jiān)管技術(shù)和水平需改進(jìn)。大數(shù)據(jù)時(shí)代給征信業(yè)發(fā)展帶來(lái)深刻影響,同時(shí)也對(duì)征信業(yè)監(jiān)管提出了更高的要求。要適應(yīng)大數(shù)據(jù)時(shí)代的征信監(jiān)管需求,征信監(jiān)管水平要能跟上大數(shù)據(jù)征信的發(fā)展水平,監(jiān)管政策要符合大數(shù)據(jù)的基本規(guī)律,監(jiān)管人員要具有適應(yīng)大數(shù)據(jù)的知識(shí)和能力。在行業(yè)自律監(jiān)管方面,我國(guó)行業(yè)監(jiān)管尚未發(fā)育成熟,行業(yè)標(biāo)準(zhǔn)尚未統(tǒng)一,行業(yè)規(guī)范以及行業(yè)職業(yè)道德等內(nèi)容尚未完善。
3.信息安全和隱私保護(hù)形勢(shì)嚴(yán)峻。隨著數(shù)據(jù)的進(jìn)一步集中和數(shù)據(jù)量的急劇增長(zhǎng),對(duì)海量數(shù)據(jù)進(jìn)行安全防護(hù)變得更加困難,數(shù)據(jù)的分布式處理也加大了數(shù)據(jù)泄露的風(fēng)險(xiǎn),隱私保護(hù)和數(shù)據(jù)安全成為制約大數(shù)據(jù)發(fā)展的瓶頸。大數(shù)據(jù)時(shí)代下的征信業(yè)同時(shí)具有了大數(shù)據(jù)和征信兩個(gè)特性,對(duì)隱私保護(hù)和數(shù)據(jù)安全的要求更高。
4.數(shù)據(jù)處理能力亟待提高。如何有效處理大數(shù)據(jù),是大數(shù)據(jù)發(fā)揮作用的重要環(huán)節(jié)。益百利等大型征信機(jī)構(gòu)在數(shù)據(jù)處理方面已經(jīng)采取多層次數(shù)據(jù)挖掘等先進(jìn)技術(shù),利用私有云平臺(tái),對(duì)系統(tǒng)中海量數(shù)據(jù)進(jìn)行處理和研發(fā),減少主觀判斷,提高風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性。但是目前我國(guó)征信機(jī)構(gòu)發(fā)展起步較晚,缺少對(duì)數(shù)據(jù)處理的核心技術(shù),導(dǎo)致數(shù)據(jù)分析結(jié)果不能夠準(zhǔn)確的識(shí)別個(gè)體或組織的行為。
5.硬件基礎(chǔ)設(shè)施需要全面升級(jí)。過(guò)去征信機(jī)構(gòu)存儲(chǔ)征信數(shù)據(jù)主要是在本地建立數(shù)據(jù)庫(kù),大數(shù)據(jù)時(shí)代隨著數(shù)據(jù)量呈幾何級(jí)數(shù)的增加,征信機(jī)構(gòu)硬件技術(shù)的發(fā)展已經(jīng)跟不上數(shù)據(jù)容量的增長(zhǎng)速度,數(shù)據(jù)存儲(chǔ)面臨較大壓力。
大數(shù)據(jù)時(shí)代征信業(yè)發(fā)展的措施與建議
隨著大數(shù)據(jù)時(shí)代的到來(lái),未來(lái)征信業(yè)發(fā)展要從制度設(shè)計(jì)、技術(shù)進(jìn)步、信息共享、監(jiān)督管理、隱私保護(hù)等方面不斷創(chuàng)新,促進(jìn)征信業(yè)在大數(shù)據(jù)背景下的跨越式發(fā)展。
(一)建立符合大數(shù)據(jù)的征信法律制度和業(yè)務(wù)規(guī)則體系?,F(xiàn)有的征信法律體系都是基于傳統(tǒng)數(shù)據(jù)模式下制定的,難以滿(mǎn)足大數(shù)據(jù)等新技術(shù)條件下征信業(yè)發(fā)展的制度需求。在征信業(yè)務(wù)開(kāi)展過(guò)程中,大數(shù)據(jù)的收集使用可能涉及國(guó)家信息安全、企業(yè)商業(yè)秘密、公民隱私等,為了給大數(shù)據(jù)條件下征信業(yè)發(fā)展提供制度保障,需要從征信立法層面完善信息安全和數(shù)據(jù)管理的法律制度,明確大數(shù)據(jù)背景下數(shù)據(jù)采集、整理、加工、分析、使用的規(guī)則,確保大數(shù)據(jù)時(shí)代征信業(yè)發(fā)展有法可依。
(二)加強(qiáng)征信產(chǎn)品創(chuàng)新。隨著可獲得的數(shù)據(jù)量呈幾何倍數(shù)的增加,征信機(jī)構(gòu)通過(guò)深度挖掘和使用這些數(shù)據(jù),就可以極大地拓展征信產(chǎn)品的種類(lèi),不僅能夠提供信用報(bào)告查詢(xún)等基礎(chǔ)服務(wù)和產(chǎn)品,還可以提供其他綜合性產(chǎn)品,滿(mǎn)足社會(huì)各界的需求。從征信產(chǎn)品的滿(mǎn)足層次高低的不同,可以分為宏觀、中觀和微觀的征信產(chǎn)品。宏觀層面,征信機(jī)構(gòu)通過(guò)大數(shù)據(jù)分析可以對(duì)系統(tǒng)性、全局性的風(fēng)險(xiǎn)信息進(jìn)行預(yù)測(cè)。中觀層面,征信機(jī)構(gòu)的海量數(shù)據(jù)包含大量時(shí)效性和政策含義都很強(qiáng)的信息,可以靈活多樣地進(jìn)行多維度組合分析。把這些信息整理和挖掘出來(lái),建立對(duì)應(yīng)的指數(shù)體系,有助于行業(yè)監(jiān)管。微觀層面,在信用主體(包括企業(yè)和個(gè)人)同意的前提下,征信機(jī)構(gòu)可以提供每一個(gè)信用主體的信用報(bào)告、信用評(píng)分、身份驗(yàn)證、欺詐檢測(cè)、風(fēng)險(xiǎn)預(yù)警、關(guān)聯(lián)分析等多種數(shù)據(jù)服務(wù)。
(三)提高大數(shù)據(jù)技術(shù)處理能力。大數(shù)據(jù)價(jià)值的完整體現(xiàn)需要多種技術(shù)的協(xié)同。數(shù)據(jù)抽取與集成、數(shù)據(jù)分析以及數(shù)據(jù)解釋?zhuān)谴髷?shù)據(jù)時(shí)代征信數(shù)據(jù)處理的三個(gè)重要環(huán)節(jié),在數(shù)據(jù)處理過(guò)程中搜索引擎、云計(jì)算、數(shù)據(jù)挖掘等新技術(shù)使用必不可少。因此,征信機(jī)構(gòu)要加大數(shù)據(jù)處理分析專(zhuān)業(yè)人才隊(duì)伍的培養(yǎng),同時(shí)要引進(jìn)大數(shù)據(jù)處理的專(zhuān)業(yè)方法和工具,建立前瞻性的征信業(yè)務(wù)分析模型,更好的把握、預(yù)測(cè)市場(chǎng)和信息主體的行為。
(四)健全大數(shù)據(jù)信息共享機(jī)制。完善的大數(shù)據(jù)標(biāo)準(zhǔn)體系是推進(jìn)數(shù)據(jù)共建共享的前提。目前,我國(guó)來(lái)自各行業(yè)、各渠道的數(shù)據(jù)標(biāo)準(zhǔn)存在差異,成為阻礙數(shù)據(jù)開(kāi)放和共享的關(guān)鍵瓶頸。建議盡快統(tǒng)一標(biāo)準(zhǔn)和格式,以便進(jìn)行規(guī)范化的數(shù)據(jù)融合,提升大數(shù)據(jù)的整合能力,打破資源部門(mén)間的信息孤島,從而完善信息共享機(jī)制。
一、對(duì)稅務(wù)數(shù)據(jù)深度利用的理解
長(zhǎng)期以來(lái),稅收工作中數(shù)據(jù)利用比較常見(jiàn)的形式有:報(bào)表瀏覽、簡(jiǎn)單查詢(xún)、復(fù)雜查詢(xún)、稅源分析、稅負(fù)分析、收入預(yù)測(cè)、過(guò)程監(jiān)控等,多數(shù)專(zhuān)家認(rèn)為,目前稅務(wù)數(shù)據(jù)應(yīng)用的一般特征是基于匯總、分類(lèi)、簡(jiǎn)單計(jì)算基礎(chǔ)之上的原始稅收數(shù)據(jù)的“復(fù)制式”展現(xiàn)和對(duì)稅收現(xiàn)象的“陳列式”描述。
隨著經(jīng)濟(jì)、社會(huì)的發(fā)展,稅收數(shù)據(jù)的般利用已經(jīng)不能滿(mǎn)足稅收信息化深化和稅收管理現(xiàn)代化的內(nèi)在需求,為了加強(qiáng)稅收征管、規(guī)范稅收秩序,國(guó)務(wù)院于1994年開(kāi)始實(shí)施“金稅工程”?!敖鸲惞こ獭背跗谝浴霸鲋刀惐O(jiān)管”為主要目標(biāo);二期時(shí),內(nèi)容已拓寬為增值稅防偽稅控開(kāi)票系統(tǒng)、防偽稅控認(rèn)證系統(tǒng)、增值稅計(jì)算機(jī)交叉稽核系統(tǒng)、發(fā)票協(xié)查信息管理系統(tǒng)的四個(gè)系統(tǒng);到了三期,其目標(biāo)已經(jīng)成為:在二期基礎(chǔ)上,建立七個(gè)子系統(tǒng)(管理子系統(tǒng)、征收子系統(tǒng)、稽查子系統(tǒng)、處罰子系統(tǒng)、執(zhí)行子系統(tǒng)、救濟(jì)子系統(tǒng)、監(jiān)控子系統(tǒng)),35個(gè)模塊。依據(jù)美國(guó)學(xué)者Richard.L-Nolan的理論(對(duì)于任何行業(yè),信息化大體要經(jīng)歷初始、蔓延、控制、集成、數(shù)據(jù)管理和成熟這樣幾個(gè)發(fā)展階段,這是信息化發(fā)展的般規(guī)律。)和Mische的補(bǔ)充(他認(rèn)為集成和數(shù)據(jù)管理是密不可分的,因此信息化發(fā)展的必然路徑是起步、增長(zhǎng)、成熟和更新四個(gè)階段),目前,稅務(wù)信息化的發(fā)展階段已開(kāi)始向成熟階段過(guò)渡。于是稅收數(shù)據(jù)的深度利用便提上日程。我們可以從稅收管理戰(zhàn)略和稅收政策分析兩方面來(lái)看這種需求的提出。
從稅務(wù)管理戰(zhàn)略來(lái)看,在納稅前如何綜合評(píng)價(jià)簡(jiǎn)化管理制度(法律)及照章納稅宣傳的相對(duì)效果;在納稅中如何核算稅收結(jié)構(gòu)和管理程度的實(shí)際資源成本(管理、照章納稅、效率、逃稅),以及納稅后對(duì)稅收差距的衡量(包括潛在稅收與申報(bào)稅收的差距、申報(bào)稅收與實(shí)收稅收的差距、實(shí)收稅收與送達(dá)國(guó)庫(kù)稅收的差距),都涉及到稅收數(shù)據(jù)的深度利用問(wèn)題。
從稅收政策分析的角度來(lái)看,稅收經(jīng)濟(jì)的和諧發(fā)展度量、稅制改革方案分析、稅收減免和優(yōu)惠的成本和政策收益、稅收政策的經(jīng)濟(jì)影響等等也涉及到稅收數(shù)據(jù)的深度利用和挖掘問(wèn)題。
這些問(wèn)題都從以下兩方面引發(fā)了我們對(duì)稅務(wù)數(shù)據(jù)深度利用的理解和思考:一方面提出了我們需要全面檢視擁有的稅務(wù)數(shù)據(jù)信息的需求。在各國(guó)稅務(wù)數(shù)據(jù)信息深度利用的經(jīng)驗(yàn)當(dāng)中,提出過(guò)一些全面檢視的標(biāo)準(zhǔn),例如按照稅基到稅收收入的實(shí)現(xiàn)途徑,可以檢視:稅基的規(guī)模,包括真實(shí)稅基和潛在稅基;稅收管理資源使用方向的詳細(xì)分類(lèi);管理資源使用的效用;稅收管理的效果,例如收到稅款的多少,處理案件的數(shù)量等。
另一方面,更為關(guān)鍵的是,提出了如何科學(xué)利用、深度利用的問(wèn)題。總結(jié)以上兩方面,我們認(rèn)為稅收數(shù)據(jù)的深度利用是指:在數(shù)據(jù)集中和系統(tǒng)整合的基礎(chǔ)上,建立全面的稅務(wù)數(shù)據(jù)信息,既包括稅務(wù)系統(tǒng)內(nèi)部數(shù)據(jù),也包括其他政府部門(mén)、企業(yè)、居民等外部數(shù)據(jù),并且進(jìn)一步在各種模型的幫助下,發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在規(guī)律。就目前而言,重點(diǎn)任務(wù)是在稅務(wù)管理方面提出適用中國(guó)實(shí)踐的模型并且應(yīng)用,同時(shí)初步探索在稅收經(jīng)濟(jì)方面能夠刻畫(huà)符合我國(guó)國(guó)情的模型。
二、構(gòu)建模型是數(shù)據(jù)深度利用的切入口
如前所述,稅務(wù)數(shù)據(jù)深度利用和挖掘的關(guān)鍵在于模型的應(yīng)用,下面我們就來(lái)討論模型是什么?我們?yōu)槭裁葱枰P?我們需要什么樣的模型?就稅收數(shù)據(jù)深度利用的模型而言,大致可以分為兩類(lèi):以科學(xué)化管理、定量化管理、精細(xì)化管理為內(nèi)在思想的管理工具和手段所形成的模型;以研究稅收經(jīng)濟(jì)關(guān)系協(xié)調(diào)發(fā)展為目的的稅收經(jīng)濟(jì)模型。
在基本認(rèn)識(shí)了稅務(wù)數(shù)據(jù)深度利用中的模型是什么之后,雖然我們達(dá)成了一種共識(shí),我們需要模型,但是如果我們思考過(guò)為什么需要模型?顯然會(huì)對(duì)模型應(yīng)用更能得心應(yīng)手。我們認(rèn)為模型所發(fā)揮的作用無(wú)外乎以下三種:
首先,刻畫(huà)稅收經(jīng)濟(jì)關(guān)系。一般而言,我們經(jīng)常提到的是模型在刻畫(huà)稅收經(jīng)濟(jì)關(guān)系當(dāng)中所起的作用,即采用代數(shù)形式的定量分析將稅收經(jīng)濟(jì)理論模型化,然后適當(dāng)根據(jù)實(shí)踐情況把理論模型予以修正,并將相關(guān)數(shù)據(jù)應(yīng)用到修正模型中,對(duì)模型結(jié)果進(jìn)行經(jīng)驗(yàn)分析。這種利用的過(guò)程是階段性的,是從初級(jí)到高級(jí)的過(guò)程,是一個(gè)水平不斷提高、效果不斷改進(jìn)的發(fā)展過(guò)程。
其次,歸納稅收管理實(shí)踐。模型起到的作用是將復(fù)雜的稅收征納活動(dòng)通過(guò)數(shù)字化的形式總結(jié)歸納,將稅收征納的每一個(gè)過(guò)程精細(xì)化、每一個(gè)結(jié)果數(shù)據(jù)化,并且建立起投入到產(chǎn)出之間的對(duì)應(yīng)關(guān)系。最后,數(shù)據(jù)組織的導(dǎo)向性作用。這種導(dǎo)向性作用的發(fā)揮是通過(guò)模型應(yīng)用過(guò)程當(dāng)中對(duì)各類(lèi)數(shù)據(jù)提出的要求實(shí)現(xiàn)的,通過(guò)該作用,隨著時(shí)間的發(fā)展,數(shù)據(jù)集中的有效性與目的性不斷加強(qiáng),反之,模型應(yīng)用空間不斷擴(kuò)展。在這一方面,美國(guó)個(gè)人所得稅模型應(yīng)用為我們提供了很好的啟迪。
結(jié)合目前的稅務(wù)數(shù)據(jù)基礎(chǔ)及其發(fā)展趨勢(shì)來(lái)看,金稅三期將成為稅收數(shù)據(jù)深度利用的良好契機(jī),構(gòu)建相應(yīng)模型是我們形成稅務(wù)數(shù)據(jù)深度利用良好局面的切入口。
對(duì)于“我們需要什么樣的模型”的回答,是一個(gè)不斷結(jié)合實(shí)際進(jìn)行摸索的過(guò)程,但是就現(xiàn)階段而言,從可操作性的角度出發(fā),我們還是需要給所應(yīng)用的模型框定一個(gè)邊界:數(shù)據(jù)可利用性,如果沒(méi)有數(shù)據(jù)的支持,模型應(yīng)用將無(wú)從談起;可計(jì)算性,模型應(yīng)用迅速發(fā)展的基石之一就是現(xiàn)代計(jì)算技術(shù)的發(fā)展,沒(méi)有計(jì)算工具的支持,具有龐大計(jì)算量的各種稅收模型的完成無(wú)法想象,支持稅收模型應(yīng)用的計(jì)算工具包括硬件具備的計(jì)算能力和軟件具有的算法能力兩種。
三、數(shù)據(jù)深度利用平臺(tái)建設(shè)的體厶
數(shù)據(jù)深度利用和挖掘最終必須落實(shí)到具體計(jì)算平臺(tái)上,否則縱然有大量的數(shù)據(jù)積累,仍然擺脫不了研究與實(shí)踐部門(mén)脫節(jié)的窘態(tài)。雖然目前我們擁有大量的計(jì)算軟件平臺(tái),然而,總感覺(jué)到這些應(yīng)用平臺(tái)離我們的實(shí)際需要有一定距離。
目前我們正在參與完成一個(gè)國(guó)家自然科學(xué)基金研究項(xiàng)目:稅收政策分析模型支持系統(tǒng)的實(shí)現(xiàn)及其在稅制改革中的應(yīng)用研究,其主要內(nèi)容和實(shí)質(zhì)就是探索構(gòu)建一個(gè)有利干數(shù)據(jù)深度利用的計(jì)算平臺(tái)。從該平臺(tái)的構(gòu)建來(lái)看,有幾點(diǎn)體會(huì):首先,平臺(tái)的構(gòu)建必須結(jié)合具體的研究問(wèn)題展開(kāi)。通用性的平臺(tái)雖然很好,但是由于前面所提到的數(shù)據(jù)可利用性和可計(jì)算性的原因,加上實(shí)際工作的緊迫性需求,往往使得通用性平臺(tái)的規(guī)劃會(huì)落空,甚至于進(jìn)一步影響數(shù)據(jù)深度利用工作本身。在該問(wèn)題上,我們的平臺(tái)研究就結(jié)合了增值稅轉(zhuǎn)型的測(cè)算問(wèn)題,利用了CGE平臺(tái)進(jìn)行實(shí)證性的應(yīng)用。
其次,考慮針對(duì)具體問(wèn)題研究的通用性拓展。雖然實(shí)用為先,然而要做到持續(xù)性的數(shù)據(jù)利用,必然要考慮拓展的問(wèn)題。在這個(gè)問(wèn)題上,我們的平臺(tái)通過(guò)稅制表示方法、稅收政策分析模型描述語(yǔ)言中國(guó)稅收政策分析模型支持系統(tǒng)等方法進(jìn)行嘗試。
更為重要的是,對(duì)適合中國(guó)國(guó)情的稅收經(jīng)濟(jì)模型的提出。由于長(zhǎng)期以來(lái)的數(shù)據(jù)缺少原因,在我國(guó)模型建設(shè)方面沒(méi)有進(jìn)一步的探索。這種缺陷在海量的數(shù)據(jù)突然呈現(xiàn)在我們面前的時(shí)候更加突出。我們正在嘗試提出適用干中國(guó)的稅收經(jīng)濟(jì)模型,雖然肯定會(huì)比較艱難,但是這是一條必經(jīng)之路。
當(dāng)前“大數(shù)據(jù)技術(shù)”充滿(mǎn)了新的機(jī)遇和挑戰(zhàn),其在企業(yè)IT基礎(chǔ)架構(gòu)、數(shù)據(jù)管理、分析和服務(wù)這些關(guān)鍵規(guī)劃領(lǐng)域的應(yīng)用,將會(huì)對(duì)社會(huì)經(jīng)濟(jì)發(fā)展帶來(lái)長(zhǎng)遠(yuǎn)深刻的影響。大數(shù)據(jù)指的是從各種各樣的數(shù)據(jù)中快速獲得有價(jià)值信息的能力,具有數(shù)據(jù)量大、種類(lèi)繁多、價(jià)值稀疏、處理速度快的特征,這些特征對(duì)目前社會(huì)各個(gè)行業(yè)的信息架構(gòu)、系統(tǒng)的沖擊非常大。大數(shù)據(jù)技術(shù)對(duì)整個(gè)社會(huì)經(jīng)濟(jì)發(fā)展來(lái)說(shuō)既是機(jī)遇也是挑戰(zhàn)。
(一)必要性
根據(jù)IDC在2011年6月的《數(shù)字宇宙》(DigitalUniverse)研究報(bào)告,2011年全球新建和復(fù)制的信息量超過(guò)1.9ZB(1.8萬(wàn)億GB),五年時(shí)間增加了近九倍。隨著數(shù)據(jù)量的指數(shù)級(jí)增長(zhǎng)、數(shù)據(jù)源種類(lèi)(包括結(jié)構(gòu)化數(shù)據(jù)源和非結(jié)構(gòu)化數(shù)據(jù)源,如社交媒體、富媒體文件以及地理空間信息)的飛速增加,以及數(shù)據(jù)產(chǎn)生速度的加快(如實(shí)時(shí)傳感器數(shù)據(jù)),傳統(tǒng)的數(shù)據(jù)庫(kù)和架構(gòu)無(wú)法處理、管理和分析如此龐大的數(shù)據(jù)集。政府、金融、電信、互聯(lián)網(wǎng)等大數(shù)據(jù)應(yīng)用的行業(yè)先鋒目前均面臨大數(shù)據(jù)的問(wèn)題。不僅如此,隨著物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車(chē)聯(lián)網(wǎng)、智能手機(jī)、平板電腦的飛速發(fā)展,大數(shù)據(jù)技術(shù)擁有了更為廣泛的數(shù)據(jù)資源。因此,IT產(chǎn)業(yè)界及行業(yè)用戶(hù)都亟需針對(duì)大數(shù)據(jù)設(shè)計(jì)和優(yōu)化大數(shù)據(jù)存儲(chǔ)、管理和查詢(xún)平臺(tái),來(lái)替代傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)平臺(tái)。在技術(shù)發(fā)展的前沿階段進(jìn)行實(shí)驗(yàn)平臺(tái)建設(shè)對(duì)我學(xué)院師生具有重要意義。該實(shí)驗(yàn)平臺(tái)能夠?yàn)閷W(xué)生提供一個(gè)了解最前沿技術(shù)的機(jī)會(huì),不僅能夠提高學(xué)生學(xué)習(xí)興趣、自學(xué)能力,還為學(xué)生就業(yè)、更好地規(guī)劃未來(lái)的職業(yè)發(fā)展提供了機(jī)會(huì)。大數(shù)據(jù)技術(shù)的機(jī)遇與挑戰(zhàn)帶來(lái)了很大的人才缺口,目前大數(shù)據(jù)技術(shù)平臺(tái)開(kāi)發(fā)、方案實(shí)施人才緊缺;由于云存儲(chǔ)、大數(shù)據(jù)技術(shù)帶來(lái)的信息安全問(wèn)題,也亟需大量信息安全領(lǐng)域的人才;由于大數(shù)據(jù)技術(shù)在物聯(lián)網(wǎng)、電子商務(wù)、移動(dòng)互聯(lián)方面的應(yīng)用,對(duì)了解大數(shù)據(jù)技術(shù)的電子商務(wù)專(zhuān)業(yè)人才也更青睞。通過(guò)本實(shí)驗(yàn)平臺(tái)的培養(yǎng),感興趣的優(yōu)秀學(xué)生還可以嘗試考取與大數(shù)據(jù)技術(shù)密切相關(guān)的Hadoop專(zhuān)業(yè)認(rèn)證———ClouderaCertifiedDeveloper/AdministratorforApacheHadoop,為學(xué)校、學(xué)院在該領(lǐng)域帶來(lái)正面影響,增加更多合作和就業(yè)的機(jī)會(huì)。該實(shí)驗(yàn)平臺(tái)能夠?yàn)樾畔⑾到y(tǒng)專(zhuān)業(yè)試點(diǎn)班培養(yǎng)計(jì)劃的很多核心課程(包括管理統(tǒng)計(jì)學(xué)中的業(yè)務(wù)報(bào)表與分析、商務(wù)智能方法與應(yīng)用、商務(wù)智能實(shí)踐、數(shù)據(jù)挖掘和BA綜合實(shí)訓(xùn)等)形成較好的前后銜接關(guān)系,能夠豐富實(shí)踐教學(xué)環(huán)節(jié),深化教學(xué)大綱的內(nèi)容,從建設(shè)更合理的課程建設(shè)體系來(lái)說(shuō)具有很大的必要性。近幾年學(xué)生就業(yè)壓力越來(lái)越大,迫切需要對(duì)教學(xué)內(nèi)容和實(shí)踐環(huán)節(jié)不斷突破創(chuàng)新,才能具備持續(xù)發(fā)展能力。因此在原有課程體系和實(shí)踐教學(xué)環(huán)境的基礎(chǔ)上增設(shè)本實(shí)驗(yàn)平臺(tái)非常必要。
(二)可行性
教學(xué)計(jì)劃中的相關(guān)程序設(shè)計(jì)課程為學(xué)生學(xué)習(xí)云存儲(chǔ)技術(shù)、熟悉大數(shù)據(jù)開(kāi)發(fā)平臺(tái)、了解最新大數(shù)據(jù)技術(shù)的發(fā)展、進(jìn)行大數(shù)據(jù)平臺(tái)基礎(chǔ)上的開(kāi)發(fā)、實(shí)現(xiàn)對(duì)大數(shù)據(jù)的分析、可視化演示打好了基礎(chǔ)。英特爾ApacheHadoop平臺(tái)是目前大多數(shù)大數(shù)據(jù)處理的技術(shù)基礎(chǔ),目前該技術(shù)已經(jīng)發(fā)展成熟,并隨之產(chǎn)生很多基于該平臺(tái)的大數(shù)據(jù)處理工具,可供實(shí)驗(yàn)室建設(shè)實(shí)驗(yàn)平臺(tái)使用。
二、建立大數(shù)據(jù)實(shí)驗(yàn)平臺(tái)的基本構(gòu)想
(一)實(shí)驗(yàn)平臺(tái)人員
實(shí)驗(yàn)平臺(tái)人員負(fù)責(zé)實(shí)驗(yàn)平臺(tái)的建設(shè)、維護(hù),實(shí)驗(yàn)設(shè)計(jì)與指導(dǎo)人員由在大數(shù)據(jù)相關(guān)領(lǐng)域、課程建設(shè)以及實(shí)踐教學(xué)方面都有著豐富的經(jīng)驗(yàn)的教師與實(shí)驗(yàn)室工作人員構(gòu)成,同時(shí)與大數(shù)據(jù)企業(yè)進(jìn)行合作,獲得其核心技術(shù)人員的支持、培訓(xùn)和大力配合,可以共同組成一個(gè)經(jīng)驗(yàn)豐富、精煉實(shí)干的建設(shè)團(tuán)隊(duì)。
(二)軟件調(diào)研
大數(shù)據(jù)的特點(diǎn)為4個(gè)“V”:第一,“Volume”,指的數(shù)據(jù)量大,包括大的數(shù)據(jù)塊,或數(shù)據(jù)總量巨大,從TB躍升到PB;第二,“Variety”,指的是數(shù)據(jù)種類(lèi)繁多,包含大量非結(jié)構(gòu)化數(shù)據(jù),例如網(wǎng)絡(luò)日志、音頻、視頻、地理信息等;第三,“Value”,價(jià)值稀疏性,大量數(shù)據(jù)中有價(jià)值數(shù)據(jù)很少;第四,“Velocity”,指的是處理速度快,這與傳統(tǒng)數(shù)據(jù)挖掘有很大區(qū)別。選擇有數(shù)據(jù)分析基礎(chǔ)、在業(yè)內(nèi)發(fā)展領(lǐng)先的企業(yè)進(jìn)行調(diào)研并選擇適合高校規(guī)模的合作企業(yè)是建立實(shí)驗(yàn)平臺(tái)的重要工作。很多公司給出了可供使用的大數(shù)據(jù)平臺(tái):IBM誖InfoSphere誖BigInsightsTMBasicEdition是一款基于開(kāi)放源碼ApacheHadoop的分析平臺(tái),用于分析大量本機(jī)格式的非常規(guī)數(shù)據(jù),支持結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化內(nèi)容,以實(shí)現(xiàn)最大程度的靈活性;IBM誖InfoSphere誖Streams是一個(gè)高級(jí)計(jì)算平臺(tái),幫助用戶(hù)開(kāi)發(fā)的應(yīng)用程序快速攝取、分析和關(guān)聯(lián)來(lái)自數(shù)千個(gè)實(shí)時(shí)源的信息;惠普公司Vertica分析平臺(tái)6.1,能夠通過(guò)Hadoop分布式文件系統(tǒng)連接器來(lái)優(yōu)化大數(shù)據(jù);ClearStoryData大數(shù)據(jù)分析新創(chuàng)公司,通過(guò)Clearstory,公司客戶(hù)可以將自身的數(shù)據(jù)與行業(yè)的公共數(shù)據(jù)融合,尋找統(tǒng)計(jì)上的新視角,目標(biāo)是取代目前市場(chǎng)上的主流數(shù)據(jù)可視化工具,包括QlikView和Tableau等老牌工具;Informatica9.1提供首款Hadoop編譯器Hparse,這是一種針對(duì)Hadoop而優(yōu)化的數(shù)據(jù)轉(zhuǎn)換環(huán)境,該軟件支持靈活高效地處理Hadoop里面的任何文件格式,為Hadoop開(kāi)發(fā)人員提供了即開(kāi)即用的解析功能,以便處理復(fù)雜而多樣的數(shù)據(jù)源;Datameer:Hadoop海量數(shù)據(jù)分析平臺(tái)允許用戶(hù)在缺乏技術(shù)知識(shí)的情況下能夠分析大量數(shù)據(jù);Infochimps平臺(tái)以其完備的基礎(chǔ)設(shè)施和專(zhuān)業(yè)知識(shí),為客戶(hù)提供端到端的大數(shù)據(jù)解決方案,Infochimps是一家位于美國(guó)德克薩斯州奧斯丁的創(chuàng)業(yè)公司,2012年2月從數(shù)據(jù)市場(chǎng)轉(zhuǎn)型為大數(shù)據(jù)平臺(tái)提供商后獲得谷歌投資;甲骨文大數(shù)據(jù)機(jī)———OracleBigDataAppliance集成系統(tǒng)融入了Cloudera的DistributionIncludingApacheHadoop、ClouderaManager和一個(gè)開(kāi)源R;微軟SQLServer新增PDW功能,可以幫助客戶(hù)擴(kuò)展部屬數(shù)百TB級(jí)別數(shù)據(jù)的分析解決方案;亞馬遜將MapReduce作為一項(xiàng)服務(wù),其彈性MapReduce編程是一項(xiàng)能夠迅速擴(kuò)展的Web服務(wù),運(yùn)行在aws的亞馬遜彈性計(jì)算云和亞馬遜簡(jiǎn)單存儲(chǔ)服務(wù)上;Teradata是企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)(EDW)的領(lǐng)導(dǎo)者,在結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和大部分非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域幾乎沒(méi)有很大成果,因此收購(gòu)了AsterDa-ta———一家提供SQL-MapReduce框架的公司。AsterData是高級(jí)分析和管理各種非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域的市場(chǎng)領(lǐng)導(dǎo)者和開(kāi)拓者,為T(mén)eradata帶來(lái)了大數(shù)據(jù)分析市場(chǎng)商機(jī)。
(三)方案實(shí)施
實(shí)驗(yàn)平臺(tái)的設(shè)計(jì)同時(shí)立足于大數(shù)據(jù)技術(shù)的發(fā)展的前沿性與本學(xué)院學(xué)生專(zhuān)業(yè)特點(diǎn),與學(xué)生前序的理論、實(shí)踐課程均有良好的銜接,符合人才培養(yǎng)計(jì)劃,深化了教學(xué)大綱的內(nèi)容,并針對(duì)不同專(zhuān)業(yè)學(xué)生設(shè)計(jì)實(shí)踐學(xué)時(shí)、內(nèi)容和難度。本實(shí)驗(yàn)平臺(tái)可以同大數(shù)據(jù)行業(yè)中的公司科研部門(mén)共同合作建設(shè),雙方確定在人才培養(yǎng)、師資培訓(xùn)、共建實(shí)驗(yàn)室和實(shí)訓(xùn)基地、推動(dòng)大學(xué)生校外實(shí)習(xí)和社會(huì)實(shí)踐活動(dòng)的開(kāi)展等方面開(kāi)展全面、廣泛、長(zhǎng)期、深入的合作。該實(shí)驗(yàn)室建設(shè)將豐富實(shí)踐教學(xué)體系,也可推動(dòng)學(xué)院科研項(xiàng)目立項(xiàng)、新課題研究、專(zhuān)項(xiàng)基金申請(qǐng)和聯(lián)合開(kāi)展商用項(xiàng)目開(kāi)發(fā)等;該實(shí)驗(yàn)室使師生能接觸高新大數(shù)據(jù)開(kāi)發(fā)平臺(tái),了解最新大數(shù)據(jù)技術(shù)的發(fā)展,進(jìn)行大數(shù)據(jù)平臺(tái)的開(kāi)發(fā),實(shí)現(xiàn)對(duì)大數(shù)據(jù)的分析、可視化演示,增強(qiáng)學(xué)生的動(dòng)手能力并提升就業(yè)質(zhì)量;與此同時(shí),提升了教師的項(xiàng)目管理能力和教學(xué)能力。
三、結(jié)論
1 地方文獻(xiàn)報(bào)刊信息數(shù)據(jù)庫(kù)
地方文獻(xiàn)是指內(nèi)容上具有地域性,同時(shí)具有重復(fù)使用價(jià)值的文獻(xiàn)。由于它完整、系統(tǒng)地記錄了特定地域內(nèi)自然和人文方面的各種信息,從而為人們提供了研究特定地域內(nèi)歷史、現(xiàn)代及未來(lái)的有關(guān)資料。
地方文獻(xiàn)的類(lèi)型多種多樣,報(bào)刊文獻(xiàn)是其中的一種。它具有信息量大,傳遞周期短,內(nèi)容相對(duì)客觀、翔實(shí)等特點(diǎn)。但由于它的總量太大,有關(guān)的地方文獻(xiàn)信息分散在不同時(shí)期、不同品種的報(bào)刊之中。僅靠瀏覽原始文獻(xiàn),迅速查到有關(guān)資料,幾乎是不可能的。地方文獻(xiàn)報(bào)刊索引就是為解決這一問(wèn)題而編制成的一種檢索工具。
在手工時(shí)代,地方文獻(xiàn)報(bào)刊索引表現(xiàn)為篇目索引或題錄索引的形式,即將報(bào)刊中所載地方文獻(xiàn)篇目按一定順序編排起來(lái),以利讀者查找文章的所在位置。這種索引不反映文章的具體內(nèi)容,只具有指向和示址作用。同時(shí),也對(duì)地方事物起著揭示和報(bào)道的作用。除了作為一種綜合性的檢索工具外,還可以在這種索引的基礎(chǔ)上編制各種情報(bào)報(bào)導(dǎo)刊物,或圍繞特定學(xué)科及專(zhuān)業(yè)進(jìn)行定向報(bào)導(dǎo)和檢索,以服務(wù)于地方的各項(xiàng)事業(yè)。
鑒于地方文獻(xiàn)報(bào)刊索引的重要作用,許多公共圖書(shū)館都曾積極編制這種索引。例如,首都圖書(shū)館自50年代起開(kāi)始編制《北京地方文獻(xiàn)報(bào)刊資料索引》,涵蓋了本世紀(jì)以來(lái)的內(nèi)容;甘肅省圖書(shū)館也是在同一時(shí)期開(kāi)始編制西北五省的地方文獻(xiàn)報(bào)刊索引;長(zhǎng)春市圖書(shū)館也曾編制了《東北地方文獻(xiàn)索引》等檢索工具。為了避免目錄體系過(guò)于龐大,這種卡片式篇目索引一般僅以分類(lèi)方式編排。因此讀者也只能從分類(lèi)途徑對(duì)報(bào)刊上的地方文獻(xiàn)信息進(jìn)行檢索。 進(jìn)入計(jì)算機(jī)時(shí)代以來(lái),以數(shù)據(jù)庫(kù)形式來(lái)處理地方文獻(xiàn)信息已成為圖書(shū)館地方文獻(xiàn)工作的必然趨勢(shì)。計(jì)算機(jī)所具有的自動(dòng)識(shí)別與排序功能,使地方文獻(xiàn)信息的編排檢索變得更加方便、更加快捷。通過(guò)全文掃描技術(shù)完成的報(bào)刊全文數(shù)據(jù)庫(kù),使得報(bào)刊上的地方文獻(xiàn)信息得到更充分地揭示和利用。由于計(jì)算機(jī)具有一次性輸入,多途徑輸出的功能,因而在對(duì)地方文獻(xiàn)信息進(jìn)行存儲(chǔ)與檢索時(shí),增加了篇名、著者、出版、文摘等多方面的途徑。尤其是從主題途徑檢索地方文獻(xiàn)信息的問(wèn)題得到了很好地解決。
在地方文獻(xiàn)報(bào)刊信息數(shù)據(jù)庫(kù)(以下簡(jiǎn)稱(chēng)報(bào)刊信息庫(kù))中,分類(lèi)標(biāo)引和主題標(biāo)引都是以揭示文獻(xiàn)內(nèi)在特征為目的的標(biāo)引方法,只是揭示的角度有所不同。由于地方文獻(xiàn)的史料特征極為明顯,故地方文獻(xiàn)的讀者往往是從特定的事件、人物、時(shí)間、地域的角度入手進(jìn)行檢索。因而可以說(shuō)主題檢索是一種最直接反映地方文獻(xiàn)內(nèi)容特征的檢索途徑,也是建立檢索工具和檢索系統(tǒng)的基礎(chǔ)和前提。近些年來(lái),圖書(shū)情報(bào)界對(duì)有關(guān)主題標(biāo)引的原則和操作方法有過(guò)許多研究和探討,撰寫(xiě)過(guò)很多的著作和文章。但由于地方文獻(xiàn)中連續(xù)出版物本身所具有的特征,其主題標(biāo)引的原則和方法與其它類(lèi)型文獻(xiàn)的標(biāo)引還是有所不同。本文擬從報(bào)刊信息數(shù)據(jù)庫(kù)的建設(shè)入手,探討有關(guān)地方文獻(xiàn)報(bào)刊信息主題標(biāo)引的一些問(wèn)題。
2 地方文獻(xiàn)報(bào)刊信息數(shù)據(jù)庫(kù)中的主題標(biāo)引
2.1詞表的編制
報(bào)刊信息庫(kù)與其它類(lèi)型數(shù)據(jù)庫(kù)相比,最突出的特點(diǎn)是要反映地方文獻(xiàn)本身所具有的特征。同時(shí)還要滿(mǎn)足地方文獻(xiàn)用戶(hù)特殊的檢索需求。因此,選擇一部適合地方文獻(xiàn)特征的主題詞表是開(kāi)展標(biāo)引工作的首要問(wèn)題。
《漢語(yǔ)主題詞表》(以下簡(jiǎn)稱(chēng)漢表)是一部供機(jī)檢使用的綜合性基礎(chǔ)型詞表。它所收錄的詞匯可以供各個(gè)機(jī)構(gòu)和行業(yè)從中選詞,以編制適合本專(zhuān)業(yè)或本機(jī)構(gòu)使用的專(zhuān)業(yè)詞表。實(shí)際上,我國(guó)很多專(zhuān)業(yè)情報(bào)機(jī)構(gòu)和圖書(shū)館都是在參考這部國(guó)家詞表的基礎(chǔ)上編制自己詞表的。在編表過(guò)程中,抽取主題詞時(shí)當(dāng)盡可能不破壞原有詞表的詞間關(guān)系。但必要時(shí),詞間關(guān)系及基本范疇還是需要重新確定的。
由于地方文獻(xiàn)是對(duì)某一地域自然和人文現(xiàn)象的客觀描述,它所表現(xiàn)出的地域性和專(zhuān)指性極強(qiáng)。用綜合性的《漢表》來(lái)標(biāo)引各地的地方文獻(xiàn),則將有相當(dāng)部分的文獻(xiàn)不能被準(zhǔn)確地表達(dá)其主題概念;其次,地方文獻(xiàn)的內(nèi)容范疇與《漢表》中的基本范疇也有所不同?!稘h表》是以學(xué)科體系作為劃分范疇的基本依據(jù);而地方文獻(xiàn)則是以特定地方的自然環(huán)境、人文環(huán)境和地方事業(yè)作為劃分范疇的基本依據(jù)。所以地方文獻(xiàn)主題詞表需要在《漢語(yǔ)主題詞表》的基礎(chǔ)上自行編制。
地方文獻(xiàn)主題詞表中所收錄的主題詞來(lái)源主要有:
①《漢表》中已有的詞匯。這是地方文獻(xiàn)與非地方文獻(xiàn)都使用的綜合性詞匯,它占將來(lái)的地方文獻(xiàn)主題詞表所收詞匯的絕大部分。由于是從《漢表》中選詞,所以它們是相對(duì)規(guī)范的。
②《漢表》中沒(méi)有的,帶有地方特點(diǎn)的詞匯,如:北京地方文獻(xiàn)的“琉璃廠”、天津地方文獻(xiàn)中的“皇會(huì)”、廣東地方文獻(xiàn)中的“早茶”等,這部分詞匯雖然在未來(lái)的地方文獻(xiàn)主題詞表中所占比例不會(huì)很大,但它們卻是出現(xiàn)頻率相對(duì)較高的詞匯。對(duì)于這部分詞匯及其詞間關(guān)系,地方文獻(xiàn)工作者需要加以規(guī)范。
③《漢表》作為階段性產(chǎn)品,它的編制受時(shí)間的限制,對(duì)于編表以后新產(chǎn)生的一些詞匯它不可能收錄,在新編的地方文獻(xiàn)主題詞表中收錄這部分詞,也需要加以規(guī)范。
由于編制先組式的主題詞表需要一段相當(dāng)長(zhǎng)的時(shí)間,同時(shí)還要編制一系列的標(biāo)引細(xì)則,這將會(huì)影響報(bào)刊信息庫(kù)主題標(biāo)引工作的迅速展開(kāi)。因此,可以采用另一種方式,即首先確定一段時(shí)間為試驗(yàn)期,先進(jìn)行地方文獻(xiàn)的標(biāo)引工作。由標(biāo)引人員直接從報(bào)刊所載的地方文獻(xiàn)信息內(nèi)容中選取有檢索意義的關(guān)鍵詞作為主題詞。這種主題詞是未經(jīng)規(guī)范的自然語(yǔ)言,也無(wú)詞間關(guān)系可言,待積累了一定數(shù)量之后,再對(duì)其進(jìn)行修改、充實(shí),并參照《漢表》使之規(guī)范化。確定好詞間關(guān)系和基本范疇,從而形成適用的詞表。這種詞表是后控式的,采用這種方式選詞更直觀,專(zhuān)指性強(qiáng),還能使標(biāo)引工作與修改詞表同時(shí)進(jìn)行。而且標(biāo)引時(shí)不用考慮詞間關(guān)系及查表抽詞,所以標(biāo)引速度快。在標(biāo)引時(shí)采用自然語(yǔ)言,對(duì)標(biāo)引人員的要求也相對(duì)較低。目前,廣東省中山圖書(shū)館的地方文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)主題標(biāo)引就采用了這種方法。
2.2主題詞字段的設(shè)置
無(wú)論是先有詞表,還是先進(jìn)行標(biāo)引工作,在報(bào)刊信息庫(kù)中,都需要設(shè)置若干個(gè)主題詞字段,以便展開(kāi)具體的標(biāo)引工作。在設(shè)置主題詞字段時(shí),一定要注意反映地方文獻(xiàn)的時(shí)空特征;在空間方面完整、系統(tǒng)地記錄特定地域內(nèi)自然和人文方面的各種信息;在時(shí)間上又形成了一個(gè)連續(xù)的信息集合。這是一切地方文獻(xiàn)工作最基本的原則。
在報(bào)刊信息庫(kù)中,首先應(yīng)設(shè)置涉及文獻(xiàn)基本內(nèi)容的“內(nèi)容主題詞”字段。此字段選詞靈活性大,標(biāo)引的內(nèi)容也十分廣泛。它對(duì)所有地方文獻(xiàn)信息的內(nèi)容范疇進(jìn)行涵蓋,也是以后編制地方文獻(xiàn)主題詞表時(shí)確定詞表基本范疇的依據(jù)。從地方文獻(xiàn)的性質(zhì)和特征來(lái)看,它是對(duì)特定地區(qū)自然、社會(huì)、人文諸般事物的歷史與現(xiàn)狀進(jìn)行全面系統(tǒng)地綜合性記錄,涉及的內(nèi)容極為廣泛。如反映一個(gè)地區(qū)所能觀察到的天文現(xiàn)象、地質(zhì)水文結(jié)構(gòu)、地形地貌、氣候與氣象、物種與資源以及反映該地區(qū)的人文地理、歷史、地方人物、社會(huì)經(jīng)濟(jì)、地方政治、社會(huì)結(jié)構(gòu)、地方文化、教育等各個(gè)方面。
報(bào)刊信息庫(kù)中“內(nèi)容主題詞”字段的主題詞性質(zhì)絕大部分是綜合性的,與其它非地方文獻(xiàn)數(shù)據(jù)庫(kù)中的主題詞無(wú)太大區(qū)別。例如“社會(huì)治安”,“計(jì)量管理”、“住宅區(qū)”、“軟件產(chǎn)業(yè)”等;也有一部分是地方文獻(xiàn)內(nèi)容所特有的地方性詞匯,如“敦煌石窟”、“庚子”、“廠甸”等;另外,新產(chǎn)生的一些地方文獻(xiàn)信息的內(nèi)容,也應(yīng)通過(guò)內(nèi)容主題詞來(lái)表達(dá)。總之,凡是涉及到地方文獻(xiàn)的所有內(nèi)容特征,都應(yīng)在此字段予以反映。
這一字段并非地方文獻(xiàn)數(shù)據(jù)庫(kù)所特有,有關(guān)具體標(biāo)引方法的討論從略。
另一種主題字段的設(shè)置應(yīng)反映地方文獻(xiàn)內(nèi)容特征以外的其它特征。地方文獻(xiàn)最大的特點(diǎn),就在于文獻(xiàn)所記載的現(xiàn)象、事實(shí)和人物都被限定在某一特指的時(shí)空范圍內(nèi)。也就是說(shuō)。地方文獻(xiàn)所涉及的內(nèi)容范疇均會(huì)通過(guò)特定的時(shí)間、地點(diǎn)、團(tuán)體機(jī)構(gòu)、人物等因素反映和輸出。地方文獻(xiàn)用戶(hù)的檢索習(xí)慣也往往是從某一地域范疇、地區(qū)名稱(chēng)、某一事件、某一人物入手。因此,有必要在地方題錄庫(kù)中設(shè)置“地域主題詞”、“時(shí)間主題詞”、“團(tuán)體主題詞”和“個(gè)人主題詞”諸字段。它們是揭示地方文獻(xiàn)的本質(zhì)特征所必須的字段。同時(shí)也是地方文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)中所特有的。
以上四個(gè)主題詞字段所反映的是有關(guān)地方文獻(xiàn)信息中客觀存在的某些因素,如“地域主題詞”中的“東城區(qū)”、“梅山縣”、“個(gè)人主題詞”中的“梅蘭芳”、“秋瑾”等。盡管這四種主題詞的標(biāo)引與“內(nèi)容主題詞”的標(biāo)引相比,相對(duì)容易些,但仍需積累到一定數(shù)量后進(jìn)行規(guī)范。例如“團(tuán)體主題詞”中的機(jī)構(gòu)名稱(chēng)是用全稱(chēng)還是用簡(jiǎn)稱(chēng),以及“個(gè)人主題詞”中的人物名稱(chēng)是用本名還是用筆名,這些都需要地方文獻(xiàn)工作者在以后的工作中根據(jù)本地區(qū)的具體情況加以規(guī)范。
具體的標(biāo)引方法是:
地域主題所標(biāo)引的不是整體地方文獻(xiàn)的地域,而是文章內(nèi)容涉及的某一具體區(qū)域的名稱(chēng),或者給文章內(nèi)容帶來(lái)影響的區(qū)域名稱(chēng)。如有關(guān)北京地方文獻(xiàn)的內(nèi)容不用標(biāo)“北京”,直接標(biāo)引具體的“東城區(qū)”、“昌平縣”等行政區(qū)劃名稱(chēng);內(nèi)容涉及到較具體的地名時(shí)也可標(biāo)引地名,例如“王府井大街”、“方家胡同”等;如果文章中所反映的地區(qū)更詳細(xì),區(qū)(縣)、街道(鄉(xiāng)鎮(zhèn))、村等具體名稱(chēng)都有,可逐級(jí)進(jìn)行標(biāo)引,中間用分隔符隔開(kāi),如北京地方文獻(xiàn)中的“順義縣%趙全營(yíng)鎮(zhèn)%北郎中村”;在標(biāo)引中,遇到舊有的行政區(qū)劃名稱(chēng)或舊地名時(shí),為反映某一地區(qū)名稱(chēng)的歷史發(fā)展沿革,應(yīng)將現(xiàn)行行政區(qū)劃名稱(chēng)與舊有行政區(qū)劃名稱(chēng)同時(shí)標(biāo)引作為檢索點(diǎn),現(xiàn)有行政區(qū)劃名稱(chēng)或新地名標(biāo)在前面, 舊行政區(qū)劃名稱(chēng)或舊地名注于其后,可用括號(hào)括起。如“東城區(qū)(內(nèi)三區(qū))”。以上的標(biāo)引方法主要是針對(duì)地方文獻(xiàn)用戶(hù)特定的檢索需求而言。
年代主題標(biāo)引的是文獻(xiàn)內(nèi)容所涉及的時(shí)間范圍,而不是文獻(xiàn)撰寫(xiě)或出版發(fā)行的時(shí)間。清以前的歷朝歷代均可使用“朝代%年號(hào)”的方法標(biāo)引.如“清代%乾隆”,中華民國(guó)時(shí)期(1919年前)可標(biāo)引成“民國(guó)時(shí)期”,到了1920年以后可以標(biāo)引成“二十年代”、“六十年代”等。
團(tuán)體主題和個(gè)人主題標(biāo)引的是文章內(nèi)容所涉及到某一具體機(jī)構(gòu)、個(gè)人,或與某地方有關(guān)系的機(jī)構(gòu)和個(gè)人。團(tuán)體主題標(biāo)引時(shí),用機(jī)構(gòu)和單位的標(biāo)準(zhǔn)全稱(chēng),如“北京市中級(jí)人民法院”、“重慶市技術(shù)監(jiān)督局”等;而個(gè)人主題的標(biāo)引,是標(biāo)具體人名,例如“梅蘭芳”;如果遇到同一人物有本名與筆名時(shí),要同時(shí)標(biāo)引,如“魯迅”與“周樹(shù)人”、“老舍”與“舒舍予”之間可用符號(hào)“%”隔開(kāi);遇到清代人物或少數(shù)民族人物的名稱(chēng)較長(zhǎng)時(shí),一般應(yīng)標(biāo)引人物的全名,如“愛(ài)新覺(jué)羅·溥儀”。
總之,無(wú)論標(biāo)引什么類(lèi)型的主題詞,標(biāo)引人員都要站在用戶(hù)的角度,即從索引的終極使用目的出發(fā),給地方文獻(xiàn)實(shí)際使用者提供有價(jià)值的地方文獻(xiàn)信息。因此,在對(duì)報(bào)刊信息庫(kù)進(jìn)行主題標(biāo)引過(guò)程中一定要確定好標(biāo)引深度。地方文獻(xiàn)報(bào)刊索引的標(biāo)引深度,則取決于地方文獻(xiàn)各類(lèi)用戶(hù)的檢索需求。地方文獻(xiàn)的研究級(jí)用戶(hù)的檢索需求包括:決策、管理人員宏觀的檢索需求、科研人員較專(zhuān)深的檢索需求及設(shè)計(jì)生產(chǎn)人員的針對(duì)性檢索需求等。
盡管采用數(shù)據(jù)庫(kù)系統(tǒng)處理地方文獻(xiàn)信息這一手段在全國(guó)各類(lèi)圖書(shū)館的地方文獻(xiàn)業(yè)務(wù)中開(kāi)展得還不夠普遍,但這是地方文獻(xiàn)工作發(fā)展的必然趨勢(shì)。結(jié)合地方文獻(xiàn)本身的特點(diǎn)來(lái)制訂適用的主題詞表、分類(lèi)表,是實(shí)現(xiàn)地方文獻(xiàn)信息處理標(biāo)準(zhǔn)化的必要步驟。它可為今后進(jìn)行聯(lián)機(jī)檢索,進(jìn)入國(guó)家和地區(qū)網(wǎng)絡(luò),從而實(shí)現(xiàn)地方文獻(xiàn)資源共享打下堅(jiān)實(shí)的基礎(chǔ)。同時(shí),計(jì)算機(jī)多途徑檢索所產(chǎn)生的效果也會(huì)使地方文獻(xiàn)信息資源得以更充分地研究與利用。
參考文獻(xiàn)
1 韓樸.圖書(shū)館地方文獻(xiàn)工作.北京:文津出版社,1992
2 中國(guó)科學(xué)技術(shù)情報(bào)研究所.北京圖書(shū)館.漢語(yǔ)主題詞表.北京:科學(xué)技術(shù)文獻(xiàn)出版社,1979