發(fā)布時(shí)間:2023-03-21 17:09:54
序言:寫作是分享個(gè)人見解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了8篇的數(shù)據(jù)信息論文樣本,期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā),請盡情閱讀。
城市軌道交通信號系統(tǒng)的DCS網(wǎng)絡(luò)包含有線部分和無線部分。有線網(wǎng)絡(luò)部分是指軌旁設(shè)備之間的數(shù)據(jù)通信,為信號系統(tǒng)提供專用有線信息傳輸,為控制中心、車站、場段之間提供有線傳輸通道,建立局域網(wǎng)連接。無線部分主要是列車上的移動(dòng)無線設(shè)備和地面軌旁無線單元之間建立的車地雙向通信。如上所述,在信號系統(tǒng)的DCS網(wǎng)絡(luò)中,可以根據(jù)不同的組網(wǎng)方式,構(gòu)建不同的網(wǎng)絡(luò)結(jié)構(gòu),形成連接信號系統(tǒng)相關(guān)設(shè)備的通信網(wǎng)。而在這樣的網(wǎng)絡(luò)中,傳遞的信息就包含大量的管理信息、行車數(shù)據(jù)信息、ATS信息、維護(hù)信息、數(shù)據(jù)記錄信息等。DCS系統(tǒng)網(wǎng)絡(luò)連接設(shè)備一般連接方式需要說明的是DCS網(wǎng)絡(luò)結(jié)構(gòu)是多樣的,隨著實(shí)際地鐵線路情況、所連接的設(shè)備情況、以及技術(shù)發(fā)展和應(yīng)用情況有不同變化。從圖1中可以看出,信號系統(tǒng)DCS網(wǎng)絡(luò)具有連接設(shè)備類型多、數(shù)量大,信息傳輸種類繁多的特點(diǎn)。如果在DCS網(wǎng)絡(luò)中信息沒有合理的傳輸定義,使網(wǎng)絡(luò)中任何一個(gè)數(shù)據(jù)幀的傳輸都要遍及整個(gè)網(wǎng)絡(luò),導(dǎo)致所有與網(wǎng)絡(luò)連接的設(shè)備都接收到,這樣就會嚴(yán)重的消耗掉網(wǎng)絡(luò)整體帶寬。因此,在DCS網(wǎng)絡(luò)傳輸信息量較大時(shí)(如早、晚運(yùn)行高峰時(shí)等),如不對網(wǎng)絡(luò)進(jìn)行合理設(shè)置,就可能產(chǎn)生網(wǎng)絡(luò)風(fēng)暴。網(wǎng)絡(luò)風(fēng)暴發(fā)生時(shí),與網(wǎng)絡(luò)連接的部分設(shè)備也可能會由于無法應(yīng)對網(wǎng)絡(luò)流量的大幅波動(dòng)導(dǎo)致故障,進(jìn)而引發(fā)故障面擴(kuò)大的情況發(fā)生,對運(yùn)營產(chǎn)生嚴(yán)重影響,這就需要對網(wǎng)絡(luò)中的信息傳輸進(jìn)行合理優(yōu)化。
2VLAN技術(shù)特點(diǎn)及在DCS網(wǎng)絡(luò)中的應(yīng)用
VLAN技術(shù)是將局域網(wǎng)設(shè)備從邏輯上劃分成一個(gè)個(gè)網(wǎng)段,從而實(shí)現(xiàn)虛擬工作組數(shù)據(jù)交換。由于VLAN設(shè)置是在交換機(jī)上按邏輯來劃分,而不是傳統(tǒng)上的只能從物理上劃分,因此VLAN技術(shù)的出現(xiàn),可以滿足根據(jù)實(shí)際應(yīng)用情況,將同一物理局域網(wǎng)內(nèi)不同用戶邏輯地劃分成不同的廣播域需求。在設(shè)計(jì)VLAN并實(shí)現(xiàn)應(yīng)用時(shí),首先要確定如何劃分VLAN。較為常見的VLAN劃分方式包括:按照端口劃分,按照MAC地址劃分、基于網(wǎng)絡(luò)層劃分、以及基于IP廣播和基于規(guī)則等方式。其中應(yīng)用最為廣泛、也是最有效的,是按照端口劃分的方式,這種劃分方式是根據(jù)以太網(wǎng)交換機(jī)的交換端口來劃分的,將交換機(jī)上的物理端口分為若干個(gè)組,每個(gè)組構(gòu)成一個(gè)虛擬網(wǎng)。由于基于端口劃分VLAN的優(yōu)點(diǎn)是定義VLAN成員非常簡單,只要在接入交換機(jī)上進(jìn)行相關(guān)設(shè)置即可,操作相對簡單,適合任何大小的網(wǎng)絡(luò)。同時(shí),這種配置方式適用于網(wǎng)絡(luò)環(huán)境比較固定的情況,與DCS網(wǎng)絡(luò)構(gòu)建后即在運(yùn)營中不會輕易改變的實(shí)際情況較為符合,因此在地鐵信號系統(tǒng)DCS網(wǎng)絡(luò)交換機(jī)的配置中,一般都可以使用按照端口劃分VLAN的配置方式。以赫斯曼交換機(jī)為例,按照端口劃分VLAN,為不同端口賦予不同ID后的界面顯示情況綜上所述,為了有效避免信號系統(tǒng)DCS網(wǎng)絡(luò)風(fēng)暴的發(fā)生,可以將交換機(jī)端口劃分到不同VLAN中。其原理為:在不同端口發(fā)出的所有數(shù)據(jù)幀上增加一個(gè)代表所屬VLAN編號的ID,各個(gè)交換機(jī)端口只有在接收到所屬VLANID的信息時(shí),才會對該信息進(jìn)行拆分處理,而在收到標(biāo)有其他VLANID信息時(shí),只會將該信息按照目的地址進(jìn)行轉(zhuǎn)發(fā)。這樣就實(shí)現(xiàn)了通過在DCS網(wǎng)絡(luò)交換機(jī)上應(yīng)用VLAN技術(shù),有效控制網(wǎng)絡(luò)流量、降低網(wǎng)絡(luò)風(fēng)暴發(fā)生概率的目標(biāo)。并且通過在交換機(jī)上進(jìn)行VLAN的劃分,可以起到減少項(xiàng)目建設(shè)的設(shè)備投資成本、簡化DCS網(wǎng)絡(luò)管理、提高網(wǎng)絡(luò)安全性的作用。這里需要提出的是,有必要找到適合于信號DCS網(wǎng)絡(luò)的劃分原則,結(jié)合實(shí)際應(yīng)用情況,將不同級別的信息進(jìn)行合理區(qū)分。
3適用于DCS的VLAN劃分原則
由于地鐵信號系統(tǒng)DCS網(wǎng)絡(luò)具有連接設(shè)備數(shù)量、類型較多,信息傳輸種類繁多的特點(diǎn),在按照端口劃分的VLAN配置方法對信號DCS網(wǎng)絡(luò)交換機(jī)等進(jìn)行配置時(shí),需要尋找到合適的原則,將信號系統(tǒng)DCS網(wǎng)絡(luò)中不同設(shè)備、不同信息類型進(jìn)行全網(wǎng)的統(tǒng)一配置,既能有效避免網(wǎng)絡(luò)風(fēng)暴,又有利于維護(hù)人員進(jìn)行維修檢查。這就需要根據(jù)網(wǎng)絡(luò)端口是否有用、該端口在網(wǎng)絡(luò)中的作用、所傳輸?shù)男畔?nèi)容和特點(diǎn)等特征,將網(wǎng)絡(luò)端口有序劃分。例如,在網(wǎng)絡(luò)的列車自動(dòng)控制(ATC)信息、列車自動(dòng)監(jiān)控(ATS)信息、維護(hù)管理信息等帶有不同功能及目地的信息,劃分到不同的VLAN中。在信息有效傳輸?shù)耐瑫r(shí),也可以提高網(wǎng)絡(luò)的安全性能。建議按照以下原則進(jìn)行層層劃分。
1)由于信號系統(tǒng)涉及列車行車安全,因此可先將交換機(jī)上多余端口統(tǒng)一劃入“無用端口”的VLAN中,這樣即使有其他設(shè)備接入到該端口上,也不會對有用端口間的網(wǎng)絡(luò)通信造成影響。
2)進(jìn)一步將有用端口進(jìn)行分類,如該端口在信號DCS網(wǎng)絡(luò)中只做收發(fā),不對信息進(jìn)行拆分和處理,即可將其劃入“管理類”的VLAN中。
3)在DCS網(wǎng)絡(luò)中,與“管理類”信息對應(yīng)的是“業(yè)務(wù)類”信息,在此類信息中,建議先將涉及到列車控制安全的ATC信息獨(dú)立劃分出來,同時(shí)由于此類信息較為重要,需設(shè)計(jì)兩路,可以劃分至兩個(gè)不同的VLAN中。
4)另外,“業(yè)務(wù)類”信息還包含其他非ATC信息,也就是非安全信息。對這類信息的劃分,首先將其中的ATS信息獨(dú)立劃分出來,同樣建議為兩路。
5)同時(shí),非安全類的信息也包含維護(hù)管理類信息,如維護(hù)支持、電源監(jiān)控類等信息也需要?jiǎng)澐值絾为?dú)一個(gè)VLAN中,此類信息可以不進(jìn)行冗余設(shè)置。
6)其他非安全類信息也可以通過實(shí)際情況進(jìn)行VLAN設(shè)置,可以獨(dú)立VLAN,也可統(tǒng)一劃入一個(gè)VLAN,根據(jù)實(shí)際情況進(jìn)行設(shè)置即可。建議的VLAN劃分原則,以及該原則對應(yīng)在信號系統(tǒng)中的傳輸內(nèi)容示意。
4總結(jié)
(一)可行性分析
經(jīng)濟(jì)方面的可行性。本系統(tǒng)是房屋銷售管理信息系統(tǒng),所以系統(tǒng)的成本主要集中在開發(fā)軟件的費(fèi)用上,但是系統(tǒng)投入運(yùn)行后,就可以減少大量的人力以及物力。耗時(shí)短,資金消耗少,實(shí)用性強(qiáng),經(jīng)濟(jì)性良好。具有極高的經(jīng)濟(jì)方面的可行性。操作方面的可行性。由于該系統(tǒng)是分模塊設(shè)立的,所以模塊間既有一定的獨(dú)立性,也有一定的聯(lián)系,適用范圍廣,操作簡單易懂。即便是不精通網(wǎng)絡(luò)以及計(jì)算機(jī)的相關(guān)工作人員也可以使用,減少了人力物力的投入,提升了管理效率,可操作性強(qiáng)。
(二)需求分析
由于房地產(chǎn)行業(yè)大多采取跨地域的經(jīng)營方式,承包不同省份、不同城市、不同區(qū)域的房地產(chǎn)工程。有統(tǒng)一的總部進(jìn)行分項(xiàng)管理,但是各個(gè)項(xiàng)目并沒有自己的管理平臺,來讓總部及時(shí)了解相關(guān)的狀況,因此容易造成資源分配不均衡,不能及時(shí)進(jìn)行調(diào)整等狀況。所以,房地產(chǎn)企業(yè)需要一個(gè)可以進(jìn)行反饋的系統(tǒng),來及時(shí)了解相關(guān)狀況,來調(diào)節(jié)相關(guān)的決策。在財(cái)務(wù)方面,各個(gè)項(xiàng)目的財(cái)務(wù)是獨(dú)立的,因此,為了更好地進(jìn)行管理,避免賬目出現(xiàn)偏差,要將各個(gè)項(xiàng)目的財(cái)務(wù)數(shù)據(jù)及時(shí)反饋,需要一個(gè)管理系統(tǒng)來進(jìn)行這樣的工作。也要對客戶資源進(jìn)行很好的管理,并征求客戶的意見和建議并咨詢客戶的滿意度,來提升公司形象,并發(fā)掘潛在客戶以及潛在市場。這需要建立一個(gè)系統(tǒng),來管理并反饋客戶的相關(guān)信息。房屋銷售管理信息系統(tǒng)具體要做到對內(nèi)部數(shù)據(jù)信息進(jìn)行管理,來方便操作人員操作以及查詢。由于數(shù)據(jù)十分龐大,輸入的工作量也十分的大,因此系統(tǒng)一定要簡單易懂、方便操作、能實(shí)現(xiàn)批量操作等。為了實(shí)現(xiàn)房地產(chǎn)銷售信息無紙化,并運(yùn)用計(jì)算機(jī)以及網(wǎng)絡(luò)技術(shù)等,就要建立一個(gè)綜合性的房屋銷售管理信息系統(tǒng)。在進(jìn)行信息的錄入與輸出的同時(shí),來對相關(guān)的資料進(jìn)行管理。
(三)功能分析
在系統(tǒng)的功能分析方面,我們從四個(gè)板塊來研究。房產(chǎn)管理模塊,建立一個(gè)房屋銷售管理信息系統(tǒng),其最基本最首要的功能便是房產(chǎn)管理。這要求系統(tǒng)可以支持管理者對房屋信息進(jìn)行修正的一系列操作,如新內(nèi)容的添加、錯(cuò)誤信息的刪減、錄入以及修改等一系列操作。除此之外,要將查詢功能設(shè)置的相對便利,來使得客戶依照需要對房屋信息進(jìn)行查詢,對所需的房屋進(jìn)行快速定位??蛻艄芾砟K,可以幫助公司更好的管理客戶信息,來明確業(yè)務(wù)方向,增加自己的競爭力。對客戶進(jìn)行合理的分類,來提高管理效率,并根據(jù)客戶要求以及滿意度等信息將客戶進(jìn)行劃分,來針對不同的客戶提供不同的信息和服務(wù)。收費(fèi)管理板塊,用來記錄客戶的繳費(fèi)狀況等。來方便費(fèi)用的記錄以及催繳,并可以添加物業(yè)費(fèi)等信息,來方便其他有關(guān)的單位的工作。售樓管理板塊,這是房屋銷售管理信息系統(tǒng)的核心部分,在這一板塊中,我們可以實(shí)現(xiàn)對樓盤銷售的情況的管理,讓公司統(tǒng)一管理數(shù)據(jù),更加容易的了解樓盤的銷售狀態(tài),更好地進(jìn)行下一步的操作。
二、系統(tǒng)設(shè)計(jì)
(一)模塊劃分與功能設(shè)計(jì)
房產(chǎn)管理模塊,主要是管理各個(gè)樓盤內(nèi)部的相關(guān)數(shù)據(jù)。一定要有添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作的功能。該模塊有樓盤信息登記管理、戶型信息的登記管理、樓盤、查詢、戶型信息查詢等主要功能。樓盤信息登記管理板塊:對各種樓盤信息進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作,要有樓盤編號、樓盤報(bào)價(jià)以及戶型編號等信息。戶型資料登記管理板塊:對戶型資料進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作。要包括,對戶型的基礎(chǔ)介紹、平面圖、編號、價(jià)格、內(nèi)部結(jié)構(gòu)、實(shí)際面積等。樓盤查詢板塊:實(shí)現(xiàn)通過查詢樓盤的關(guān)鍵字來對樓盤全面的信息進(jìn)行查詢。包括樓盤的編號、報(bào)價(jià),戶型的編號等信息。戶型查詢板塊:實(shí)現(xiàn)通過查詢關(guān)鍵字或關(guān)鍵詞,來查詢戶型的相關(guān)信息。包括,戶型的編號、設(shè)計(jì)圖、內(nèi)部結(jié)構(gòu)、面積等信息??蛻艄芾戆鍓K,一定要有添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作的功能。還要分為客戶資料登記管理板塊,客戶資料查詢管理等幾個(gè)子版塊??蛻糍Y料登記管理板塊:要求能夠?qū)崿F(xiàn)對客戶資料進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作的功能的操作。要有相對全面的客戶資料??蛻糍Y料查詢管理板塊:要求能夠通過查詢操作,查詢客戶資料中的某一項(xiàng)內(nèi)容,比如按照客戶的身份證進(jìn)行查詢、按照客戶的姓名進(jìn)行查詢、按照手機(jī)號進(jìn)行查詢等,進(jìn)而出現(xiàn)客戶的相對全方面的信息。收費(fèi)管理模塊,實(shí)現(xiàn)對收費(fèi)的數(shù)據(jù)進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作。包括登記管理板塊,以及查詢管理板塊兩個(gè)子版塊。收費(fèi)登記管理板塊:對相關(guān)的收費(fèi)信息進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作。包括收費(fèi)項(xiàng)目編號、樓盤編號、繳費(fèi)時(shí)間、繳費(fèi)金額、物業(yè)費(fèi)用、公共基礎(chǔ)費(fèi)用、其他費(fèi)用等。收費(fèi)查詢管理板塊:通過查詢住戶的相關(guān)信息,來查看住戶的相關(guān)繳費(fèi)情況。包括查詢住戶所在的住址、住戶的的身份證號、姓名等信息,來進(jìn)一步查詢住戶的繳費(fèi)信息。售樓管理模塊,這是房地產(chǎn)企業(yè)的基本業(yè)務(wù),所以這個(gè)板塊是一個(gè)基本版塊。業(yè)績直接影響效益,所以這個(gè)版塊十分重要。要對售樓信息進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作。主要包括售樓人員登記管理板塊、售樓合同管理板塊。樓盤銷售人員登記管理板塊:對銷售人員的各項(xiàng)信息進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作。包括,姓名、性別、身份證號、編號、手機(jī)號碼、電話號碼、所屬區(qū)域等相關(guān)信息。售樓合同管理板塊:對售樓合同的相關(guān)信息進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作。包括,合同的狀態(tài)、編號、所屬樓盤的相關(guān)資料、購買人相關(guān)信息、支付狀況等信息。
(二)數(shù)據(jù)庫設(shè)計(jì)
自二十世紀(jì)的發(fā)展以來,人類步入了信息時(shí)代。計(jì)算機(jī)硬件技術(shù)發(fā)展迅速。越來越多的企業(yè)以及公司用計(jì)算機(jī)來對數(shù)據(jù)信息進(jìn)行管理,所以計(jì)算機(jī)管理的數(shù)據(jù)越來越龐大。為了對數(shù)據(jù)進(jìn)行統(tǒng)一便捷的管理,讓同一數(shù)據(jù)來方便更多的應(yīng)用,便出現(xiàn)了數(shù)據(jù)庫,這一統(tǒng)一管理數(shù)據(jù)的軟件,英文名稱Database。數(shù)據(jù)庫可以滿足,將數(shù)據(jù)進(jìn)行較為合理的存儲,并且同一數(shù)據(jù)可以讓多個(gè)用戶共同使用,冗余度較小。數(shù)據(jù)庫里的數(shù)據(jù)具有較小的數(shù)據(jù)冗余度,較高的數(shù)據(jù)獨(dú)立性和擴(kuò)展性,因?yàn)閿?shù)據(jù)在數(shù)據(jù)庫中是按照一定的數(shù)據(jù)模型組織來進(jìn)行描述和存儲的,他們可以在一定的范圍內(nèi)向用戶提供數(shù)據(jù)的多用戶共享。由于不同的數(shù)據(jù)庫是按照不同的數(shù)據(jù)結(jié)構(gòu)進(jìn)行組織和聯(lián)系的,由這個(gè)特點(diǎn)數(shù)據(jù)庫被分為關(guān)系式、層次式、網(wǎng)狀式三種數(shù)據(jù)庫。隨著技術(shù)的不斷發(fā)展,數(shù)據(jù)庫模型也在不斷升級,出現(xiàn)了數(shù)據(jù)庫管理系統(tǒng),可以實(shí)現(xiàn)建立、使用、維護(hù)、統(tǒng)一管理、控制數(shù)據(jù)庫等多項(xiàng)功能,并可以保證數(shù)據(jù)的安全性和完整性。只有用數(shù)據(jù)庫進(jìn)行管理才能實(shí)現(xiàn)數(shù)據(jù)管理自動(dòng)化,因此,創(chuàng)建以及設(shè)計(jì)系統(tǒng)的第一步便是設(shè)計(jì)以及建立數(shù)據(jù)庫。本房屋銷售管理信息系統(tǒng)的數(shù)據(jù)庫是用PowerBuilder9.0本身自帶的數(shù)據(jù)庫創(chuàng)建的。創(chuàng)建這個(gè)數(shù)據(jù)庫,在D:\bysheji中存放系統(tǒng)的數(shù)據(jù)庫文件。housysm.db為數(shù)據(jù)庫的名字。建立完相關(guān)數(shù)據(jù)庫后就可以來建立相關(guān)表項(xiàng)了,主要有樓盤、戶型、客戶、銷售員等表項(xiàng)。下表便是表項(xiàng)以及相關(guān)內(nèi)容:1)戶型表:戶型編號,建筑面積,平面設(shè)計(jì)圖,套內(nèi)面積,房型,房型簡介;2)樓盤信息表:樓盤編號,樓盤報(bào)價(jià),戶型編碼;3)收費(fèi)記錄表:收費(fèi)項(xiàng)目編號,樓盤編號,收費(fèi)日期,電視費(fèi),電話費(fèi),煤氣費(fèi);4)公用基礎(chǔ)設(shè)施費(fèi),其它費(fèi)用,預(yù)收押金,交款人,收款人;5)售樓人員信息表:售樓人員編號,身份證號碼,姓名,性別,聯(lián)系電話,手機(jī)號碼,電子郵箱;6)用戶登錄表:用戶編號,用戶名稱,登錄密碼;7)客戶信息表:客戶編號,客戶姓名,性別,手機(jī)號碼,客戶職業(yè),聯(lián)系電話,電子郵箱,郵政編碼,備注;8)收款登記表:收款單號,樓盤編號,收款日期,收款金額,付款方式,收款人,交款人;9)合同信息表:合同編號,樓盤編號,買房人身份證號碼,銷售人員編號,樓盤單價(jià),樓盤折扣金額,付款方式,貸款銀行,簽訂時(shí)間,客戶交款記錄。
(三)數(shù)據(jù)窗口對象的創(chuàng)建
系統(tǒng)其他界面的設(shè)計(jì)便不一一介紹了,這里簡單介紹一下數(shù)據(jù)窗口對象的創(chuàng)建。使用PowerBuilder時(shí),其中一個(gè)較為重要的工具便是數(shù)據(jù)窗口對象。由于本系統(tǒng)是使用PowerBuilder設(shè)計(jì)的,所以一定要注意數(shù)據(jù)窗口對象的建立,這是連接數(shù)據(jù)庫與客戶端的工具。在數(shù)據(jù)窗口對象中可以對數(shù)據(jù)進(jìn)行添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作。還可以指定數(shù)據(jù)的輸入格式和輸出格式用數(shù)據(jù)窗口對象可以較為方便以及快捷的建立相關(guān)的較為復(fù)雜的數(shù)據(jù)庫應(yīng)用程序,來為數(shù)據(jù)窗口對象選擇不同的顯示風(fēng)格以及選擇不同的數(shù)據(jù)源,并可以增強(qiáng)它的功能,這就要通過添加各種控件來實(shí)現(xiàn)了。要保證數(shù)據(jù)庫與窗口對象是相互連接的,這樣才能順利的通過數(shù)據(jù)窗口對象對數(shù)據(jù)進(jìn)行相關(guān)操作,要保證添加、修改、查詢、刪除等相關(guān)基礎(chǔ)操作的順利運(yùn)行。所以,一定要保證數(shù)據(jù)窗口對象成功地與數(shù)據(jù)庫相連接。數(shù)據(jù)窗口對象中數(shù)據(jù)的來源便是其中的數(shù)據(jù)源,在本系統(tǒng)的設(shè)計(jì)中,數(shù)據(jù)窗口對象的數(shù)據(jù)源主要有下面兩種:快速選擇數(shù)據(jù)源,QuickSelect。通過建立簡單的Select語句,來進(jìn)行數(shù)據(jù)源的選擇,主要通過一個(gè)表或者由外鍵連接的多個(gè)表來進(jìn)行數(shù)據(jù)列的選擇,但是這種方法有一點(diǎn)缺陷,那便是在創(chuàng)建數(shù)據(jù)窗口對象時(shí)不能生成相應(yīng)的計(jì)算列。SQL選擇數(shù)據(jù)源,SQLSelect。SQL選擇數(shù)據(jù)源,SQLSelect數(shù)據(jù)遠(yuǎn)遠(yuǎn)比快速選擇數(shù)據(jù)源,QuickSelect數(shù)據(jù)源要復(fù)雜的多。通過這種方式可以用可視化的方式來建立較為復(fù)雜的SQL選擇數(shù)據(jù)源的語句結(jié)構(gòu)來構(gòu)造數(shù)據(jù)源,并生成相應(yīng)的計(jì)算列,這是快速選擇數(shù)據(jù)源所做不到的。還可以對數(shù)據(jù)進(jìn)行相應(yīng)的分組排序,還可以進(jìn)行表的關(guān)聯(lián)等等操作。PowerBuilder中的數(shù)據(jù)源,功能最全的便是SQL選擇數(shù)據(jù)源,SQLSelect。數(shù)據(jù)窗口對象顯示數(shù)據(jù)的方式便是數(shù)據(jù)窗口對象的顯示風(fēng)格。這要求數(shù)據(jù)窗口對象顯示的外觀不一定要多么的華麗,但一定要美觀、大方、變化多,以此來適用于不同的場景以及場合。本系統(tǒng)的數(shù)據(jù)窗口的顯示風(fēng)格設(shè)定為,F(xiàn)reeform風(fēng)格和Grid風(fēng)格這兩種風(fēng)格。創(chuàng)建數(shù)據(jù)窗口對象的步驟如下:在進(jìn)入PowerBuilder后,在系統(tǒng)樹窗口中查找并打開該應(yīng)用,找到“File”/“New”進(jìn)行選擇,或者是通過單擊工具條上的相關(guān)圖標(biāo),來彈出新建對象窗口。在這里要選擇“DataWindow”頁,會出現(xiàn)一個(gè)界面,在界面上選擇顯示風(fēng)格。以“客戶信息查詢窗口”為例。先選定Freeform的圖標(biāo),點(diǎn)擊確認(rèn)按鈕或雙擊鼠標(biāo)左鍵。彈出對話框,選擇數(shù)據(jù)庫中的“客戶信息表”,單擊下一步,這樣就可以建立“客戶信息查詢窗口”的數(shù)據(jù)窗口了。然后便可以通過對數(shù)據(jù)窗口對象進(jìn)行操作進(jìn)而對其進(jìn)行相關(guān)操作。
三、總結(jié)
關(guān)鍵詞:單片機(jī)電話主叫信息識別FSK數(shù)據(jù)通信
電話主叫識別信息發(fā)送及接收(俗稱來電顯示),簡稱CID(CallingIdentifyDelivery),是電信局向被叫電話用戶提供的一種服務(wù)項(xiàng)目,是指在被叫用戶終端設(shè)備上顯示主叫電話號碼、主叫用戶姓名、呼叫日期和時(shí)間等主叫識別信息并進(jìn)行存儲,以供用戶查閱的服務(wù)項(xiàng)目。被叫用戶根據(jù)顯示的主叫識別信息而決定是否接聽電話,可以避開一些不愿接聽或不友好的電話。利用這個(gè)功能可以進(jìn)行FSK信息解碼的電話網(wǎng)數(shù)據(jù)通信,應(yīng)用于實(shí)際生活中。
1電話主叫識別原理和傳送協(xié)議
實(shí)現(xiàn)電話主叫信息識別業(yè)務(wù)的基本方法是,發(fā)端程序交換機(jī)將主叫電話號碼等信息通過局間指令系統(tǒng)傳磅給終端交換機(jī),終端交換機(jī)再將主叫識別信息以移頻鍵控FSK(Frequency-ShiftKeying)或雙音多頻DTMF(DualToneMulti-Frequency)方式,在第一次振鈴或第二次振鈴間隔期前傳送給被叫用戶終端設(shè)備。我國的通信行業(yè)標(biāo)準(zhǔn)明確規(guī)定,統(tǒng)一采用FSK方式提供主叫電話來顯示服務(wù)。在一次呼叫中,若被叫用戶申請了CID業(yè)務(wù),則電信局的終端交換機(jī)就會向該被叫用戶傳送主叫識別信息數(shù)據(jù)。傳送流程與時(shí)序如圖1所示。
其中A、B、C、D、E為數(shù)據(jù)傳送時(shí)的狀態(tài)持續(xù)時(shí)間,各段時(shí)間值如表1所列。在數(shù)據(jù)傳送前或傳送過程中,如果用戶摘機(jī),則傳送停止,但呼叫處理正常進(jìn)行。
表1CID信號傳送各段時(shí)間值
符號時(shí)間值說明
tA1s第一次鈴流信號
tB0.5s<tB<1.5s第一次振鈴結(jié)束與數(shù)據(jù)傳送開始之間的時(shí)間間隔
tC≤2.9s傳送數(shù)據(jù)的時(shí)間,包括信道占用信號和標(biāo)志信號
tD≥200ms數(shù)據(jù)傳送結(jié)束與第二次振鈴開始的時(shí)間間隔
tE1s第二次鈴流信號
tB+C+D≤3.6s各時(shí)段可根據(jù)具體情況確定
2主叫識別信息數(shù)據(jù)格式
FSK主叫識別信息數(shù)據(jù)的傳輸格式有兩種:單數(shù)據(jù)消息格式SDMF(SingleDataMessageFormat)和復(fù)合數(shù)據(jù)消息格式MDMF(MultipleDataMessageFormat)。前者的結(jié)構(gòu)簡單,可容納的信息內(nèi)容較少,如主叫號碼、日期和時(shí)間;后者的結(jié)構(gòu)比較復(fù)雜,可容納的信息長度較長,除單數(shù)據(jù)格式內(nèi)容以外還可以主叫用戶的姓名等。本文主要介紹FSK主叫信息數(shù)據(jù)格式的接收。
單數(shù)據(jù)消息格式由消息頭和消息體組合,消息頭由消息類型和消息長度組成,它們均為8位字。消息類型的值來識別消息的特征;消息長度指明后面所跟消息字的長度。消息體包括交換機(jī)需傳給終端用戶的消息。消息體可容納1~255個(gè)8位的消息字。每個(gè)字用8位帶校驗(yàn)位的7位ASCII編碼字符集表示。
一個(gè)完事的消息幀由信道占用信號、標(biāo)志信號、數(shù)據(jù)信息和校驗(yàn)字組成。信道占用信號和標(biāo)志信號用來提示電話終端準(zhǔn)備接收數(shù)據(jù);校驗(yàn)字用來作差錯(cuò)檢查,如圖2所示。
①信道占用信號。這是發(fā)送主叫信息時(shí)要首先發(fā)出的頭標(biāo)志,由一組300個(gè)連續(xù)的“0”和“1”交替地組成。其第一個(gè)位為“0”,最后一個(gè)位為“1”。在通話狀態(tài)下,此信號不發(fā)送。
②標(biāo)志信號。在掛機(jī)狀態(tài)下,程控交換機(jī)向用戶發(fā)送主叫信息時(shí)要先發(fā)送的第二個(gè)標(biāo)志信號,由180個(gè)標(biāo)志位(邏輯“1”)組成。在通話狀態(tài)下,此信號不發(fā)送。
③標(biāo)志位。程控交換機(jī)根據(jù)線路使用情況隨機(jī)插入的標(biāo)志位,由0~10個(gè)邏輯“1”組成。
④數(shù)據(jù)字。主叫信息,每個(gè)數(shù)據(jù)字之前先行一次“0”作起始位,在最后加一位“1”作結(jié)束位,每個(gè)數(shù)字的最低位先發(fā)送。這樣,實(shí)際每個(gè)字為10位,即1PXXXXXXX0,其中P為奇偶校驗(yàn)位。
電話主叫信息數(shù)據(jù)傳送時(shí),信道占用信號首先發(fā)送,后接標(biāo)志信號,最后連續(xù)發(fā)送數(shù)據(jù)字。根據(jù)數(shù)據(jù)傳送情況,間隔地插入一些標(biāo)志位。一般標(biāo)志位會加在如下字的傳送之間:
a.消息類型字與消息長度之間;
b.消息長度字與第一個(gè)參考數(shù)字或消息字之間;
c.參數(shù)類型字與相應(yīng)的參數(shù)長度字之間;
d.參考長度字與第一個(gè)參考字之間;
e.最后一個(gè)參數(shù)字與下一個(gè)參數(shù)類型字之間;
f.最后一個(gè)參考字或消息字與校驗(yàn)字之間。
單數(shù)據(jù)消息格式數(shù)據(jù)傳送按消息類型(04H)、消息長度、消息字、月、日、時(shí)、分、主叫號碼(或“O”或“P”)的順序排列組成消息進(jìn)行傳送。所有的消息字和參數(shù)字都有奇數(shù)偶校驗(yàn)位,采用奇偶校驗(yàn)的方式傳送。
3電話FSK信息通信電路設(shè)計(jì)
本文以FSK信息解調(diào)器SM8220P芯片與單片機(jī)及外電路接口為例,介紹FSK信息的通信接收方法。SM8220P解調(diào)器是日本NPC公司生產(chǎn)的雙列直插、低功耗CMOS集成電路FSK解調(diào)芯片,其解調(diào)器的引腳功能如表2所列。
表2SM8220P引腳功能
符號引腳功能
TIP-RING1,2電話信號輸入端。信號輸入必須隔直流
AGND3模擬地,要通過一個(gè)電容接地
RDIN4振鈴檢測輸入。要把振鈴信號經(jīng)衰減后連接到此引腳
RDRC5振鈴檢測RC延時(shí)電路,低電平有效
RDET6振鈴檢測輸出,內(nèi)部接施密特觸發(fā)電路。當(dāng)為低電平時(shí),表明檢測到振鈴信號輸入;不用時(shí)應(yīng)接地
PWDN7掉電控制,平時(shí)應(yīng)保持為低電平。若為高電平,進(jìn)入掉電工作模式,COSCOUT、CDET和DOUT自動(dòng)被設(shè)置成高電平,AGND、FOUT被設(shè)置成高阻抗?fàn)顟B(tài)
GND8器件地
OSCIN/CLKIN9振蕩放大器輸入,外部振蕩放入器信號經(jīng)此引腳輸入
OSCOUT10振蕩放大器輸出,使用外部振蕩信號時(shí)必須開路
CDET11載波檢測輸出端,低電平有效。為低電平時(shí),表明此時(shí)有FSK載波信號輸入
NC12空腳
DOUT13數(shù)據(jù)輸出,平時(shí)為高電平。當(dāng)CDET=0時(shí),表明此時(shí)電話經(jīng)上有一個(gè)有效的FSK信號輸入,經(jīng)解調(diào)后由該腳輸出
DMIN14解調(diào)器輸入端
FOUT15FSK帶通濾波器輸出端,通過一個(gè)電容耦合連接到DMIN
VDD16電源正極(3~5.5V)
SM8220P遵循Bell202和ITU-TV.23協(xié)議標(biāo)準(zhǔn),以連續(xù)二進(jìn)制脈沖頻移鍵控信號的方式傳輸,傳輸速率為1200bps。支持FSK號碼顯示和姓名顯示等多種功能;芯片內(nèi)部包含電源掉電檢測電路、振鈴檢測電路和載波檢測電路;信號輸入檢測靈敏度高,電源工作電壓較寬(3~5.5V),是進(jìn)行電話FSK信息解碼通信的較好的集成芯片。
為實(shí)現(xiàn)電話FSK信息的接收,采用P87LPC764單片機(jī)控制SM8220P電路,以完成電話FSK信息解碼通信的工作。電話FK信息通信具體電路如圖3所示。
從圖3中可知,對于從電話線上傳輸來的FSK信號,信號傳送在第一次振鈴和第二次振鈴之間。振鈴信號經(jīng)過整流、分壓,加到TIL113光電耦合器件的發(fā)射管上,使發(fā)射管有電流通過而發(fā)光,照射到光敏三極管的基極,臻使光敏三極管飽和導(dǎo)通。在R6上得到大于1V的脈沖信號,輸入到單片機(jī)外部中斷0,喚醒單片機(jī)準(zhǔn)備接收。0.5s后FSK信號經(jīng)過C3、C4、R1、C2的隔直和衰減,輸入到FSK接收器SM8220P的差分輸入端TIP和RING腳,將FSK信號讀取解調(diào)后從DOUT腳輸出ASCII碼的串行序列,由P87LPC764單片機(jī)接收處理,提取出相應(yīng)的電話FSK信息,發(fā)到多功能LED顯示模塊MAX7219驅(qū)動(dòng)數(shù)碼顯示和24C64保存。
4FSK信息接收通信軟件設(shè)計(jì)
單片機(jī)對SM8220P輸出的ASCII碼串行序列的識別過程,由接收和數(shù)據(jù)整合兩部分組成。由于FSK信號波特率為1200bps,每發(fā)1位的時(shí)間是833us,因此,可以設(shè)定定時(shí)器每833us接收1位,每10位提取出1個(gè)數(shù)字。如此反復(fù)循環(huán),直到接收完全FSK信息。當(dāng)有電話來時(shí),在第一聲振鈴后,單片機(jī)開始準(zhǔn)備檢測接收信號,SM8220P開始接收300個(gè)由0、1組成的頻率為1200Hz的信道占用信號和180個(gè)“1”標(biāo)志信號,緊接著接收主叫號碼和時(shí)間。每收到1個(gè)數(shù)字,SM8220P都把它變換成10位(1PXXXXXXXX0)的串行序列,由13腳輸出傳送給P87LPC764單片機(jī),P87LPC764經(jīng)過精確的定時(shí)編程將其檢測整合出相應(yīng)的FSK號碼、時(shí)間等數(shù)據(jù),完成FSK信息解碼、接收通信、接收到的電話號碼可以保存在24C64串行E2PROM中,也可以輸出到LCD上顯示。SM8220P的11腳用來提示電話線上是否有新的FSK信息的輸入。若有新的FSK信息輸入,此引腳將產(chǎn)生低電平。單片機(jī)接收FSK主叫信息可以采用定時(shí)中斷方式,也可以采用延時(shí)查詢的辦法進(jìn)行。電話FSK信息接收通信程序流程如圖4所示。
數(shù)據(jù)挖掘技術(shù)在企業(yè)的信息化建設(shè)中所擔(dān)任的角色是實(shí)現(xiàn)數(shù)據(jù)信息到商業(yè)知識的轉(zhuǎn)化。首先需要明確數(shù)據(jù)挖掘技術(shù)的處理對象,明白商業(yè)活動(dòng)的主題;其次,需要對商業(yè)的主題進(jìn)行分析,并搜集與之相關(guān)的數(shù)據(jù)利用各種技術(shù)對數(shù)據(jù)進(jìn)行整理分析,并載入適合的數(shù)據(jù)挖據(jù)的算法中,建立模型,再從模型中提取出有用的商業(yè)信息,再根據(jù)分析所得結(jié)果調(diào)整算法,以數(shù)據(jù)和信息的可靠性為依據(jù)對結(jié)果進(jìn)行判斷;再次,將獲得的商業(yè)知識融合到企業(yè)的信息平臺,利用人機(jī)界面對企業(yè)的決策活動(dòng)予以支持。另外值得注意的是,由于數(shù)據(jù)挖據(jù)技術(shù)屬于高層次的技術(shù),又關(guān)系到企業(yè)的業(yè)務(wù)機(jī)密,因此,需要極為專業(yè)的技術(shù)人才專業(yè)管理。
2如何實(shí)現(xiàn)數(shù)據(jù)挖掘在企業(yè)的信息化建設(shè)中的應(yīng)用
在企業(yè)進(jìn)行業(yè)務(wù)的操作過程中往往會產(chǎn)生大量需要處理的數(shù)據(jù),這就為數(shù)據(jù)挖掘的應(yīng)用提出了要求,數(shù)據(jù)挖掘的運(yùn)用使企業(yè)的大量的數(shù)據(jù)得到了梳理,分析信息的能力提高,在企業(yè)今后的市場開拓記憶日常的運(yùn)行中發(fā)揮了重要的作用,促進(jìn)企業(yè)的競爭力的提高,那么,數(shù)據(jù)挖據(jù)具體在企業(yè)的信息化建設(shè)中如何應(yīng)用呢,下文將予以介紹。
2.1利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)客戶信息的有效管理具體來說就是通過對客戶信息進(jìn)行分析,為客戶建立一個(gè)合適的購物模式,以滿足客戶的需求為重,這是處理好企業(yè)與客戶之間的關(guān)系的關(guān)鍵。有相關(guān)數(shù)據(jù)顯示,企業(yè)在獲得一個(gè)新的客戶過程中所花費(fèi)的成本比維系一個(gè)老客戶的成本高出6倍-9倍之多,一個(gè)老客戶的流失是以10個(gè)新客戶的獲得為代價(jià)的,由此可見,對于企業(yè)來說老客戶的維護(hù)工作至關(guān)重要。通過數(shù)據(jù)挖掘技術(shù)可以得到老客戶的大量的信息,并對其交易記錄、統(tǒng)計(jì)信息進(jìn)行分析后,可以有目的性的對流失的客戶進(jìn)行分析,找出客戶流失的原因并為新客戶的建立提供模型和經(jīng)驗(yàn),有效地對意向客戶和流失客戶進(jìn)行判斷,起到企業(yè)與客戶的關(guān)系的改善的作用。
2.2利用數(shù)據(jù)挖掘技術(shù)進(jìn)行市場營銷的分析與管理在市場營銷中,數(shù)據(jù)挖掘的作用在于可以促進(jìn)市場的分工,以“客戶過去的消費(fèi)行為可以說明今后的消費(fèi)傾向”為假設(shè),然后對客戶的信息進(jìn)行分析,確定某一群體客戶的消費(fèi)興趣,消費(fèi)的趨向于需要,進(jìn)而對消費(fèi)者的下一次或者下一步的消費(fèi)行為作出判斷,然后再以此為基礎(chǔ),將識別出來的客戶作為一個(gè)消費(fèi)群體,以此制定營銷計(jì)劃,這與傳統(tǒng)的不以消費(fèi)者的實(shí)際需求為參考而進(jìn)行大規(guī)模營銷的手段相比較,在成本的節(jié)約方面貢獻(xiàn)極大,可以帶給企業(yè)更多的利潤。在市場營銷中的應(yīng)用上,各種數(shù)據(jù)挖掘算法都得到了廣泛的應(yīng)用,每種不同的操作手段都可以引導(dǎo)商家做出滿足消費(fèi)者需求的決策與判斷。
3結(jié)束語
近年來,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)越來越受到關(guān)注,其應(yīng)用逐步滲透至多個(gè)行業(yè),開啟了全新的數(shù)據(jù)時(shí)代。數(shù)據(jù)是征信業(yè)務(wù)開展的基礎(chǔ)資料,征信活動(dòng)主要是圍繞數(shù)據(jù)進(jìn)行采集、整理、保存、加工,并最終向信息使用者提供。大數(shù)據(jù)不僅為征信業(yè)發(fā)展提供了極為豐富的數(shù)據(jù)信息資源,也改變了征信產(chǎn)品設(shè)計(jì)和生產(chǎn)理念,成為了未來征信業(yè)發(fā)展最重要的基石。我國征信業(yè)發(fā)展尚處于起步階段,在大數(shù)據(jù)時(shí)代存在征信法律制度和業(yè)務(wù)規(guī)則不夠完善、征信機(jī)構(gòu)數(shù)據(jù)處理能力有待提高等問題。未來征信業(yè)面臨的機(jī)遇和挑戰(zhàn)并存,研究大數(shù)據(jù)時(shí)代征信業(yè)的發(fā)展具有重要意義。
大數(shù)據(jù)時(shí)代征信業(yè)面臨的機(jī)遇和挑戰(zhàn)
目前,對大數(shù)據(jù)無公認(rèn)的定義,一般認(rèn)為大數(shù)據(jù)是指所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為服務(wù)于經(jīng)營決策的資訊。大數(shù)據(jù)的出現(xiàn),使征信業(yè)發(fā)展面臨的外部環(huán)境發(fā)生了巨大的變化。
(一)大數(shù)據(jù)時(shí)代征信業(yè)面臨的機(jī)遇。
1.優(yōu)化征信市場的格局。
隨著征信機(jī)構(gòu)市場化運(yùn)營機(jī)制的確立,將會有更多信息資源優(yōu)勢的企業(yè)借助互聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術(shù)的創(chuàng)新進(jìn)步,從征信業(yè)薄弱環(huán)節(jié)切入,通過服務(wù)創(chuàng)新或產(chǎn)品創(chuàng)新打破原有的征信市場格局。一是電商企業(yè)將組建征信機(jī)構(gòu)。以阿里巴巴為例,其利用淘寶、天貓、支付寶平臺上的行為數(shù)據(jù)和信用情況,建立成了涵蓋數(shù)十萬企業(yè)的數(shù)據(jù)庫,具備了開展網(wǎng)絡(luò)征信服務(wù)的基礎(chǔ)和實(shí)力。二是金融機(jī)構(gòu)建立征信機(jī)構(gòu)。例如平安集團(tuán)擬整合網(wǎng)貸信息、銀行信貸信息、車輛違章信息等,建立金融數(shù)據(jù)挖掘中介機(jī)構(gòu)。三是新型征信機(jī)構(gòu)應(yīng)運(yùn)而生。一些大數(shù)據(jù)公司依靠技術(shù)手段,以電子商務(wù)、社交網(wǎng)絡(luò)為平臺,采集信息,提供信用信息服務(wù),可能成為新型的征信機(jī)構(gòu)。
2.推動(dòng)征信業(yè)的轉(zhuǎn)型升級。
大數(shù)據(jù)給征信業(yè)帶來轉(zhuǎn)型升級的歷史機(jī)遇,未來的征信業(yè)將以智能數(shù)據(jù)分析系統(tǒng)為平臺,利用大數(shù)據(jù)挖掘技術(shù),支持征信業(yè)發(fā)展創(chuàng)新。大數(shù)據(jù)支持征信業(yè)升級和轉(zhuǎn)型主要體現(xiàn)在二個(gè)方面。一方面大數(shù)據(jù)促成征信業(yè)建立全新的風(fēng)險(xiǎn)控制體制,向有效監(jiān)管轉(zhuǎn)型。大數(shù)據(jù)技術(shù)對客戶信用信息進(jìn)行深度挖掘,實(shí)時(shí)監(jiān)控,防范潛在的信用風(fēng)險(xiǎn)。另一方面大數(shù)據(jù)支持征信機(jī)構(gòu)向精細(xì)化管理轉(zhuǎn)變。大數(shù)據(jù)的核心優(yōu)勢在于信息挖掘,精細(xì)化管理的首要條件是充分信息化,包括業(yè)務(wù)信息化和管理信息化。
3.促進(jìn)征信業(yè)差異化競爭。
征信機(jī)構(gòu)通過采用不同的數(shù)據(jù)來源,不同的數(shù)據(jù)處理方式,針對不同的客戶,開發(fā)出不同的產(chǎn)品,滿足不同層次客戶的市場需求,實(shí)現(xiàn)差異化競爭。例如,金融機(jī)構(gòu)對征信服務(wù)的需求將從單個(gè)借款主體的信用報(bào)告,擴(kuò)展到運(yùn)用信用信息拓展網(wǎng)絡(luò)影響和金融服務(wù)渠道。P2P網(wǎng)絡(luò)借貸、電商金融等業(yè)態(tài)需要借助信用信息共享防范風(fēng)險(xiǎn),降低交易成本。
4.拓展征信數(shù)據(jù)來源。
大數(shù)據(jù)使征信數(shù)據(jù)來源呈現(xiàn)多元化、多層化和非結(jié)構(gòu)化的特點(diǎn),更加全面和真實(shí)地反映信息主體的信用情況。征信機(jī)構(gòu)從在政府部門、金融機(jī)構(gòu)等實(shí)體機(jī)構(gòu)中采集信息,轉(zhuǎn)向從互聯(lián)網(wǎng)等虛擬世界中獲取信息。在數(shù)據(jù)采集的廣度和深度上,征信數(shù)據(jù)量將激增,采集包括證券數(shù)據(jù)、保險(xiǎn)數(shù)據(jù)、商業(yè)信用數(shù)據(jù)、消費(fèi)交易數(shù)據(jù)和公共事業(yè)繳費(fèi)數(shù)據(jù)等,全面地覆蓋與信息主體相關(guān)的各項(xiàng)因素。
(二)大數(shù)據(jù)時(shí)代征信業(yè)面臨的挑戰(zhàn)。
1.現(xiàn)有征信業(yè)務(wù)規(guī)則與大數(shù)據(jù)時(shí)代不匹配。我國有關(guān)征信業(yè)的法律法規(guī)的規(guī)制對象主要是傳統(tǒng)金融領(lǐng)域,《征信業(yè)管理?xiàng)l例》及其配套制度初步構(gòu)建了我國征信業(yè)的法律法規(guī)框架,但是《征信業(yè)管理?xiàng)l例》是否滿足大數(shù)據(jù)時(shí)代征信業(yè)務(wù)的規(guī)則要求,尚未得到市場驗(yàn)證。目前,缺少對大數(shù)據(jù)時(shí)代征信活動(dòng)的規(guī)范,如有關(guān)大數(shù)據(jù)采集、整理、保存、加工和處理的制度要求。因此,還需要進(jìn)一步細(xì)化和完善征信業(yè)務(wù)規(guī)則,以更好促進(jìn)大數(shù)據(jù)時(shí)代征信市場的發(fā)展。
2.征信業(yè)監(jiān)管技術(shù)和水平需改進(jìn)。大數(shù)據(jù)時(shí)代給征信業(yè)發(fā)展帶來深刻影響,同時(shí)也對征信業(yè)監(jiān)管提出了更高的要求。要適應(yīng)大數(shù)據(jù)時(shí)代的征信監(jiān)管需求,征信監(jiān)管水平要能跟上大數(shù)據(jù)征信的發(fā)展水平,監(jiān)管政策要符合大數(shù)據(jù)的基本規(guī)律,監(jiān)管人員要具有適應(yīng)大數(shù)據(jù)的知識和能力。在行業(yè)自律監(jiān)管方面,我國行業(yè)監(jiān)管尚未發(fā)育成熟,行業(yè)標(biāo)準(zhǔn)尚未統(tǒng)一,行業(yè)規(guī)范以及行業(yè)職業(yè)道德等內(nèi)容尚未完善。
3.信息安全和隱私保護(hù)形勢嚴(yán)峻。隨著數(shù)據(jù)的進(jìn)一步集中和數(shù)據(jù)量的急劇增長,對海量數(shù)據(jù)進(jìn)行安全防護(hù)變得更加困難,數(shù)據(jù)的分布式處理也加大了數(shù)據(jù)泄露的風(fēng)險(xiǎn),隱私保護(hù)和數(shù)據(jù)安全成為制約大數(shù)據(jù)發(fā)展的瓶頸。大數(shù)據(jù)時(shí)代下的征信業(yè)同時(shí)具有了大數(shù)據(jù)和征信兩個(gè)特性,對隱私保護(hù)和數(shù)據(jù)安全的要求更高。
4.數(shù)據(jù)處理能力亟待提高。如何有效處理大數(shù)據(jù),是大數(shù)據(jù)發(fā)揮作用的重要環(huán)節(jié)。益百利等大型征信機(jī)構(gòu)在數(shù)據(jù)處理方面已經(jīng)采取多層次數(shù)據(jù)挖掘等先進(jìn)技術(shù),利用私有云平臺,對系統(tǒng)中海量數(shù)據(jù)進(jìn)行處理和研發(fā),減少主觀判斷,提高風(fēng)險(xiǎn)預(yù)測的準(zhǔn)確性。但是目前我國征信機(jī)構(gòu)發(fā)展起步較晚,缺少對數(shù)據(jù)處理的核心技術(shù),導(dǎo)致數(shù)據(jù)分析結(jié)果不能夠準(zhǔn)確的識別個(gè)體或組織的行為。
5.硬件基礎(chǔ)設(shè)施需要全面升級。過去征信機(jī)構(gòu)存儲征信數(shù)據(jù)主要是在本地建立數(shù)據(jù)庫,大數(shù)據(jù)時(shí)代隨著數(shù)據(jù)量呈幾何級數(shù)的增加,征信機(jī)構(gòu)硬件技術(shù)的發(fā)展已經(jīng)跟不上數(shù)據(jù)容量的增長速度,數(shù)據(jù)存儲面臨較大壓力。
大數(shù)據(jù)時(shí)代征信業(yè)發(fā)展的措施與建議
隨著大數(shù)據(jù)時(shí)代的到來,未來征信業(yè)發(fā)展要從制度設(shè)計(jì)、技術(shù)進(jìn)步、信息共享、監(jiān)督管理、隱私保護(hù)等方面不斷創(chuàng)新,促進(jìn)征信業(yè)在大數(shù)據(jù)背景下的跨越式發(fā)展。
(一)建立符合大數(shù)據(jù)的征信法律制度和業(yè)務(wù)規(guī)則體系?,F(xiàn)有的征信法律體系都是基于傳統(tǒng)數(shù)據(jù)模式下制定的,難以滿足大數(shù)據(jù)等新技術(shù)條件下征信業(yè)發(fā)展的制度需求。在征信業(yè)務(wù)開展過程中,大數(shù)據(jù)的收集使用可能涉及國家信息安全、企業(yè)商業(yè)秘密、公民隱私等,為了給大數(shù)據(jù)條件下征信業(yè)發(fā)展提供制度保障,需要從征信立法層面完善信息安全和數(shù)據(jù)管理的法律制度,明確大數(shù)據(jù)背景下數(shù)據(jù)采集、整理、加工、分析、使用的規(guī)則,確保大數(shù)據(jù)時(shí)代征信業(yè)發(fā)展有法可依。
(二)加強(qiáng)征信產(chǎn)品創(chuàng)新。隨著可獲得的數(shù)據(jù)量呈幾何倍數(shù)的增加,征信機(jī)構(gòu)通過深度挖掘和使用這些數(shù)據(jù),就可以極大地拓展征信產(chǎn)品的種類,不僅能夠提供信用報(bào)告查詢等基礎(chǔ)服務(wù)和產(chǎn)品,還可以提供其他綜合性產(chǎn)品,滿足社會各界的需求。從征信產(chǎn)品的滿足層次高低的不同,可以分為宏觀、中觀和微觀的征信產(chǎn)品。宏觀層面,征信機(jī)構(gòu)通過大數(shù)據(jù)分析可以對系統(tǒng)性、全局性的風(fēng)險(xiǎn)信息進(jìn)行預(yù)測。中觀層面,征信機(jī)構(gòu)的海量數(shù)據(jù)包含大量時(shí)效性和政策含義都很強(qiáng)的信息,可以靈活多樣地進(jìn)行多維度組合分析。把這些信息整理和挖掘出來,建立對應(yīng)的指數(shù)體系,有助于行業(yè)監(jiān)管。微觀層面,在信用主體(包括企業(yè)和個(gè)人)同意的前提下,征信機(jī)構(gòu)可以提供每一個(gè)信用主體的信用報(bào)告、信用評分、身份驗(yàn)證、欺詐檢測、風(fēng)險(xiǎn)預(yù)警、關(guān)聯(lián)分析等多種數(shù)據(jù)服務(wù)。
(三)提高大數(shù)據(jù)技術(shù)處理能力。大數(shù)據(jù)價(jià)值的完整體現(xiàn)需要多種技術(shù)的協(xié)同。數(shù)據(jù)抽取與集成、數(shù)據(jù)分析以及數(shù)據(jù)解釋,是大數(shù)據(jù)時(shí)代征信數(shù)據(jù)處理的三個(gè)重要環(huán)節(jié),在數(shù)據(jù)處理過程中搜索引擎、云計(jì)算、數(shù)據(jù)挖掘等新技術(shù)使用必不可少。因此,征信機(jī)構(gòu)要加大數(shù)據(jù)處理分析專業(yè)人才隊(duì)伍的培養(yǎng),同時(shí)要引進(jìn)大數(shù)據(jù)處理的專業(yè)方法和工具,建立前瞻性的征信業(yè)務(wù)分析模型,更好的把握、預(yù)測市場和信息主體的行為。
(四)健全大數(shù)據(jù)信息共享機(jī)制。完善的大數(shù)據(jù)標(biāo)準(zhǔn)體系是推進(jìn)數(shù)據(jù)共建共享的前提。目前,我國來自各行業(yè)、各渠道的數(shù)據(jù)標(biāo)準(zhǔn)存在差異,成為阻礙數(shù)據(jù)開放和共享的關(guān)鍵瓶頸。建議盡快統(tǒng)一標(biāo)準(zhǔn)和格式,以便進(jìn)行規(guī)范化的數(shù)據(jù)融合,提升大數(shù)據(jù)的整合能力,打破資源部門間的信息孤島,從而完善信息共享機(jī)制。
一、對稅務(wù)數(shù)據(jù)深度利用的理解
長期以來,稅收工作中數(shù)據(jù)利用比較常見的形式有:報(bào)表瀏覽、簡單查詢、復(fù)雜查詢、稅源分析、稅負(fù)分析、收入預(yù)測、過程監(jiān)控等,多數(shù)專家認(rèn)為,目前稅務(wù)數(shù)據(jù)應(yīng)用的一般特征是基于匯總、分類、簡單計(jì)算基礎(chǔ)之上的原始稅收數(shù)據(jù)的“復(fù)制式”展現(xiàn)和對稅收現(xiàn)象的“陳列式”描述。
隨著經(jīng)濟(jì)、社會的發(fā)展,稅收數(shù)據(jù)的般利用已經(jīng)不能滿足稅收信息化深化和稅收管理現(xiàn)代化的內(nèi)在需求,為了加強(qiáng)稅收征管、規(guī)范稅收秩序,國務(wù)院于1994年開始實(shí)施“金稅工程”?!敖鸲惞こ獭背跗谝浴霸鲋刀惐O(jiān)管”為主要目標(biāo);二期時(shí),內(nèi)容已拓寬為增值稅防偽稅控開票系統(tǒng)、防偽稅控認(rèn)證系統(tǒng)、增值稅計(jì)算機(jī)交叉稽核系統(tǒng)、發(fā)票協(xié)查信息管理系統(tǒng)的四個(gè)系統(tǒng);到了三期,其目標(biāo)已經(jīng)成為:在二期基礎(chǔ)上,建立七個(gè)子系統(tǒng)(管理子系統(tǒng)、征收子系統(tǒng)、稽查子系統(tǒng)、處罰子系統(tǒng)、執(zhí)行子系統(tǒng)、救濟(jì)子系統(tǒng)、監(jiān)控子系統(tǒng)),35個(gè)模塊。依據(jù)美國學(xué)者Richard.L-Nolan的理論(對于任何行業(yè),信息化大體要經(jīng)歷初始、蔓延、控制、集成、數(shù)據(jù)管理和成熟這樣幾個(gè)發(fā)展階段,這是信息化發(fā)展的般規(guī)律。)和Mische的補(bǔ)充(他認(rèn)為集成和數(shù)據(jù)管理是密不可分的,因此信息化發(fā)展的必然路徑是起步、增長、成熟和更新四個(gè)階段),目前,稅務(wù)信息化的發(fā)展階段已開始向成熟階段過渡。于是稅收數(shù)據(jù)的深度利用便提上日程。我們可以從稅收管理戰(zhàn)略和稅收政策分析兩方面來看這種需求的提出。
從稅務(wù)管理戰(zhàn)略來看,在納稅前如何綜合評價(jià)簡化管理制度(法律)及照章納稅宣傳的相對效果;在納稅中如何核算稅收結(jié)構(gòu)和管理程度的實(shí)際資源成本(管理、照章納稅、效率、逃稅),以及納稅后對稅收差距的衡量(包括潛在稅收與申報(bào)稅收的差距、申報(bào)稅收與實(shí)收稅收的差距、實(shí)收稅收與送達(dá)國庫稅收的差距),都涉及到稅收數(shù)據(jù)的深度利用問題。
從稅收政策分析的角度來看,稅收經(jīng)濟(jì)的和諧發(fā)展度量、稅制改革方案分析、稅收減免和優(yōu)惠的成本和政策收益、稅收政策的經(jīng)濟(jì)影響等等也涉及到稅收數(shù)據(jù)的深度利用和挖掘問題。
這些問題都從以下兩方面引發(fā)了我們對稅務(wù)數(shù)據(jù)深度利用的理解和思考:一方面提出了我們需要全面檢視擁有的稅務(wù)數(shù)據(jù)信息的需求。在各國稅務(wù)數(shù)據(jù)信息深度利用的經(jīng)驗(yàn)當(dāng)中,提出過一些全面檢視的標(biāo)準(zhǔn),例如按照稅基到稅收收入的實(shí)現(xiàn)途徑,可以檢視:稅基的規(guī)模,包括真實(shí)稅基和潛在稅基;稅收管理資源使用方向的詳細(xì)分類;管理資源使用的效用;稅收管理的效果,例如收到稅款的多少,處理案件的數(shù)量等。
另一方面,更為關(guān)鍵的是,提出了如何科學(xué)利用、深度利用的問題。總結(jié)以上兩方面,我們認(rèn)為稅收數(shù)據(jù)的深度利用是指:在數(shù)據(jù)集中和系統(tǒng)整合的基礎(chǔ)上,建立全面的稅務(wù)數(shù)據(jù)信息,既包括稅務(wù)系統(tǒng)內(nèi)部數(shù)據(jù),也包括其他政府部門、企業(yè)、居民等外部數(shù)據(jù),并且進(jìn)一步在各種模型的幫助下,發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在規(guī)律。就目前而言,重點(diǎn)任務(wù)是在稅務(wù)管理方面提出適用中國實(shí)踐的模型并且應(yīng)用,同時(shí)初步探索在稅收經(jīng)濟(jì)方面能夠刻畫符合我國國情的模型。
二、構(gòu)建模型是數(shù)據(jù)深度利用的切入口
如前所述,稅務(wù)數(shù)據(jù)深度利用和挖掘的關(guān)鍵在于模型的應(yīng)用,下面我們就來討論模型是什么?我們?yōu)槭裁葱枰P?我們需要什么樣的模型?就稅收數(shù)據(jù)深度利用的模型而言,大致可以分為兩類:以科學(xué)化管理、定量化管理、精細(xì)化管理為內(nèi)在思想的管理工具和手段所形成的模型;以研究稅收經(jīng)濟(jì)關(guān)系協(xié)調(diào)發(fā)展為目的的稅收經(jīng)濟(jì)模型。
在基本認(rèn)識了稅務(wù)數(shù)據(jù)深度利用中的模型是什么之后,雖然我們達(dá)成了一種共識,我們需要模型,但是如果我們思考過為什么需要模型?顯然會對模型應(yīng)用更能得心應(yīng)手。我們認(rèn)為模型所發(fā)揮的作用無外乎以下三種:
首先,刻畫稅收經(jīng)濟(jì)關(guān)系。一般而言,我們經(jīng)常提到的是模型在刻畫稅收經(jīng)濟(jì)關(guān)系當(dāng)中所起的作用,即采用代數(shù)形式的定量分析將稅收經(jīng)濟(jì)理論模型化,然后適當(dāng)根據(jù)實(shí)踐情況把理論模型予以修正,并將相關(guān)數(shù)據(jù)應(yīng)用到修正模型中,對模型結(jié)果進(jìn)行經(jīng)驗(yàn)分析。這種利用的過程是階段性的,是從初級到高級的過程,是一個(gè)水平不斷提高、效果不斷改進(jìn)的發(fā)展過程。
其次,歸納稅收管理實(shí)踐。模型起到的作用是將復(fù)雜的稅收征納活動(dòng)通過數(shù)字化的形式總結(jié)歸納,將稅收征納的每一個(gè)過程精細(xì)化、每一個(gè)結(jié)果數(shù)據(jù)化,并且建立起投入到產(chǎn)出之間的對應(yīng)關(guān)系。最后,數(shù)據(jù)組織的導(dǎo)向性作用。這種導(dǎo)向性作用的發(fā)揮是通過模型應(yīng)用過程當(dāng)中對各類數(shù)據(jù)提出的要求實(shí)現(xiàn)的,通過該作用,隨著時(shí)間的發(fā)展,數(shù)據(jù)集中的有效性與目的性不斷加強(qiáng),反之,模型應(yīng)用空間不斷擴(kuò)展。在這一方面,美國個(gè)人所得稅模型應(yīng)用為我們提供了很好的啟迪。
結(jié)合目前的稅務(wù)數(shù)據(jù)基礎(chǔ)及其發(fā)展趨勢來看,金稅三期將成為稅收數(shù)據(jù)深度利用的良好契機(jī),構(gòu)建相應(yīng)模型是我們形成稅務(wù)數(shù)據(jù)深度利用良好局面的切入口。
對于“我們需要什么樣的模型”的回答,是一個(gè)不斷結(jié)合實(shí)際進(jìn)行摸索的過程,但是就現(xiàn)階段而言,從可操作性的角度出發(fā),我們還是需要給所應(yīng)用的模型框定一個(gè)邊界:數(shù)據(jù)可利用性,如果沒有數(shù)據(jù)的支持,模型應(yīng)用將無從談起;可計(jì)算性,模型應(yīng)用迅速發(fā)展的基石之一就是現(xiàn)代計(jì)算技術(shù)的發(fā)展,沒有計(jì)算工具的支持,具有龐大計(jì)算量的各種稅收模型的完成無法想象,支持稅收模型應(yīng)用的計(jì)算工具包括硬件具備的計(jì)算能力和軟件具有的算法能力兩種。
三、數(shù)據(jù)深度利用平臺建設(shè)的體厶
數(shù)據(jù)深度利用和挖掘最終必須落實(shí)到具體計(jì)算平臺上,否則縱然有大量的數(shù)據(jù)積累,仍然擺脫不了研究與實(shí)踐部門脫節(jié)的窘態(tài)。雖然目前我們擁有大量的計(jì)算軟件平臺,然而,總感覺到這些應(yīng)用平臺離我們的實(shí)際需要有一定距離。
目前我們正在參與完成一個(gè)國家自然科學(xué)基金研究項(xiàng)目:稅收政策分析模型支持系統(tǒng)的實(shí)現(xiàn)及其在稅制改革中的應(yīng)用研究,其主要內(nèi)容和實(shí)質(zhì)就是探索構(gòu)建一個(gè)有利干數(shù)據(jù)深度利用的計(jì)算平臺。從該平臺的構(gòu)建來看,有幾點(diǎn)體會:首先,平臺的構(gòu)建必須結(jié)合具體的研究問題展開。通用性的平臺雖然很好,但是由于前面所提到的數(shù)據(jù)可利用性和可計(jì)算性的原因,加上實(shí)際工作的緊迫性需求,往往使得通用性平臺的規(guī)劃會落空,甚至于進(jìn)一步影響數(shù)據(jù)深度利用工作本身。在該問題上,我們的平臺研究就結(jié)合了增值稅轉(zhuǎn)型的測算問題,利用了CGE平臺進(jìn)行實(shí)證性的應(yīng)用。
其次,考慮針對具體問題研究的通用性拓展。雖然實(shí)用為先,然而要做到持續(xù)性的數(shù)據(jù)利用,必然要考慮拓展的問題。在這個(gè)問題上,我們的平臺通過稅制表示方法、稅收政策分析模型描述語言中國稅收政策分析模型支持系統(tǒng)等方法進(jìn)行嘗試。
更為重要的是,對適合中國國情的稅收經(jīng)濟(jì)模型的提出。由于長期以來的數(shù)據(jù)缺少原因,在我國模型建設(shè)方面沒有進(jìn)一步的探索。這種缺陷在海量的數(shù)據(jù)突然呈現(xiàn)在我們面前的時(shí)候更加突出。我們正在嘗試提出適用干中國的稅收經(jīng)濟(jì)模型,雖然肯定會比較艱難,但是這是一條必經(jīng)之路。
當(dāng)前“大數(shù)據(jù)技術(shù)”充滿了新的機(jī)遇和挑戰(zhàn),其在企業(yè)IT基礎(chǔ)架構(gòu)、數(shù)據(jù)管理、分析和服務(wù)這些關(guān)鍵規(guī)劃領(lǐng)域的應(yīng)用,將會對社會經(jīng)濟(jì)發(fā)展帶來長遠(yuǎn)深刻的影響。大數(shù)據(jù)指的是從各種各樣的數(shù)據(jù)中快速獲得有價(jià)值信息的能力,具有數(shù)據(jù)量大、種類繁多、價(jià)值稀疏、處理速度快的特征,這些特征對目前社會各個(gè)行業(yè)的信息架構(gòu)、系統(tǒng)的沖擊非常大。大數(shù)據(jù)技術(shù)對整個(gè)社會經(jīng)濟(jì)發(fā)展來說既是機(jī)遇也是挑戰(zhàn)。
(一)必要性
根據(jù)IDC在2011年6月的《數(shù)字宇宙》(DigitalUniverse)研究報(bào)告,2011年全球新建和復(fù)制的信息量超過1.9ZB(1.8萬億GB),五年時(shí)間增加了近九倍。隨著數(shù)據(jù)量的指數(shù)級增長、數(shù)據(jù)源種類(包括結(jié)構(gòu)化數(shù)據(jù)源和非結(jié)構(gòu)化數(shù)據(jù)源,如社交媒體、富媒體文件以及地理空間信息)的飛速增加,以及數(shù)據(jù)產(chǎn)生速度的加快(如實(shí)時(shí)傳感器數(shù)據(jù)),傳統(tǒng)的數(shù)據(jù)庫和架構(gòu)無法處理、管理和分析如此龐大的數(shù)據(jù)集。政府、金融、電信、互聯(lián)網(wǎng)等大數(shù)據(jù)應(yīng)用的行業(yè)先鋒目前均面臨大數(shù)據(jù)的問題。不僅如此,隨著物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、智能手機(jī)、平板電腦的飛速發(fā)展,大數(shù)據(jù)技術(shù)擁有了更為廣泛的數(shù)據(jù)資源。因此,IT產(chǎn)業(yè)界及行業(yè)用戶都亟需針對大數(shù)據(jù)設(shè)計(jì)和優(yōu)化大數(shù)據(jù)存儲、管理和查詢平臺,來替代傳統(tǒng)關(guān)系型數(shù)據(jù)庫平臺。在技術(shù)發(fā)展的前沿階段進(jìn)行實(shí)驗(yàn)平臺建設(shè)對我學(xué)院師生具有重要意義。該實(shí)驗(yàn)平臺能夠?yàn)閷W(xué)生提供一個(gè)了解最前沿技術(shù)的機(jī)會,不僅能夠提高學(xué)生學(xué)習(xí)興趣、自學(xué)能力,還為學(xué)生就業(yè)、更好地規(guī)劃未來的職業(yè)發(fā)展提供了機(jī)會。大數(shù)據(jù)技術(shù)的機(jī)遇與挑戰(zhàn)帶來了很大的人才缺口,目前大數(shù)據(jù)技術(shù)平臺開發(fā)、方案實(shí)施人才緊缺;由于云存儲、大數(shù)據(jù)技術(shù)帶來的信息安全問題,也亟需大量信息安全領(lǐng)域的人才;由于大數(shù)據(jù)技術(shù)在物聯(lián)網(wǎng)、電子商務(wù)、移動(dòng)互聯(lián)方面的應(yīng)用,對了解大數(shù)據(jù)技術(shù)的電子商務(wù)專業(yè)人才也更青睞。通過本實(shí)驗(yàn)平臺的培養(yǎng),感興趣的優(yōu)秀學(xué)生還可以嘗試考取與大數(shù)據(jù)技術(shù)密切相關(guān)的Hadoop專業(yè)認(rèn)證———ClouderaCertifiedDeveloper/AdministratorforApacheHadoop,為學(xué)校、學(xué)院在該領(lǐng)域帶來正面影響,增加更多合作和就業(yè)的機(jī)會。該實(shí)驗(yàn)平臺能夠?yàn)樾畔⑾到y(tǒng)專業(yè)試點(diǎn)班培養(yǎng)計(jì)劃的很多核心課程(包括管理統(tǒng)計(jì)學(xué)中的業(yè)務(wù)報(bào)表與分析、商務(wù)智能方法與應(yīng)用、商務(wù)智能實(shí)踐、數(shù)據(jù)挖掘和BA綜合實(shí)訓(xùn)等)形成較好的前后銜接關(guān)系,能夠豐富實(shí)踐教學(xué)環(huán)節(jié),深化教學(xué)大綱的內(nèi)容,從建設(shè)更合理的課程建設(shè)體系來說具有很大的必要性。近幾年學(xué)生就業(yè)壓力越來越大,迫切需要對教學(xué)內(nèi)容和實(shí)踐環(huán)節(jié)不斷突破創(chuàng)新,才能具備持續(xù)發(fā)展能力。因此在原有課程體系和實(shí)踐教學(xué)環(huán)境的基礎(chǔ)上增設(shè)本實(shí)驗(yàn)平臺非常必要。
(二)可行性
教學(xué)計(jì)劃中的相關(guān)程序設(shè)計(jì)課程為學(xué)生學(xué)習(xí)云存儲技術(shù)、熟悉大數(shù)據(jù)開發(fā)平臺、了解最新大數(shù)據(jù)技術(shù)的發(fā)展、進(jìn)行大數(shù)據(jù)平臺基礎(chǔ)上的開發(fā)、實(shí)現(xiàn)對大數(shù)據(jù)的分析、可視化演示打好了基礎(chǔ)。英特爾ApacheHadoop平臺是目前大多數(shù)大數(shù)據(jù)處理的技術(shù)基礎(chǔ),目前該技術(shù)已經(jīng)發(fā)展成熟,并隨之產(chǎn)生很多基于該平臺的大數(shù)據(jù)處理工具,可供實(shí)驗(yàn)室建設(shè)實(shí)驗(yàn)平臺使用。
二、建立大數(shù)據(jù)實(shí)驗(yàn)平臺的基本構(gòu)想
(一)實(shí)驗(yàn)平臺人員
實(shí)驗(yàn)平臺人員負(fù)責(zé)實(shí)驗(yàn)平臺的建設(shè)、維護(hù),實(shí)驗(yàn)設(shè)計(jì)與指導(dǎo)人員由在大數(shù)據(jù)相關(guān)領(lǐng)域、課程建設(shè)以及實(shí)踐教學(xué)方面都有著豐富的經(jīng)驗(yàn)的教師與實(shí)驗(yàn)室工作人員構(gòu)成,同時(shí)與大數(shù)據(jù)企業(yè)進(jìn)行合作,獲得其核心技術(shù)人員的支持、培訓(xùn)和大力配合,可以共同組成一個(gè)經(jīng)驗(yàn)豐富、精煉實(shí)干的建設(shè)團(tuán)隊(duì)。
(二)軟件調(diào)研
大數(shù)據(jù)的特點(diǎn)為4個(gè)“V”:第一,“Volume”,指的數(shù)據(jù)量大,包括大的數(shù)據(jù)塊,或數(shù)據(jù)總量巨大,從TB躍升到PB;第二,“Variety”,指的是數(shù)據(jù)種類繁多,包含大量非結(jié)構(gòu)化數(shù)據(jù),例如網(wǎng)絡(luò)日志、音頻、視頻、地理信息等;第三,“Value”,價(jià)值稀疏性,大量數(shù)據(jù)中有價(jià)值數(shù)據(jù)很少;第四,“Velocity”,指的是處理速度快,這與傳統(tǒng)數(shù)據(jù)挖掘有很大區(qū)別。選擇有數(shù)據(jù)分析基礎(chǔ)、在業(yè)內(nèi)發(fā)展領(lǐng)先的企業(yè)進(jìn)行調(diào)研并選擇適合高校規(guī)模的合作企業(yè)是建立實(shí)驗(yàn)平臺的重要工作。很多公司給出了可供使用的大數(shù)據(jù)平臺:IBM誖InfoSphere誖BigInsightsTMBasicEdition是一款基于開放源碼ApacheHadoop的分析平臺,用于分析大量本機(jī)格式的非常規(guī)數(shù)據(jù),支持結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化內(nèi)容,以實(shí)現(xiàn)最大程度的靈活性;IBM誖InfoSphere誖Streams是一個(gè)高級計(jì)算平臺,幫助用戶開發(fā)的應(yīng)用程序快速攝取、分析和關(guān)聯(lián)來自數(shù)千個(gè)實(shí)時(shí)源的信息;惠普公司Vertica分析平臺6.1,能夠通過Hadoop分布式文件系統(tǒng)連接器來優(yōu)化大數(shù)據(jù);ClearStoryData大數(shù)據(jù)分析新創(chuàng)公司,通過Clearstory,公司客戶可以將自身的數(shù)據(jù)與行業(yè)的公共數(shù)據(jù)融合,尋找統(tǒng)計(jì)上的新視角,目標(biāo)是取代目前市場上的主流數(shù)據(jù)可視化工具,包括QlikView和Tableau等老牌工具;Informatica9.1提供首款Hadoop編譯器Hparse,這是一種針對Hadoop而優(yōu)化的數(shù)據(jù)轉(zhuǎn)換環(huán)境,該軟件支持靈活高效地處理Hadoop里面的任何文件格式,為Hadoop開發(fā)人員提供了即開即用的解析功能,以便處理復(fù)雜而多樣的數(shù)據(jù)源;Datameer:Hadoop海量數(shù)據(jù)分析平臺允許用戶在缺乏技術(shù)知識的情況下能夠分析大量數(shù)據(jù);Infochimps平臺以其完備的基礎(chǔ)設(shè)施和專業(yè)知識,為客戶提供端到端的大數(shù)據(jù)解決方案,Infochimps是一家位于美國德克薩斯州奧斯丁的創(chuàng)業(yè)公司,2012年2月從數(shù)據(jù)市場轉(zhuǎn)型為大數(shù)據(jù)平臺提供商后獲得谷歌投資;甲骨文大數(shù)據(jù)機(jī)———OracleBigDataAppliance集成系統(tǒng)融入了Cloudera的DistributionIncludingApacheHadoop、ClouderaManager和一個(gè)開源R;微軟SQLServer新增PDW功能,可以幫助客戶擴(kuò)展部屬數(shù)百TB級別數(shù)據(jù)的分析解決方案;亞馬遜將MapReduce作為一項(xiàng)服務(wù),其彈性MapReduce編程是一項(xiàng)能夠迅速擴(kuò)展的Web服務(wù),運(yùn)行在aws的亞馬遜彈性計(jì)算云和亞馬遜簡單存儲服務(wù)上;Teradata是企業(yè)級數(shù)據(jù)倉庫(EDW)的領(lǐng)導(dǎo)者,在結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和大部分非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域幾乎沒有很大成果,因此收購了AsterDa-ta———一家提供SQL-MapReduce框架的公司。AsterData是高級分析和管理各種非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域的市場領(lǐng)導(dǎo)者和開拓者,為Teradata帶來了大數(shù)據(jù)分析市場商機(jī)。
(三)方案實(shí)施
實(shí)驗(yàn)平臺的設(shè)計(jì)同時(shí)立足于大數(shù)據(jù)技術(shù)的發(fā)展的前沿性與本學(xué)院學(xué)生專業(yè)特點(diǎn),與學(xué)生前序的理論、實(shí)踐課程均有良好的銜接,符合人才培養(yǎng)計(jì)劃,深化了教學(xué)大綱的內(nèi)容,并針對不同專業(yè)學(xué)生設(shè)計(jì)實(shí)踐學(xué)時(shí)、內(nèi)容和難度。本實(shí)驗(yàn)平臺可以同大數(shù)據(jù)行業(yè)中的公司科研部門共同合作建設(shè),雙方確定在人才培養(yǎng)、師資培訓(xùn)、共建實(shí)驗(yàn)室和實(shí)訓(xùn)基地、推動(dòng)大學(xué)生校外實(shí)習(xí)和社會實(shí)踐活動(dòng)的開展等方面開展全面、廣泛、長期、深入的合作。該實(shí)驗(yàn)室建設(shè)將豐富實(shí)踐教學(xué)體系,也可推動(dòng)學(xué)院科研項(xiàng)目立項(xiàng)、新課題研究、專項(xiàng)基金申請和聯(lián)合開展商用項(xiàng)目開發(fā)等;該實(shí)驗(yàn)室使師生能接觸高新大數(shù)據(jù)開發(fā)平臺,了解最新大數(shù)據(jù)技術(shù)的發(fā)展,進(jìn)行大數(shù)據(jù)平臺的開發(fā),實(shí)現(xiàn)對大數(shù)據(jù)的分析、可視化演示,增強(qiáng)學(xué)生的動(dòng)手能力并提升就業(yè)質(zhì)量;與此同時(shí),提升了教師的項(xiàng)目管理能力和教學(xué)能力。
三、結(jié)論
1 地方文獻(xiàn)報(bào)刊信息數(shù)據(jù)庫
地方文獻(xiàn)是指內(nèi)容上具有地域性,同時(shí)具有重復(fù)使用價(jià)值的文獻(xiàn)。由于它完整、系統(tǒng)地記錄了特定地域內(nèi)自然和人文方面的各種信息,從而為人們提供了研究特定地域內(nèi)歷史、現(xiàn)代及未來的有關(guān)資料。
地方文獻(xiàn)的類型多種多樣,報(bào)刊文獻(xiàn)是其中的一種。它具有信息量大,傳遞周期短,內(nèi)容相對客觀、翔實(shí)等特點(diǎn)。但由于它的總量太大,有關(guān)的地方文獻(xiàn)信息分散在不同時(shí)期、不同品種的報(bào)刊之中。僅靠瀏覽原始文獻(xiàn),迅速查到有關(guān)資料,幾乎是不可能的。地方文獻(xiàn)報(bào)刊索引就是為解決這一問題而編制成的一種檢索工具。
在手工時(shí)代,地方文獻(xiàn)報(bào)刊索引表現(xiàn)為篇目索引或題錄索引的形式,即將報(bào)刊中所載地方文獻(xiàn)篇目按一定順序編排起來,以利讀者查找文章的所在位置。這種索引不反映文章的具體內(nèi)容,只具有指向和示址作用。同時(shí),也對地方事物起著揭示和報(bào)道的作用。除了作為一種綜合性的檢索工具外,還可以在這種索引的基礎(chǔ)上編制各種情報(bào)報(bào)導(dǎo)刊物,或圍繞特定學(xué)科及專業(yè)進(jìn)行定向報(bào)導(dǎo)和檢索,以服務(wù)于地方的各項(xiàng)事業(yè)。
鑒于地方文獻(xiàn)報(bào)刊索引的重要作用,許多公共圖書館都曾積極編制這種索引。例如,首都圖書館自50年代起開始編制《北京地方文獻(xiàn)報(bào)刊資料索引》,涵蓋了本世紀(jì)以來的內(nèi)容;甘肅省圖書館也是在同一時(shí)期開始編制西北五省的地方文獻(xiàn)報(bào)刊索引;長春市圖書館也曾編制了《東北地方文獻(xiàn)索引》等檢索工具。為了避免目錄體系過于龐大,這種卡片式篇目索引一般僅以分類方式編排。因此讀者也只能從分類途徑對報(bào)刊上的地方文獻(xiàn)信息進(jìn)行檢索。 進(jìn)入計(jì)算機(jī)時(shí)代以來,以數(shù)據(jù)庫形式來處理地方文獻(xiàn)信息已成為圖書館地方文獻(xiàn)工作的必然趨勢。計(jì)算機(jī)所具有的自動(dòng)識別與排序功能,使地方文獻(xiàn)信息的編排檢索變得更加方便、更加快捷。通過全文掃描技術(shù)完成的報(bào)刊全文數(shù)據(jù)庫,使得報(bào)刊上的地方文獻(xiàn)信息得到更充分地揭示和利用。由于計(jì)算機(jī)具有一次性輸入,多途徑輸出的功能,因而在對地方文獻(xiàn)信息進(jìn)行存儲與檢索時(shí),增加了篇名、著者、出版、文摘等多方面的途徑。尤其是從主題途徑檢索地方文獻(xiàn)信息的問題得到了很好地解決。
在地方文獻(xiàn)報(bào)刊信息數(shù)據(jù)庫(以下簡稱報(bào)刊信息庫)中,分類標(biāo)引和主題標(biāo)引都是以揭示文獻(xiàn)內(nèi)在特征為目的的標(biāo)引方法,只是揭示的角度有所不同。由于地方文獻(xiàn)的史料特征極為明顯,故地方文獻(xiàn)的讀者往往是從特定的事件、人物、時(shí)間、地域的角度入手進(jìn)行檢索。因而可以說主題檢索是一種最直接反映地方文獻(xiàn)內(nèi)容特征的檢索途徑,也是建立檢索工具和檢索系統(tǒng)的基礎(chǔ)和前提。近些年來,圖書情報(bào)界對有關(guān)主題標(biāo)引的原則和操作方法有過許多研究和探討,撰寫過很多的著作和文章。但由于地方文獻(xiàn)中連續(xù)出版物本身所具有的特征,其主題標(biāo)引的原則和方法與其它類型文獻(xiàn)的標(biāo)引還是有所不同。本文擬從報(bào)刊信息數(shù)據(jù)庫的建設(shè)入手,探討有關(guān)地方文獻(xiàn)報(bào)刊信息主題標(biāo)引的一些問題。
2 地方文獻(xiàn)報(bào)刊信息數(shù)據(jù)庫中的主題標(biāo)引
2.1詞表的編制
報(bào)刊信息庫與其它類型數(shù)據(jù)庫相比,最突出的特點(diǎn)是要反映地方文獻(xiàn)本身所具有的特征。同時(shí)還要滿足地方文獻(xiàn)用戶特殊的檢索需求。因此,選擇一部適合地方文獻(xiàn)特征的主題詞表是開展標(biāo)引工作的首要問題。
《漢語主題詞表》(以下簡稱漢表)是一部供機(jī)檢使用的綜合性基礎(chǔ)型詞表。它所收錄的詞匯可以供各個(gè)機(jī)構(gòu)和行業(yè)從中選詞,以編制適合本專業(yè)或本機(jī)構(gòu)使用的專業(yè)詞表。實(shí)際上,我國很多專業(yè)情報(bào)機(jī)構(gòu)和圖書館都是在參考這部國家詞表的基礎(chǔ)上編制自己詞表的。在編表過程中,抽取主題詞時(shí)當(dāng)盡可能不破壞原有詞表的詞間關(guān)系。但必要時(shí),詞間關(guān)系及基本范疇還是需要重新確定的。
由于地方文獻(xiàn)是對某一地域自然和人文現(xiàn)象的客觀描述,它所表現(xiàn)出的地域性和專指性極強(qiáng)。用綜合性的《漢表》來標(biāo)引各地的地方文獻(xiàn),則將有相當(dāng)部分的文獻(xiàn)不能被準(zhǔn)確地表達(dá)其主題概念;其次,地方文獻(xiàn)的內(nèi)容范疇與《漢表》中的基本范疇也有所不同。《漢表》是以學(xué)科體系作為劃分范疇的基本依據(jù);而地方文獻(xiàn)則是以特定地方的自然環(huán)境、人文環(huán)境和地方事業(yè)作為劃分范疇的基本依據(jù)。所以地方文獻(xiàn)主題詞表需要在《漢語主題詞表》的基礎(chǔ)上自行編制。
地方文獻(xiàn)主題詞表中所收錄的主題詞來源主要有:
①《漢表》中已有的詞匯。這是地方文獻(xiàn)與非地方文獻(xiàn)都使用的綜合性詞匯,它占將來的地方文獻(xiàn)主題詞表所收詞匯的絕大部分。由于是從《漢表》中選詞,所以它們是相對規(guī)范的。
②《漢表》中沒有的,帶有地方特點(diǎn)的詞匯,如:北京地方文獻(xiàn)的“琉璃廠”、天津地方文獻(xiàn)中的“皇會”、廣東地方文獻(xiàn)中的“早茶”等,這部分詞匯雖然在未來的地方文獻(xiàn)主題詞表中所占比例不會很大,但它們卻是出現(xiàn)頻率相對較高的詞匯。對于這部分詞匯及其詞間關(guān)系,地方文獻(xiàn)工作者需要加以規(guī)范。
③《漢表》作為階段性產(chǎn)品,它的編制受時(shí)間的限制,對于編表以后新產(chǎn)生的一些詞匯它不可能收錄,在新編的地方文獻(xiàn)主題詞表中收錄這部分詞,也需要加以規(guī)范。
由于編制先組式的主題詞表需要一段相當(dāng)長的時(shí)間,同時(shí)還要編制一系列的標(biāo)引細(xì)則,這將會影響報(bào)刊信息庫主題標(biāo)引工作的迅速展開。因此,可以采用另一種方式,即首先確定一段時(shí)間為試驗(yàn)期,先進(jìn)行地方文獻(xiàn)的標(biāo)引工作。由標(biāo)引人員直接從報(bào)刊所載的地方文獻(xiàn)信息內(nèi)容中選取有檢索意義的關(guān)鍵詞作為主題詞。這種主題詞是未經(jīng)規(guī)范的自然語言,也無詞間關(guān)系可言,待積累了一定數(shù)量之后,再對其進(jìn)行修改、充實(shí),并參照《漢表》使之規(guī)范化。確定好詞間關(guān)系和基本范疇,從而形成適用的詞表。這種詞表是后控式的,采用這種方式選詞更直觀,專指性強(qiáng),還能使標(biāo)引工作與修改詞表同時(shí)進(jìn)行。而且標(biāo)引時(shí)不用考慮詞間關(guān)系及查表抽詞,所以標(biāo)引速度快。在標(biāo)引時(shí)采用自然語言,對標(biāo)引人員的要求也相對較低。目前,廣東省中山圖書館的地方文獻(xiàn)數(shù)據(jù)庫系統(tǒng)主題標(biāo)引就采用了這種方法。
2.2主題詞字段的設(shè)置
無論是先有詞表,還是先進(jìn)行標(biāo)引工作,在報(bào)刊信息庫中,都需要設(shè)置若干個(gè)主題詞字段,以便展開具體的標(biāo)引工作。在設(shè)置主題詞字段時(shí),一定要注意反映地方文獻(xiàn)的時(shí)空特征;在空間方面完整、系統(tǒng)地記錄特定地域內(nèi)自然和人文方面的各種信息;在時(shí)間上又形成了一個(gè)連續(xù)的信息集合。這是一切地方文獻(xiàn)工作最基本的原則。
在報(bào)刊信息庫中,首先應(yīng)設(shè)置涉及文獻(xiàn)基本內(nèi)容的“內(nèi)容主題詞”字段。此字段選詞靈活性大,標(biāo)引的內(nèi)容也十分廣泛。它對所有地方文獻(xiàn)信息的內(nèi)容范疇進(jìn)行涵蓋,也是以后編制地方文獻(xiàn)主題詞表時(shí)確定詞表基本范疇的依據(jù)。從地方文獻(xiàn)的性質(zhì)和特征來看,它是對特定地區(qū)自然、社會、人文諸般事物的歷史與現(xiàn)狀進(jìn)行全面系統(tǒng)地綜合性記錄,涉及的內(nèi)容極為廣泛。如反映一個(gè)地區(qū)所能觀察到的天文現(xiàn)象、地質(zhì)水文結(jié)構(gòu)、地形地貌、氣候與氣象、物種與資源以及反映該地區(qū)的人文地理、歷史、地方人物、社會經(jīng)濟(jì)、地方政治、社會結(jié)構(gòu)、地方文化、教育等各個(gè)方面。
報(bào)刊信息庫中“內(nèi)容主題詞”字段的主題詞性質(zhì)絕大部分是綜合性的,與其它非地方文獻(xiàn)數(shù)據(jù)庫中的主題詞無太大區(qū)別。例如“社會治安”,“計(jì)量管理”、“住宅區(qū)”、“軟件產(chǎn)業(yè)”等;也有一部分是地方文獻(xiàn)內(nèi)容所特有的地方性詞匯,如“敦煌石窟”、“庚子”、“廠甸”等;另外,新產(chǎn)生的一些地方文獻(xiàn)信息的內(nèi)容,也應(yīng)通過內(nèi)容主題詞來表達(dá)??傊彩巧婕暗降胤轿墨I(xiàn)的所有內(nèi)容特征,都應(yīng)在此字段予以反映。
這一字段并非地方文獻(xiàn)數(shù)據(jù)庫所特有,有關(guān)具體標(biāo)引方法的討論從略。
另一種主題字段的設(shè)置應(yīng)反映地方文獻(xiàn)內(nèi)容特征以外的其它特征。地方文獻(xiàn)最大的特點(diǎn),就在于文獻(xiàn)所記載的現(xiàn)象、事實(shí)和人物都被限定在某一特指的時(shí)空范圍內(nèi)。也就是說。地方文獻(xiàn)所涉及的內(nèi)容范疇均會通過特定的時(shí)間、地點(diǎn)、團(tuán)體機(jī)構(gòu)、人物等因素反映和輸出。地方文獻(xiàn)用戶的檢索習(xí)慣也往往是從某一地域范疇、地區(qū)名稱、某一事件、某一人物入手。因此,有必要在地方題錄庫中設(shè)置“地域主題詞”、“時(shí)間主題詞”、“團(tuán)體主題詞”和“個(gè)人主題詞”諸字段。它們是揭示地方文獻(xiàn)的本質(zhì)特征所必須的字段。同時(shí)也是地方文獻(xiàn)數(shù)據(jù)庫系統(tǒng)中所特有的。
以上四個(gè)主題詞字段所反映的是有關(guān)地方文獻(xiàn)信息中客觀存在的某些因素,如“地域主題詞”中的“東城區(qū)”、“梅山縣”、“個(gè)人主題詞”中的“梅蘭芳”、“秋瑾”等。盡管這四種主題詞的標(biāo)引與“內(nèi)容主題詞”的標(biāo)引相比,相對容易些,但仍需積累到一定數(shù)量后進(jìn)行規(guī)范。例如“團(tuán)體主題詞”中的機(jī)構(gòu)名稱是用全稱還是用簡稱,以及“個(gè)人主題詞”中的人物名稱是用本名還是用筆名,這些都需要地方文獻(xiàn)工作者在以后的工作中根據(jù)本地區(qū)的具體情況加以規(guī)范。
具體的標(biāo)引方法是:
地域主題所標(biāo)引的不是整體地方文獻(xiàn)的地域,而是文章內(nèi)容涉及的某一具體區(qū)域的名稱,或者給文章內(nèi)容帶來影響的區(qū)域名稱。如有關(guān)北京地方文獻(xiàn)的內(nèi)容不用標(biāo)“北京”,直接標(biāo)引具體的“東城區(qū)”、“昌平縣”等行政區(qū)劃名稱;內(nèi)容涉及到較具體的地名時(shí)也可標(biāo)引地名,例如“王府井大街”、“方家胡同”等;如果文章中所反映的地區(qū)更詳細(xì),區(qū)(縣)、街道(鄉(xiāng)鎮(zhèn))、村等具體名稱都有,可逐級進(jìn)行標(biāo)引,中間用分隔符隔開,如北京地方文獻(xiàn)中的“順義縣%趙全營鎮(zhèn)%北郎中村”;在標(biāo)引中,遇到舊有的行政區(qū)劃名稱或舊地名時(shí),為反映某一地區(qū)名稱的歷史發(fā)展沿革,應(yīng)將現(xiàn)行行政區(qū)劃名稱與舊有行政區(qū)劃名稱同時(shí)標(biāo)引作為檢索點(diǎn),現(xiàn)有行政區(qū)劃名稱或新地名標(biāo)在前面, 舊行政區(qū)劃名稱或舊地名注于其后,可用括號括起。如“東城區(qū)(內(nèi)三區(qū))”。以上的標(biāo)引方法主要是針對地方文獻(xiàn)用戶特定的檢索需求而言。
年代主題標(biāo)引的是文獻(xiàn)內(nèi)容所涉及的時(shí)間范圍,而不是文獻(xiàn)撰寫或出版發(fā)行的時(shí)間。清以前的歷朝歷代均可使用“朝代%年號”的方法標(biāo)引.如“清代%乾隆”,中華民國時(shí)期(1919年前)可標(biāo)引成“民國時(shí)期”,到了1920年以后可以標(biāo)引成“二十年代”、“六十年代”等。
團(tuán)體主題和個(gè)人主題標(biāo)引的是文章內(nèi)容所涉及到某一具體機(jī)構(gòu)、個(gè)人,或與某地方有關(guān)系的機(jī)構(gòu)和個(gè)人。團(tuán)體主題標(biāo)引時(shí),用機(jī)構(gòu)和單位的標(biāo)準(zhǔn)全稱,如“北京市中級人民法院”、“重慶市技術(shù)監(jiān)督局”等;而個(gè)人主題的標(biāo)引,是標(biāo)具體人名,例如“梅蘭芳”;如果遇到同一人物有本名與筆名時(shí),要同時(shí)標(biāo)引,如“魯迅”與“周樹人”、“老舍”與“舒舍予”之間可用符號“%”隔開;遇到清代人物或少數(shù)民族人物的名稱較長時(shí),一般應(yīng)標(biāo)引人物的全名,如“愛新覺羅·溥儀”。
總之,無論標(biāo)引什么類型的主題詞,標(biāo)引人員都要站在用戶的角度,即從索引的終極使用目的出發(fā),給地方文獻(xiàn)實(shí)際使用者提供有價(jià)值的地方文獻(xiàn)信息。因此,在對報(bào)刊信息庫進(jìn)行主題標(biāo)引過程中一定要確定好標(biāo)引深度。地方文獻(xiàn)報(bào)刊索引的標(biāo)引深度,則取決于地方文獻(xiàn)各類用戶的檢索需求。地方文獻(xiàn)的研究級用戶的檢索需求包括:決策、管理人員宏觀的檢索需求、科研人員較專深的檢索需求及設(shè)計(jì)生產(chǎn)人員的針對性檢索需求等。
盡管采用數(shù)據(jù)庫系統(tǒng)處理地方文獻(xiàn)信息這一手段在全國各類圖書館的地方文獻(xiàn)業(yè)務(wù)中開展得還不夠普遍,但這是地方文獻(xiàn)工作發(fā)展的必然趨勢。結(jié)合地方文獻(xiàn)本身的特點(diǎn)來制訂適用的主題詞表、分類表,是實(shí)現(xiàn)地方文獻(xiàn)信息處理標(biāo)準(zhǔn)化的必要步驟。它可為今后進(jìn)行聯(lián)機(jī)檢索,進(jìn)入國家和地區(qū)網(wǎng)絡(luò),從而實(shí)現(xiàn)地方文獻(xiàn)資源共享打下堅(jiān)實(shí)的基礎(chǔ)。同時(shí),計(jì)算機(jī)多途徑檢索所產(chǎn)生的效果也會使地方文獻(xiàn)信息資源得以更充分地研究與利用。
參考文獻(xiàn)
1 韓樸.圖書館地方文獻(xiàn)工作.北京:文津出版社,1992
2 中國科學(xué)技術(shù)情報(bào)研究所.北京圖書館.漢語主題詞表.北京:科學(xué)技術(shù)文獻(xiàn)出版社,1979