發(fā)布時間:2023-03-20 16:15:49
序言:寫作是分享個人見解和探索未知領域的橋梁,我們?yōu)槟x了8篇的識別技術(shù)論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發(fā),請盡情閱讀。
20世紀80年代,由于大規(guī)模集成電路技術(shù)的成熟,射頻識別系統(tǒng)的體積大大縮小,使得射頻識別技術(shù)進入實用化的階段,成為一種成熟的自動識別技術(shù)。
射頻識別技術(shù)是利用射頻方式進行非接觸雙向通信,以達到識別目的并交換數(shù)據(jù)。它與同期或早期的接觸式識別技術(shù)不同。RFID系統(tǒng)的射頻卡和讀寫器之間不用接觸就可完成識別,因此它可在更廣泛的場合中應用。
典型的射頻識別系統(tǒng)包括射頻卡和讀寫器兩部分。
射頻卡是將幾個主要模塊集成到一塊芯片中,完成與讀寫器的通信。芯片上有EEPROM用來儲存識別碼或其它數(shù)據(jù)。EEPROM容量從幾比特到幾萬比特。芯片僅需連接天線(和電池),可以作為人員的身份識別卡或貨物的標識卡??ǚ庋b可以有不同形式,比如常見的信用卡及小圓片的形式等。與條碼、磁卡、IC卡等同期或早期的識別技術(shù)相比,射頻卡具有非接觸、工作距離長、適于惡劣環(huán)境、可識別運動目標等優(yōu)點。
在多數(shù)RFID系統(tǒng)中,讀寫器在一個區(qū)域內(nèi)發(fā)射電磁波(區(qū)域大小取決于工作頻率和天線尺寸)??ㄆ瑑?nèi)有一個LC串聯(lián)諧振電路,其頻率與讀寫器發(fā)射的頻率相同。當射頻卡經(jīng)過這個區(qū)域時,在電磁波的激勵下,LC諧振電路產(chǎn)生共振,從而使電容內(nèi)有了電荷。在這個電容的另一端,接有一個單向?qū)ǖ碾娮颖?,將電容?nèi)的電荷送到另一個電容內(nèi)儲存。當所積累的電荷達到2V時,此電容可作為電源為其它電路提供工作電壓,將卡內(nèi)數(shù)據(jù)發(fā)射出去或接取讀寫器的數(shù)據(jù)。讀寫器接收到卡的數(shù)據(jù)后,解碼并進行錯誤校驗來決定數(shù)據(jù)的有效性,然后,通過RS232、RS422、RS485或無線方式將數(shù)據(jù)傳送到計算機網(wǎng)絡。簡單的RFID產(chǎn)品就是一種非接觸的IC卡,而復雜的RFID產(chǎn)品能和外部傳感器接口連接來測量、記錄不同的參數(shù),甚至可與GPS系統(tǒng)連接來跟蹤物體。
工作原理如圖1所示。
2射頻識別技術(shù)的分類
射頻識別技術(shù)主要按以下四種方式分類。
(1)工作頻率
根據(jù)工作頻率的不同可分為低頻和高頻系統(tǒng)。①低頻系統(tǒng)一般指其工作頻率小于30MHz的系統(tǒng)。其基本特點是:射頻卡的成本較低、標簽內(nèi)保存的數(shù)據(jù)量較少、閱讀距離較短(無源情況,典型閱讀距離為10cm)、射頻卡外形多樣(卡狀、環(huán)狀、鈕扣狀、筆狀)、閱讀天線方向性不強等。低頻系統(tǒng)多用于短距離、低成本的應用中,如多數(shù)的門禁控制、動物監(jiān)管、貨物跟蹤。②高頻系統(tǒng)一般指其工作頻率大于400MHz的系統(tǒng)。高頻系統(tǒng)的基本特點是射頻卡及讀寫器成本均較高、卡內(nèi)保存的數(shù)據(jù)量較大、閱讀距離較遠(可達幾m~十幾m)、適應物體高速運動性能好、外形一般為卡狀、閱讀天線及射頻卡天線均有較強的方向性。高頻系統(tǒng)多應用于需要較長的讀寫距離和高的讀寫速度的場合,像火車監(jiān)控、高速公路收費等系統(tǒng)。
(2)射頻卡
根據(jù)射頻卡的不同可分成可讀寫(RW)卡、一次寫入多次讀出(WORM)卡和只讀(RO)卡三種。RW卡一般比WORM卡和RO卡貴得多,如電話卡、信用卡等。一般情況下改寫數(shù)據(jù)所花費的時間遠大于讀取數(shù)據(jù)所花費的時間(常規(guī)為改寫所花費的時間為s級,閱讀花費的時間為ms級)。WORM卡是用戶可以一次性寫入的卡,寫入后數(shù)據(jù)不能改變,且比RW卡要便宜。RO卡存有一個唯一的號碼,不能逐改,保證了安全性。RO卡最便宜。
(3)射頻卡的有源與無源
射頻卡可分為有源及無源兩種。有源射頻卡使用卡內(nèi)電池的能量、識別距離較長,可達十幾m,但是它的壽命有限(3~10年),且價格較高;無源射頻卡不含電池,利用讀寫器發(fā)射的電磁波提供能量,重量輕、體積小、壽命長、很便宜,但它的發(fā)射距離受限制,一般是幾十cm,且需要讀寫器的發(fā)射功率大。
(4)調(diào)制方式
根據(jù)調(diào)制方式的不同還可分為主動式和被動式。①主動式的射頻卡用自身的射頻能量主動地發(fā)送數(shù)據(jù)給讀寫器。②被動式的射頻卡,使用調(diào)制散射方式發(fā)射數(shù)據(jù)。它必須利用讀寫器的載波調(diào)制自己的信號,適宜在門禁或交通的應用中使用。因為讀寫器可以確保只激活一定范圍之內(nèi)的射頻卡。
目前使用的多數(shù)系統(tǒng)中,一次只能讀寫一個射頻卡。射頻卡之間要保持一定距離,確保一次只能有一個卡在讀寫區(qū)域內(nèi)。讀寫距離長,射頻卡之間的距離就要大,應用起來很不方便?,F(xiàn)在的射頻卡具有防碰撞的功能,這對于RFID來說十分重要。所謂碰撞是指多個射頻卡進入識別區(qū)域時信號互相干擾的情況。具有防碰撞性能的系統(tǒng)可以同時識別進入識別距離的所有射頻卡,它的并行工作方式大大提高了系統(tǒng)的效率。
3國際射頻識別技術(shù)發(fā)展狀況
射頻識別技術(shù)在國外發(fā)展得很快。RFID產(chǎn)品種類很多,像德州儀器、Motoro1a、Philips、Microchip等世界著名廠家都生產(chǎn)RFID產(chǎn)品。他們的產(chǎn)品各有特點,自成系列。射頻識別技術(shù)被廣泛應用于工業(yè)自動化、商業(yè)自動化、交通運輸控制管理等眾多領域。如澳大利亞將它的RFID產(chǎn)品用于澳機場旅客行李管理中并發(fā)揮了出色的作用;瑞士國家鐵路局在瑞士的全部旅客列車上安裝RFID自動識別系統(tǒng),調(diào)度員可以實時掌握火車運行情況,不僅利于管理,還大大減小了發(fā)生事故的可能性;德國BMW公司將射頻識別系統(tǒng)應用在汽車生產(chǎn)流水線的生產(chǎn)過程控制中等。
據(jù)有關權(quán)威數(shù)據(jù)顯示,射頻識別
產(chǎn)品在全世界的銷量以每年25.3%的比例增長。由此可見,射頻識別技術(shù)具有廣闊的市場前景。
4射頻識別技術(shù)在我國的發(fā)展
我國政府在1993年制定的金卡工程實施計劃,是一個旨在加速推動我國國民經(jīng)濟信息化進程的重大國家級工程,由此各種自動識別技術(shù)的發(fā)展及應用十分迅猛?,F(xiàn)在,射頻識別技術(shù)作為一種新興的自動識別技術(shù),也將在中國很快地普及。
目前,我國的射頻識別技術(shù)在下列幾種應用中發(fā)展前景較好。當然,這里僅僅羅列了射頻識別技術(shù)應用的一部分。任何一種技術(shù)如果得到普及,都將會孕育一個龐大的市場。射頻識別將是未來一個新的經(jīng)濟增長點。
4.1安全防護領域
(1)門禁保安
將來的門禁保安系統(tǒng)均可應用射頻卡。一卡可以多用。比如,可以作工作證、出入證、停車卡、飯店住宿卡甚至旅游護照等,目的都是識別人員身份、安全管理、收費等等。好處是簡化出入手續(xù)、提高工作效率、安全保護。只要人員佩戴了封裝成ID卡大小的射頻卡、進出入口有一臺讀寫器,人員出入時自動識別身份,非法闖入會有報警。安全級別要求高的地方、還可以結(jié)合其它的識別方式,將指紋、掌紋或顏面特征存入射頻卡。
公司還可以用射頻卡保護和跟蹤財產(chǎn)。將射頻卡貼在物品上面,如計算機、傳真機、文件、復印機或其它實驗室用品上。該射頻卡使得公司可以自動跟蹤管理這些有價值的財產(chǎn),可以跟蹤一個物品從某一建筑離開,或是用報警的方式限制物品離開某地。結(jié)合GPS系統(tǒng)利用射頻卡,還可以對貨柜車、貨艙等進行有效跟蹤。
(2)汽車防盜
這是RFID較新的應用。目前已經(jīng)開發(fā)出了足夠小的、能夠封裝到汽車鑰匙當中含有特定碼字的射頻卡。它需要在汽車上裝有讀寫器,當鑰匙插入到點火器中時,讀寫器能夠辨別鑰匙的身份。如果讀寫器接收不到射頻卡發(fā)送來的特定信號,汽車的引擎將不會發(fā)動。用這種電子驗證的方法,汽車的中央計算機也就能容易防止短路點火。
另一種汽車防盜系統(tǒng)是,司機自己帶有一射頻卡,其發(fā)射范圍是在司機座椅45~55cm以內(nèi),讀寫器安裝在座椅的背部。當讀寫器讀取到有效的ID號時,系統(tǒng)發(fā)出三聲鳴叫,然后汽車引擎才能啟動。該防盜系統(tǒng)還有另一強大功能:倘若司機離開汽車并且車門敞開引擎也沒有關閉,這時讀寫器就需要讀取另一有效ID號;假如司機將該射頻卡帶離汽車,這樣讀寫器不能讀到有效ID號,引擎就會自動關閉,同時觸發(fā)報警裝置。
(3)電子物品監(jiān)視系統(tǒng)
電子物品監(jiān)視系統(tǒng)(ElectronicArticleSurveillance,EAS)的目的是防止商品被盜。整個系統(tǒng)包括貼在物體上的一個內(nèi)存容量僅為1比特(即開或關)的射頻卡,和商店出口處的讀寫器。射頻卡在安裝時被激活。在激活狀態(tài)下,射頻卡接近掃描器時會被探測到,同時會報警。如果貨物被購買,由銷售人員用專用工具拆除射頻卡(典型的是在服裝店里),或者用磁場來使射頻卡失效,或者直接破壞射頻卡本身的電特性。EAS系統(tǒng)已被廣泛使用。據(jù)估計每年消耗60億套。
4.2商品生產(chǎn)銷售領域
(1)生產(chǎn)線自動化
用RFID技術(shù)在生產(chǎn)流水線上實現(xiàn)自動控制、監(jiān)視,提高生產(chǎn)率,改進生產(chǎn)方式,節(jié)約了成本。舉個例子以說明在生產(chǎn)線上應用RFID技術(shù)的情況。
用于汽車裝配流水線。德國寶馬汽車公司在裝配流水線上應用射頻卡,以盡可能大量地生產(chǎn)用戶定制的汽車。寶馬汽車的生產(chǎn)是基于用戶提出的要求式樣而生產(chǎn)的。用戶可以從上萬種內(nèi)部和外部選項中,選定自己所需車的顏色、引擎型號和輪胎式樣等。這樣一來,汽車裝配流水線上就得裝配上百種式樣的寶馬汽車,如果沒有一個高度組織的、復雜的控制系統(tǒng)是很難完成這樣復雜的任務的。寶馬公司在其裝配流水線上配有RFID系統(tǒng),使用可重復使用的射頻卡。該射頻卡上帶有汽車所需的所有詳細的要求,在每個工作點處都有讀寫器,這樣可以保證汽車在各個流水線位置,能毫不出錯地完成裝配任務。
(2)倉儲管理
將RFID系統(tǒng)用于智能倉庫貨物管理,能有效地解決與貨物流動有關的信息管理,不但增加了處理貨物的速度,還可監(jiān)視貨物的一切信息。射頻卡貼在貨物所通過的倉庫大門邊上,讀寫器和天線都放在叉車上,每個貨物都貼有條碼,所有條碼信息都被存儲在倉庫的中央計算機里,與該貨物有關的信息都能在計算機里查到。當貨物出庫時,由另一讀寫器識別并告知中央計算它被放在哪個拖車上。這樣,管理中心可以實時地了解到已經(jīng)生產(chǎn)了多少產(chǎn)品和發(fā)送了多少產(chǎn)品。
(3)產(chǎn)品防偽
偽造問題在世界各地都是令人頭疼的問題,將射頻識別技術(shù)應用在防偽領域有它自身的技術(shù)優(yōu)勢。防偽技術(shù)本身要求成本低,且難于偽造。射頻卡的成本就相對便宜,而芯片的制造需要有昂貴的芯片工廠,使偽造者望而卻步。射頻卡本身有內(nèi)存,可以儲存、修改與產(chǎn)品有關的數(shù)據(jù),利于銷售商使用;體積十分小、便于產(chǎn)品封裝。像電腦、激光打印機、電視等產(chǎn)品上都可使用。
(4)RFID卡收費
國外的各種交易大多利用各種卡來完成,而我國普遍采用現(xiàn)金交易?,F(xiàn)金交易不方便也不安全,還容易出現(xiàn)稅收的漏洞。目前的收費卡多用磁卡、IC卡,而射頻卡也開始占據(jù)市場。原因是在一些惡劣的環(huán)境中,磁卡、IC卡容易損壞,而射頻卡則不易磨損,也不怕靜電及其它情況;同時,射頻卡用起來方便、快捷,甚至不用打開包,在讀寫器前搖晃一下,就完成收費。另外,還可同時識別幾張卡.并行收費,如公共汽車上的電子月票。我國大城市的公共汽車異常擁擠、環(huán)境條件差,射頻卡的使用有助于改善這種情況。
4.3管理與數(shù)據(jù)統(tǒng)計領域
(1)畜牧管理
該領域的發(fā)展起步于賽馬的識別,是用小玻璃封裝的射頻卡植于動物皮下。射頻卡大約10mm長,內(nèi)有一個線圈,約1000圈的細線繞在鐵氧體上,讀寫距離是十幾cm。從賽馬識別發(fā)展到了標識牲畜。牲畜的識別提供了現(xiàn)代化管理牧場的方法。
(2)運動計時
在馬拉松比賽中,由于人員太多,有時第一個出發(fā)的人同最后一個出發(fā)的人能相隔40分鐘。如果沒有一個精確的計時裝置,就會出現(xiàn)差錯。射頻卡應用于馬拉松比賽中,運動員在自己的鞋帶上很方便地系上射頻卡,在比賽的起跑線和終點線處放置帶有微型天線的小墊片。當運動員越過此墊片時,計時系統(tǒng)便會接收運動員所帶的射頻卡發(fā)出的ID號,并記錄當時的時間。這樣,每個運動員都會有自己的起始時間和結(jié)束時間,不會出現(xiàn)不公平競爭的可能性了。在比賽路線中,如果每隔5km就設置這樣一個墊片,還可以很方便地記錄運動員在每個階段所用的時間。
RFID還可應用于汽車大獎賽上的精確計時。在跑道下面按照一定的距離間隔埋入一系列的
天線,這些天線與讀寫器相連,而射頻卡安裝到賽車前方。當賽車每越過一個天線時,賽車的ID號和時間就被記錄下來,并存儲到中央計算機內(nèi)。這樣到比賽結(jié)束時,每個參賽選手將會有一個準確的結(jié)果。
4.4交通運輸領域
(1)高速公路自動收費及交通管理
高速公路自動收費系統(tǒng)是射頻識別技術(shù)最成功的應用之一。目前,中國的高速公路發(fā)展非??欤咚俟肥召M卻存在一些問題:一是在收費站口,許多車輛要停車排隊,成為交通瓶頸問題;二是少數(shù)不法的收費員貪污路費,使國家損失了相當?shù)呢斦杖?。RFID技術(shù)應用在高速公路自動收費上,能夠充分體現(xiàn)它非接觸識別的優(yōu)勢——讓車輛高速通過收費站的同時自動完成收費,同時可以解決收費員貪污路費及交通擁堵的問題。利用射頻識別技術(shù)的不停車高速公路自動收費系統(tǒng)是將來的發(fā)展方向;人工收費,包括IC卡的停車收費方式,終將會被淘汰。預計在未來10年內(nèi),高速公路自動收費系統(tǒng)將有數(shù)十億元的需求。
在城市交通方面,解決交通日趨擁擠問題不能只依賴于修路。加強交通的指揮、控制、疏導,提高道路的利用率,深挖現(xiàn)有交通潛能也是非常重要的;而基于RFID技術(shù)的交通管理系統(tǒng)可實現(xiàn)自動查處違章車輛,記錄違章情況。另外,公共汽車站實時跟蹤指示公共汽車到站時間及自動顯示乘客信息,會給乘客帶來很大的方便。
(2)火車和貨運集裝箱的識別
在火車運營中,使用RFID系統(tǒng)很大的優(yōu)勢在于:火車是按既定路線運行的,因此肯定要通過設定的讀寫器的地點。通過讀到的數(shù)據(jù),能夠得到火車的身份、監(jiān)控火車的完整性,以防止遺漏在鐵軌上的車廂發(fā)生撞車事故,同時能在車站將車廂重新編組。起初的努力是用超音波和雷達測距系統(tǒng)讀出車廂側(cè)的條碼,現(xiàn)在被RFID系統(tǒng)取代。射頻卡一般安在車廂頂邊,讀寫器安在鐵路沿線,就可得到火車的實時信息及車廂內(nèi)裝的物品信息。
目前,射頻自動識別系統(tǒng)的安裝遍布全國14個鐵路局。2001年3月1日,鐵道部正式聯(lián)網(wǎng)啟用車次車號自動識別系統(tǒng),為自備車企業(yè)、合資鐵路和地方鐵路實現(xiàn)信息化智能運輸管理提供了重要良機。
關鍵詞:對象識別;可擴展性;相似度;記錄對
中圖分類號:TP399文獻標識碼:A文章編號:1009-3044(2012)21-5032-03
Review of Object Identification Research
CHANG Ming1,NI De-qiang1,CHENG Tao-yuan2
(1.Anshan Radio and Television Bureau,Anshan 114001,China; 2.Beijing Baidu Network Technology Co., Ltd., Beijing 100080, China)
Abstract:Data quality directly determines the quality of information service. About data quality problems, it is one of the most critical is sues to identify a number of records (representation) of the same real entities (objects). It is called object identification. This paper analyzed the recent technical development of object identification. give some recent research methods and problems about efficiency of scalability, at tribute value similarity judgments, record pairs similarity judgment, set model similarity judgment.
Key words:object identification; scalability; similarity; record pair
1959年H. Newcombe等人第一次提出了對象識別的概念[1],文獻[2]則為對象識別提出了正式理論,并且提出了一整套的統(tǒng)計學方法來計算匹配的參數(shù)和錯誤率。在傳統(tǒng)的對象識別研究中,人們主要在解決如下兩個問題:1)如何計算記錄對的相似度;)如何減少需要進行相似度計算的記錄對數(shù)目。W. E. Winkler在文獻[3]中綜述了當時與對象識別相關的研究工作。幾年過去了,對象識別領域的研究又取得了很大的進展,而且最近幾年出現(xiàn)了一些新的模型和方法,突破了傳統(tǒng)對象識別中基于兩條記錄計算相似度的思想。
很高,而且容易出錯。
傳統(tǒng)的方法只是考慮如何利用本地數(shù)據(jù)庫中的信息進行對象識別,在很多情況下,僅僅利用本地數(shù)據(jù)庫的信息無法獲得很好的對象識別結(jié)果。對象識別產(chǎn)生的很多模糊匹配,如果能夠找到一些其他的信息就可以判斷出來時匹配還是不匹配了。例如,對于兩個人名“Bob Smith”和“Robert Smith”,采用字符串相似度判斷時,由于他們的相似度沒有高于閾值,所以會被認為是一個模糊匹配。但是在英文里作為人名的一部分時,“Bob”和“Robert”是一對可以互相交換的詞。如果有一個輔助數(shù)據(jù)源可以提供這樣的信息,那么就可以判斷這個模糊匹配“Bob Smith”和“Robert Smith”是相同的人名。提出了一種利用輔助數(shù)據(jù)源查找額外信息,結(jié)合已有得信息進行判斷的方法。由于查詢輔助數(shù)據(jù)源會導致延遲,而且還可能會導入錯誤等,系統(tǒng)只是在產(chǎn)生模糊匹配的時候才會去利用中間件進行查詢。采用這樣的模型,可以提高基于網(wǎng)絡的對象識別的準確率和查全率。但是,論文中的輔助數(shù)據(jù)源是一些特定的數(shù)據(jù)源,需要提前知道數(shù)據(jù)源的模式,獲得使用權(quán)限等。這樣的要求大大限制了模型的適用范圍,不能作為一種通用的模型進行推廣。在不存在特定輔助數(shù)據(jù)源的情況下,研究中則提出了一種利用網(wǎng)絡數(shù)據(jù)進行相關人員判斷的方法。提出了一種利用網(wǎng)絡,通過無監(jiān)督學習解決“同名不同人”問題的方法。這些研究工作都很好地解決了各自論文中提出的問題。但是由于他們提出問題或者帶有特殊的背景知識(需要知道多個人之間是熟人關系),或者要求提前知道查找出的網(wǎng)頁符合一定的模板,這些利用網(wǎng)絡識別同名不同人的系統(tǒng)通用性不強。
1.4集合模型的判斷
隨著應用的發(fā)展,僅僅根據(jù)兩條記錄的信息已經(jīng)無法很好的判斷對應表象是否匹配了。在數(shù)據(jù)庫中,一個表象不僅在需要進行比較的記錄中有信息,還會存在一些其他的聯(lián)系信息。如何更好的利用這些聯(lián)系信息是最近的研究工作的重點。
由于論文數(shù)據(jù)庫的特點,作者名字的對象識別過程也就是盡量利用相關信息的過程。中最初提出了利用作者表象的上下文信息,也就是利用了和要識別的作者名字直接聯(lián)系的一層信息??紤]到可能會存在的一個人名對應多個作者對象的問題,這樣的一層信息還是相對比較可靠的。等工作開始利用表象的多層聯(lián)系進行計算,雖然這樣的方法可以利用更多的信息,但是“同名不同人”問題的存在會使得這些工作的準確率很受影響。而且,這些工作都是基于SimRank或者SimFusion模型,算法的空間復雜度是O(n2),運行時間會較長。而基于依賴關系的對象識別則考慮到了識別的先后順序,可以利用首先識別出來的對象輔助后面的模糊匹配的識別。與以前的工作相比,這樣的工作更加符合人的邏輯判斷過程。上面的工作只是簡單的利用了多層關系。在論文數(shù)據(jù)庫中,對象之間會存在依賴關系,不僅記錄之間會存在依賴關系,不同的屬性值之間也會存在這樣的關系。進行對象識別時,利用眾多表象之間的關系,首先識別出來的對象可以向正在識別的表象提供有用的信息,而傳統(tǒng)的對象識別工作沒有考慮這樣的依賴關系。提出基于依賴關系進行對象識別的工作。在基于依賴關系進行對象識別的工作中,一個模糊匹配的成功識別可以獲得一定的知識,利用這樣的知識可以輔助別的節(jié)點進行識別。在利用依賴關系時,首先判斷容易判斷的對象,然后再來進行更加模糊的對象判斷。
不僅在論文數(shù)據(jù)庫中可以使用集合模型,在其他的數(shù)據(jù)庫中只要記錄中間存在某些聯(lián)系,也可以使用這樣的模型。研究了在數(shù)據(jù)庫的各個表中間存在層次關系時,如何利用這些關系進行對象識別的問題。數(shù)據(jù)庫中多個表之間可能會存在一定的層次關系,例如表A是關于不同國家的數(shù)據(jù),表B是不同國家中州(或者?。┑臄?shù)據(jù)。這樣的兩個表通過主外鍵關系就存在一個層次關系。在這樣的數(shù)據(jù)庫中進行對象識別時,除了可以計算兩個表象的文本相似度之外,還可以利用兩個表象的孩子節(jié)點覆蓋(overlap)進行判斷。一般說來,如果兩個表象屬于同一個對象,它們的孩子節(jié)點會對應較大的覆蓋。例如,country表中的“USA”和“United States of America”都在state表中對應著“MO”,“CA”,“AL”等,那么在判斷“USA”和“United States of America”是否對應同一對象時,雖然他們的文本相似度不是很高,但是由于他們下一級的state數(shù)據(jù)覆蓋很大,可以判斷它們是同一國家的名字。
關鍵詞:模糊控制;人工神經(jīng)網(wǎng)絡;人臉識別
中圖分類號:TP18 文獻標識碼:A文章編號:1009-3044(2011)16-3904-03
隨著人工智能技術(shù)的飛速發(fā)展,機器視覺已經(jīng)成為當前人工智能研究領域的一大熱點,很多國家的研究人員都開展了對機器視覺的研究,其中以機器視覺識別人臉最為困難,這主要是因為人的面部帶有表情,不同的人具有不同的臉,而不同的臉具有不同的表情,不同的表情則具有不同的面部特征,如何讓計算機通過機器視覺高效率的識別人臉,成為當前機器視覺和智能機器人關鍵技術(shù)領域的技術(shù)難題。
隨著模糊邏輯控制算法和人工神經(jīng)網(wǎng)絡算法的發(fā)展,對于機器視覺識別人臉特征的算法也有了新的發(fā)展,目前多數(shù)研究算法所采用的人臉識別從實現(xiàn)技術(shù)上來說,主要可以分為以下幾個類別:
1) 基于人臉幾何特征進行的識別算法,該算法運算量較小,原理簡單直觀,但是識別率較低,適合應用于人群面部的分類,而不適宜于每一個人臉的識別。
2) 基于人臉特征的匹配識別算法,這種算法是預先構(gòu)建常見的人臉特征以及人臉模板,構(gòu)成人臉特征庫,將被識別的人臉與特征庫中的人臉進行逐一比對,從而實現(xiàn)人臉識別,該算法識別效率較高,但是應用有一定局限性,只能夠識別預先設立的人臉特征庫中的人臉模型,因此人臉特征庫就成為該算法實現(xiàn)的技術(shù)關鍵。
3) 基于統(tǒng)計的人臉識別算法,該算法將人臉面部進行特征參數(shù)的劃分,如兩眼距離大小,五官之間距離等,通過構(gòu)建統(tǒng)計特征參數(shù)模型實現(xiàn)對人臉模型的識別,該算法識別率較高,但是算法實現(xiàn)起來運算量比較大,且識別效率較低。
4) 基于模糊邏輯的人臉識別算法,這一類算法主要結(jié)合了模糊邏輯和神經(jīng)網(wǎng)絡能夠自我訓練學習的機制實現(xiàn)對人臉的識別,識別率較高,且算法運算量適中,但是算法的原理較難理解,且模糊邏輯控制規(guī)則的建立存在一定技術(shù)難度。
本論文主要結(jié)合模糊人工神經(jīng)網(wǎng)絡方法,將其應用于計算機人臉識別,以期從中能夠找到有效可靠的人臉識別方法及其算法應用,并以此和廣大同行分享。
1 模糊邏輯及人工神經(jīng)網(wǎng)絡在圖像辨識中的應用可行性分析
1) 人臉識別的技術(shù)難點
由于計算機只能夠認識0和1,任何數(shù)據(jù),包括圖像,都必須要轉(zhuǎn)化為0和1才能夠被計算機識別,這樣就帶來一個很復雜很棘手的問題:如何將成千上萬的帶有不同表情的人臉轉(zhuǎn)變?yōu)閿?shù)字信號并被計算機識別。由于人的面部帶有表情,不同的人具有不同的臉,而不同的臉具有不同的表情,不同的表情則具有不同的面部特征,因此這些都成為了計算機識別人臉特征的技術(shù)難點,具體來說,人臉實現(xiàn)計算機識別的主要技術(shù)難度包括:
① 人臉表情:人有喜怒哀樂等不同表情,不同的表情具有不同的面部特征,因此如何分辨出不同表情下的人臉特征,這是首要的技術(shù)難點;
② 光線陰影的變換:由于人臉在不同光線照射下會產(chǎn)生陰影,而陰影敏感程度的不一也會增加計算機識別人臉特征的難度;
③ 其他因素:如人隨著年齡的增長面部特征會發(fā)生些微變化,人臉部分因為裝飾或者帽飾遮擋而增加識別難度,以及人臉側(cè)面不同姿態(tài)也會對計算機識別帶來技術(shù)難度。
2) 模糊人工神經(jīng)網(wǎng)絡在人臉辨識中的應用可行性
如上分析所示,計算機識別人臉,需要考慮的因素太多,并且每一種因素都不是線性化處理那么簡單,為此,必須要引入新的處理技術(shù)及方法,實現(xiàn)計算機對人臉的高效識別。根據(jù)前人的研究表明,模糊人工神經(jīng)網(wǎng)絡算法是非常有效的識別算法。
模糊理論和神經(jīng)網(wǎng)絡技術(shù)是近年來人工智能研究較為活躍的兩個領域。人工神經(jīng)網(wǎng)絡是模擬人腦結(jié)構(gòu)的思維功能,具有較強的自學習和聯(lián)想功能,人工干預少,精度較高,對專家知識的利用也較少。但缺點是它不能處理和描述模糊信息,不能很好利用已有的經(jīng)驗知識,特別是學習及問題的求解具有黑箱特性,其工作不具有可解釋性,同時它對樣本的要求較高;模糊系統(tǒng)相對于神經(jīng)網(wǎng)絡而言,具有推理過程容易理解、專家知識利用較好、對樣本的要求較低等優(yōu)點,但它同時又存在人工干預多、推理速度慢、精度較低等缺點,很難實現(xiàn)自適應學習的功能,而且如何自動生成和調(diào)整隸屬度函數(shù)和模糊規(guī)則,也是一個棘手的問題。如果將二者有機地結(jié)合起來,可以起到互補的效果。
模糊邏輯控制的基本原理并非傳統(tǒng)的是與不是的二維判斷邏輯,而是對被控對象進行閾值的設計與劃分,根據(jù)實際值在閾值領域內(nèi)的變化相應的產(chǎn)生動態(tài)的判斷邏輯,并將邏輯判斷規(guī)則進行神經(jīng)網(wǎng)絡的自我學習,逐漸實現(xiàn)智能判斷,最終實現(xiàn)準確的邏輯判斷。相較于傳統(tǒng)的線性判斷規(guī)則,基于模糊規(guī)則的神經(jīng)網(wǎng)絡是高度復雜的非線性網(wǎng)絡,同時由于其廣闊的神經(jīng)元分布并行運算,大大提高了復雜對象(如人臉)識別計算的效率,因此,將模糊神經(jīng)網(wǎng)絡算法應用于人臉的智能識別是完全可行的。
2 基于模糊人工神經(jīng)網(wǎng)絡的人臉識別方法研究
2.1 基于模糊神經(jīng)網(wǎng)絡的人臉識別分類器設計
1) 輸入、輸出層的設計:針對模糊神經(jīng)網(wǎng)絡層的輸入層和輸出層的特點,需要對識別分類器的輸入、輸出層進行設計。由于使用BP神經(jīng)網(wǎng)絡作為識別分類器時,數(shù)據(jù)源的維數(shù)決定輸入層節(jié)點數(shù)量,結(jié)合到人臉的計算機識別,人臉識別分類器的輸入輸出層,應當由人臉特征數(shù)據(jù)庫的類別數(shù)決定,如果人臉數(shù)據(jù)庫的類別數(shù)為m,那么輸入、輸出層節(jié)點數(shù)也為m,由m個神經(jīng)元進行分布式并行運算,能夠極大提高人臉識別的輸入和輸出速度。
2) 隱藏層結(jié)點數(shù)的選擇:由于一般的BP神經(jīng)網(wǎng)絡都是由3層BP網(wǎng)絡構(gòu)成:輸入層,隱藏層和輸出層,隱層的數(shù)量越多,BP神經(jīng)網(wǎng)絡越復雜,那么最終能夠?qū)崿F(xiàn)的運算精度就越高,識別率也就越高;但是隨著隱層數(shù)量的增加,隨之而來的一個突出的問題就是神經(jīng)網(wǎng)絡變的復雜了,神經(jīng)網(wǎng)絡自我訓練和學習的時間變長,使得識別效率相對下降,因此提高精度和提高效率是應用模糊神經(jīng)網(wǎng)絡的一個不可避免的矛盾。在這里面向人臉識別的分類器的設計中,仍然采用傳統(tǒng)的3層BP神經(jīng)網(wǎng)絡構(gòu)建人臉識別分類器,只設計一層隱層,能夠在保障識別精度的前提下有效的保障神經(jīng)網(wǎng)絡學習和訓練的效率,增加人臉識別的正確率。
3) 初始值的選?。涸谠O計了3層BP神經(jīng)網(wǎng)絡的基礎上,需要確定神經(jīng)網(wǎng)絡的輸入初始值。由于模糊神經(jīng)網(wǎng)絡是非線性的,不但具有線性網(wǎng)絡的全部優(yōu)點,同時還具有收斂速度快等特點,而初始值的選取在很大程度上影響神經(jīng)網(wǎng)絡的學習訓練時間的長短,以及是否最終能夠?qū)崿F(xiàn)收斂輸出得到最優(yōu)值。如果初始值太大,那么對于初始值加權(quán)運算后的輸出變化率趨向于零,從而使得神經(jīng)網(wǎng)絡自我學習訓練趨向于停止,最終無法得到收斂的最優(yōu)值;相反,我們總是希望初始值在經(jīng)過每一次加權(quán)運算后的輸出都接近于零,從而能夠保證每一個參與運算的神經(jīng)元都能夠進行調(diào)節(jié),最終實現(xiàn)快速的收斂。為此,這里將人臉識別的初始值設定在[0,0.2]之間,初始運算的權(quán)值設定在[0,0.1]之間,這樣都不太大的輸入初始值和權(quán)值初始值能夠有效的保證神經(jīng)網(wǎng)絡快速的收斂并得到最優(yōu)值。
如果收斂速度太慢,則需要重新設置權(quán)值和閾值。權(quán)值和閾值由單獨文件保存,再一次進行訓練時,直接從文件導出權(quán)值和閾值進行訓練,不需要進行初始化,訓練后的權(quán)值和閾值直接導入文件。
2.2 人臉識別的神經(jīng)網(wǎng)絡訓練算法步驟
1) 神經(jīng)網(wǎng)絡的逐層設計步驟:神經(jīng)網(wǎng)絡需要按層進行設計,構(gòu)建信號輸入層、模糊層以及輸出層,同時還要構(gòu)建模糊化規(guī)則庫,以構(gòu)建神經(jīng)網(wǎng)絡模糊算法的完整輸入輸出條件。具體構(gòu)建人臉識別的神經(jīng)網(wǎng)絡層可以按照下述步驟執(zhí)行:
Step 1,構(gòu)建信號輸入層,以視覺攝像頭為坐標原點構(gòu)建人臉識別坐標系統(tǒng),這里推薦采用極坐標系統(tǒng)構(gòu)建識別坐標系,以人臉平面所處的角度與距離作為信號的輸入層,按照坐標系的變換得到神經(jīng)網(wǎng)絡信號輸入的距離差值和角度差值Δρ,Δθ,作為完整的輸入信號。
Step 2,構(gòu)建模糊化層,將上一層信號輸入層傳輸過來的系統(tǒng)人臉識別信號Δρ與Δθ進行向量傳輸,將模糊化層中的每一個節(jié)點直接與輸入信號向量的分量相連接,并進行信號矢量化傳輸;同時在傳輸?shù)倪^程中,根據(jù)模糊化規(guī)則庫的條件制約,對每一個信號向量的傳輸都使用模糊規(guī)則,具體可以采用如下的隸屬度函數(shù)來進行模糊化處理:
(1)
其中c ij 和σij分別表示隸屬函數(shù)的中心和寬度。
Step 3,構(gòu)建信號輸出層,將模糊化層經(jīng)過模糊處理之后的信號進行清晰化運算,并作為最終結(jié)果輸出。
關于模糊規(guī)則庫的建立,目前所用的方法都是普遍所采用的匹配模糊規(guī)則,即計算每一個傳輸節(jié)點在模糊規(guī)則上的適用度,適用就進行模糊化規(guī)則匹配并進行模糊化處理,不適用則忽略該模糊規(guī)則并依次向下行尋找合適的模糊規(guī)則。當所有的,模糊規(guī)則構(gòu)建好之后,需要對每條規(guī)則的適用度進行歸一化運算,運算方法為:
(2)
2) 人臉的識別算法按如下步驟執(zhí)行:
Step 1:一個樣本向量被提交給網(wǎng)絡中的每一個神經(jīng)元;
Step 2:計算它們與輸入樣本的相似度di;
Step 3:由競爭函數(shù)計算出競爭獲勝的神經(jīng)元,若獲勝神經(jīng)元的相似度小于等于相似度門限值ν,則計算每個神經(jīng)元的獎懲系數(shù)γi,否則添加新的神經(jīng)元;
Step 4:根據(jù)學習算法更新神經(jīng)元或?qū)⑿绿砑拥纳窠?jīng)元的突觸權(quán)值置為x;
Step 5:學習結(jié)束后,判斷是否有錯誤聚類存在,有則刪除。
其中,
(3)
di是第i個神經(jīng)元的相似度值,β為懲罰度系數(shù),ν為相似度的門限值。γ的計算方法是對一個輸入樣本x,若競爭獲勝神經(jīng)元k的相似度dk≤ν,則獲勝神經(jīng)元的γk為1,其它神經(jīng)元的γi=-βdi/ν,i≠k;若dk >ν,則添加新的神經(jīng)元并將其突觸權(quán)值置為x。
實際上,網(wǎng)絡訓練的目的是為了提高本算法的權(quán)值實用域,即更加精確的實現(xiàn)對人臉特征的識別,從而提高算法的人臉識別率,當訓練結(jié)束后,即可輸出結(jié)果。
2.3 算法仿真測試
為了驗證本論文所提出的人臉識別模糊神經(jīng)網(wǎng)絡算法的有效性和可靠性,對該算法進行仿真測試,同時為了凸顯該算法的有效性,將該算法與傳統(tǒng)的BP神經(jīng)網(wǎng)絡算法進行對比仿真測試。
該測試采集樣本500張人臉圖片,分辨率均為128×128,測試計算機配置為雙核處理器,主頻2.1GHz,測試軟件平臺為Matlab,分別構(gòu)建BP神經(jīng)網(wǎng)絡分類器與本算法的神經(jīng)網(wǎng)絡分類器,對500幅人臉圖片進行算法識別測試。
如表1所示,為傳統(tǒng)BP神經(jīng)網(wǎng)絡算法和本論文算法的仿真測試結(jié)果對比表格。
從表1所示的算法檢測對比結(jié)果可以發(fā)現(xiàn):傳統(tǒng)的算法也具有人臉特征的識別,但是相較于本論文所提出的改進后的算法,本論文提出的算法具有更高的人臉特征識別率,這表明了本算法具有更好的魯棒性,神經(jīng)網(wǎng)絡模糊算法的執(zhí)行上效率更高,因而本算法是具有實用價值的,是值得推廣和借鑒的。
3 結(jié)束語
傳統(tǒng)的圖像識別技術(shù),很多是基于大規(guī)模計算的基礎之上的,在運算量和運算精度之間存在著不可調(diào)和的矛盾。因人工神經(jīng)網(wǎng)絡技術(shù)其分布式信息存儲和大規(guī)模自適應并行處理滿足了對大數(shù)據(jù)量目標圖像的實時處理要求,其高容錯性又允許大量目標圖像出現(xiàn)背景模糊和局部殘缺。相對于其他方法而言,利用神經(jīng)網(wǎng)絡來解決人臉圖像識別問題,神經(jīng)網(wǎng)絡對問題的先驗知識要求較少,可以實現(xiàn)對特征空間較為復雜的劃分,適用于高速并行處理系統(tǒng)來實現(xiàn)。正是這些優(yōu)點決定了模糊神經(jīng)網(wǎng)絡被廣泛應用于包括人臉在內(nèi)的圖像識別。本論文對模糊神經(jīng)網(wǎng)絡在人臉圖像識別中的應用進行了算法優(yōu)化設計,對于進一步提高模糊神經(jīng)網(wǎng)絡的研究與應用具有一定借鑒意義。
參考文獻:
[1] 石幸利.人工神經(jīng)網(wǎng)絡的發(fā)展及其應用[J].重慶科技學院學報:自然科學版,2006(2):99-101.
[2] 胡小鋒,趙輝.Visral C++/MATLAB圖像處理與識別實用案例精選[M].北京:人民郵電出版社,2004.
[3] 戰(zhàn)國科.基于人工神經(jīng)網(wǎng)絡的圖像識別方法研究[D].北京:中國計量科學研究院,2007.
[4] 王麗華.基于神經(jīng)網(wǎng)絡的圖像識別系統(tǒng)的研究[D].北京:中國石油大學,2008.
[5] 范立南,韓曉微,張廣淵.圖像處理與模式識別[M].北京:科學出版社,2007.
[6] 金忠.人臉圖像特征抽取與維數(shù)研究[D].南京:南京理工大學,1999.
關鍵詞: 人臉識別; 數(shù)據(jù)采集; Adaboos算法; 考勤
中圖分類號:TP311 文獻標志碼:A 文章編號:1006-8228(2017)04-53-03
Abstract: There are two kinds of traditional enterprise time and attendance system, the manual system and the timecard system. The manual system is of great workload and low efficiency, while the timecard system has the phenomenon of fake registration and loss of the card, resulting in a higher cost. Therefore the use of enterprise camera to develop a face-recognition based enterprise time and attendance system can greatly improve the efficiency of enterprise check work attendance and reduce the cost of attendance management. This paper introduces the research and development process and the research results of an enterprise's face-recognition based time and attendance system.
Key words: face recognition; data collection; Adaboos algorithm; check work attendance
0 引言
人臉圖像具有惟一性和穩(wěn)定性,因此人臉識別廣泛應用于刑偵破案、視頻監(jiān)控、表情分析、日??记诘葓龊?,逐漸成為人們工作和生活中的常用身份驗證手段。人臉識別技術(shù)應用于考勤系統(tǒng),可以充分利用已經(jīng)建好的人臉數(shù)據(jù)庫資源,更直觀、方便地核查身份。本文對應用于考勤系統(tǒng)的人臉識別技術(shù)進行了研究。
1 系統(tǒng)設計概述
本系統(tǒng)包含采集模塊和管理模塊兩大模塊。采集模塊主要包括視頻圖像的采集、處理、人臉檢測、人臉定位以及跟蹤;管理模塊主要包括人臉識別管理和考勤管理。系統(tǒng)架構(gòu)和工作流程如圖1所示。
系統(tǒng)分為服務器端、辦公室端和工廠端三部分。服務器端負責數(shù)據(jù)的存儲和讀寫;辦公室端負責軟件系統(tǒng)設置、考勤人員錄入、人員人臉特征采集、考勤情況統(tǒng)計等等;工廠端為人員考勤點[1]。
人臉識別考勤系統(tǒng)的程序流程:管理員通過攝像頭將企業(yè)員工頭像錄入數(shù)據(jù)庫,員工每次考勤時將臉部對準攝像頭,系統(tǒng)提取頭像,經(jīng)視頻識別模塊與數(shù)據(jù)庫中照片比對,配對成功后記一次考勤,并將考勤數(shù)據(jù)發(fā)送到考勤數(shù)據(jù)處理模塊。考勤數(shù)據(jù)模塊與企業(yè)財務系統(tǒng)對接,將考勤與員工的工資、獎金掛鉤。圖2為識別程序流程圖。
2 數(shù)據(jù)庫整體框架
本系統(tǒng)首先通過登錄模塊來確保登錄用戶具有合法性,保障了系統(tǒng)的安全。本文將用戶分為管理員和普通用戶,普通用戶可以查看員工的考勤記錄和修改自己的密碼,而管理員可以對所有窗口進行各種管理操作,如添加、刪除、修改員工基本信息,設置權(quán)限,添加員工請假信息等。其中本系統(tǒng)中還有一個人臉庫,它存儲每一個員工人臉照片,這些照片經(jīng)過圖像預處理,分別存放在以員工名字命名的文件夾中,為人臉庫的訓練提供數(shù)據(jù)[2]。
用戶登錄窗口是整個系統(tǒng)的入口,在用戶成功登錄后就可以按照權(quán)限進行相應的操作。管理員權(quán)限登錄成功后可以進行人臉檢測、人臉自動識別、保存視頻圖像等功能,而普通用戶就沒有這個權(quán)限。普通用戶的權(quán)限是可以查詢員工的出勤信息、修改自己的密碼等功能。
用到數(shù)據(jù)庫的窗體主要有以下三個。
⑴ 員工注冊信息窗口,它用于管理員工的基本信息,包括員工信息的添加、刪除、修改和瀏覽等操作。
⑵ 員工出勤窗口,它用來記錄員工的出勤狀況如是否請假、遲到等,也包括對請假員工信息的錄入等。
⑶ 查詢窗口,它主要用來查詢員工的出勤信息,可以按多種條件進行查詢,比如按具體的日期、是否遲到、是否請假、正常出勤等條件進行查詢[3]。
3 人臉識別算法的實現(xiàn)
AdaBoost 算法以根弱學習的反饋信息自適應性的調(diào)整錯誤率下限,這就使得該算法更容易被應用于實際問題。同時,由于AdaBoost算法在效率上幾乎和原有的Boosting算法相差無幾,這就使得 Adaboost算法得到了極大的發(fā)展[4]。
Adaboost算法的具體實現(xiàn)步驟如下。
⑴ 設輸入M個訓練樣本:{(x1,y1,…,(xm,ym))},其中Xi∈X,Yi=(+1,-1),初始化樣本權(quán)重D1(i)=1/m,i=1,…,m。
⑵ 對每次訓練都要進行一次操作:對弱分類器空間的每個弱分類器h進行操作為:將樣本空間X劃分為:X1,X2,…,Xn,計算每個劃分j=1,…,N及b={+1,-1}之間的區(qū)域標識權(quán)重。得到每個弱分類器h 在各個劃分上的輸出值為:
,計算歸一化因子:。
⑶ 從弱分類器空間中選擇出使歸一化因子Z 最小化的弱分類器h并加入到強分類器中,則:Zmin(Z)。
模塊的輸入為所有訓練樣本的特征集,經(jīng)過用戶指定的迭代次數(shù)T次后,共可得到T個分類能力比較強的弱分類器。在每次迭代時,根據(jù)訓練樣本的權(quán)重來訓練弱分類器,然后根據(jù)弱分類器的判斷結(jié)果和樣本的權(quán)重分布來選擇出一個錯誤率最小的弱分類器以作為本次迭代選出的分類能力較強的弱分類器 h,最后通過增大h所錯分的樣本權(quán)重值來更新每個訓練樣本的權(quán)值,以便在下次迭代中,使這些被錯分的樣本得到更多的重視,經(jīng)過迭代最后共可產(chǎn)生T個弱分類器,將這些弱分類器組合后便可得到分類能力較強的強分類器[5]。
4 結(jié)論與展望
本文針對鐳射卡考勤存在的問題,運用軟件工程的方法,設計實現(xiàn)了人臉識別考勤系統(tǒng),并將其用于廣東順德科晟電子有限公司。
本文主要是做了以下幾方面的內(nèi)容:
⑴ 介紹了人臉識別的方法原理和比較有特色的人臉識別及其算法。
⑵ 根據(jù)順德科晟電子有限公司原有考勤管理系統(tǒng)存在的問題,以及當前認人事考勤管理現(xiàn)狀,論證了對進行人臉識別考勤系統(tǒng)的必要性和緊迫性。
⑶ 針對廣東順德科晟電子有限公司的考勤管理系統(tǒng)的現(xiàn)狀,按照軟件工程的思想完成了對人臉識別考勤系統(tǒng)的需求分析和系統(tǒng)設計。
⑷ 設計了人臉識別考勤系統(tǒng)數(shù)據(jù)庫和數(shù)據(jù)字典。
⑸ 完成了人臉識別考勤系統(tǒng)的開發(fā)。
由于本人水平有限,本系統(tǒng)的設計和開發(fā)還存在許多不周全之處,在下一步研究中還需要改進。
參考文獻(References):
[1] 齊禮成.基于人臉識別考勤系統(tǒng)的設計與實現(xiàn)[D].西安電子科技大學碩士學位論文,2012.
[2] 郭磊.人臉檢測技術(shù)研究及實現(xiàn)[D].哈爾濱理工大學碩士學位論文,2009.
[3] 劉明寶,姚鴻勛,高文.彩色圖像的時人臉跟蹤方法[J].計算機學報,1998.21(6).
關鍵詞:風險管理,風險識別,風險評價,風險對策決策
1.風險涵義的理解
風險的概念至今在學術(shù)界尚無統(tǒng)一的定義,我們可以從多種角度理解風險的涵義。主要包括以下四個方面:(1)風險是一種不確定性。這種不確定性,既是機會又是威脅。(2)風險產(chǎn)生損失的后果。(3)風險是預期和后果之間的差異。(4)風險與個人,群體或組織行為相聯(lián)系,不與行為相聯(lián)系的風險只是一種危險。
2.風險管理的意義
(1)通過風險分析,可以加深對項目和風險的認識,了解風險對項目的影響,權(quán)衡利弊,以便減少或分散風險,抓住并利用有利的機會;(2)通過檢查信息、數(shù)據(jù)和資料,可明確項目的有關前提和假設;(3)通過風險分析,提高項目計劃的可信度,改善項目組織內(nèi)外部的聯(lián)系;(4)便于將各種處理風險的方式靈活的組合起來,在項目管理中減少被動;(5)積累的風險資料和數(shù)據(jù)為以后的各項工作提供反饋,促進項目執(zhí)行組織和管理者對將來項目管理的改進;(6)對于無法避免的風險,能夠明確項目將承受的損失;(7)為項目施工、運營、選擇合同形式和制定應急計劃提供依據(jù)。
3.風險管理過程
風險管理就是一個識別、確定和度量風險,并制定、選擇和實施風險處理方案的過程。建設工程風險管理在這一點上并無特殊性。風險管理的過程包括:風險識別、風險評價、風險對策決策、實施決策、檢查五個方面的內(nèi)容。
4.風險識別
風險識別是將引起風險的主要因素分層查找出來進行歸類。
4.1風險識別的原則
1.由粗及細,由細及粗;2.嚴格界定風險內(nèi)涵并考慮風險因素之間的相關性;3.先懷疑,后排除;4.排除與確認并重;5.必要時,可作實驗論證。
4.2風險識別的方法
識別項目風險的方法很多,主要有:德爾菲法(Delphi method)、頭腦風暴法(Brainstorming)、情景分析法(Scenarios analysis)、核對表法(Checklists)、面談法(Interviewing)、事故樹法(Fault Tree Analysis,F(xiàn)TA)等。在進行風險識別時,除了采用上述方法之外,對建設工程風險的識別,還應根據(jù)其自身特點,采取相應的方法。綜合起來,建設工程識別的方法有:1.專家調(diào)查法2.財務報表法3.流程圖法4.初始清單法5.經(jīng)驗數(shù)據(jù)法6.風險調(diào)查法。
5.風險評價
風險評價是在風險識別之后,對認識到的風險作的進一步分析。
5.1風險評價的基本內(nèi)容
1.比較各項目風險,確定先后順序;2.從項目整體出發(fā),弄清各風險事件之間的因果關系,制定系統(tǒng)的風險管理計劃;3.考慮各種風險、威脅和機會之間互相轉(zhuǎn)化的條件;4.量化已識別的風險的發(fā)生概率和后果,減少風險發(fā)生的不確定性。
5.2風險評價的作用
一是更準確地認識風險;二是保證目標規(guī)劃的合理性和計劃的可行性;三是合理選擇風險對策,形成最佳風險對策組合。
5.3風險評價的方法
對項目進行風險評價的方法一般可分為定性評價和定量評價兩大類。具體方法有很多,主要有:蒙特卡羅模擬法(Monte Carlo Simulation)、外推法(Extrapolation)、主觀概率評分法(Subjective Probability Method)、層次分析法(AnalyticalHierarchy Process,AHP)、決策樹法(DecisionTree Analysis)等。
6.風險對策
風險被識別和分析評價后,就應當考慮對各種風險的處理方法。風險的防范手段即為風險對策,也稱為風險管理技術(shù)。主要手段有:
6.1風險回避
風險回避就是以一定的方式中斷風險源,使其不發(fā)生或不再發(fā)展,從而避免可能產(chǎn)生的潛在損失。但在采用風險回避對策時需要注意幾點問題:1.回避一種風險可能產(chǎn)生另一種新的風險;2.回避風險的同時也失去了從風險中獲利的可能性;3.回避風險可能不實際或不可能。
6.2風險控制
風險控制是一種預防和減少風險損失的主動、積極的風險對策。它就辨別出的關鍵風險因素逐一提出技術(shù)上可行、經(jīng)濟上合理的預防措施,以盡可能低的風險成本降低風險發(fā)生的可能性,并努力將風險損失控制在最小程度。
6.3風險自留
風險自留就是將風險留給自己承擔。風險自留為企業(yè)自身保留了從中獲利的可能性,同時也減少了在采取某種防范風險措施時所發(fā)生的費用。風險自留通常適用于風險損失小,發(fā)生頻率高的風險。
6.4風險轉(zhuǎn)移
風險轉(zhuǎn)移是試圖將項目投資者可能面臨的風險轉(zhuǎn)移給他人承擔,以避免風險損失的一種方法。轉(zhuǎn)移風險是為降低系統(tǒng)風險,在各部分之間進行的風險再分配。論文大全。它是建設工程風險管理中非常重要而且廣泛應用的一項對策,分為非保險轉(zhuǎn)移(通過鑒定合同的方式轉(zhuǎn)移風險)和保險轉(zhuǎn)移(通過工程保險的方式轉(zhuǎn)移風險)兩種形式。論文大全。
7.實施決策
實施決策就是對風險對策所作出的決策進一步落實到具體的計劃和措施,從而保證風險事件發(fā)生時,能有一系列的既定計劃,指導風險事件處理工作的正常進行,減少風險事件造成的損失。
8.檢查
在建設工程實施過程中,要對各項風險對策的執(zhí)行情況不斷的進行檢查,并評價各項風險對策的執(zhí)行效果;在工程實施條件發(fā)生變化時,要確定是否需要提出不同的風險處理方案。此外,還需要檢查是否有被遺漏的或者是新發(fā)現(xiàn)的工程風險,開始新一輪的風險管理過程。論文大全。
由此可知,風險檢查的目的有三個:一是監(jiān)視風險的狀況;二是檢查風險的對策是否有效,監(jiān)控機制是否在運行;三是不斷識別新的風險并制定對策。
參考文獻
[1] 中國建設監(jiān)理協(xié)會組織編寫. 建設工程監(jiān)理概論[M].北京:知識產(chǎn)權(quán)出版社,2008
[2] 范黎波編著. 項目管理[M]. 北京:對外經(jīng)濟貿(mào)易大學出版社,2005
[3] 余建星編著. 工程項目風險管理[M]. 天津:天津大學出版社,2006
[4] 莫慶文. 建設工程的風險管理[J]. 中國科技信息,2007
對于中國而言,人工智能的發(fā)展更是一個歷史性的戰(zhàn)略機遇,對于緩解未來人口老齡化壓力、應對可持續(xù)發(fā)展挑戰(zhàn)、以及促進經(jīng)濟結(jié)構(gòu)轉(zhuǎn)型升級至關重要。
那么目前,人工智能在中國的發(fā)展條件如何,中國距離成為真正的人工智能強國還有多遠?7月13日,《中國人工智能發(fā)展報告2018》在清華大學主樓接待廳。
報 告中稱,目前中國人工智能的發(fā)展已經(jīng)具備非常優(yōu)越的條件,然而要成為真正的人工智能強國,中國還任重道遠。中國在論文總量和高被引論文數(shù)量上都排在世界第 一,但中國在人才總量,以及杰出人才占比偏低。在產(chǎn)業(yè)上,中國的人工智能企業(yè)數(shù)量排在全球第二,不過,中國人工智能領域的投融資占到了全球的60%,成為全球最“吸金”的國家。
報 告指出,中國必須加強基礎研究,優(yōu)化科研環(huán)境,培養(yǎng)和吸引頂尖的人才,在人工智能的新基礎領域?qū)崿F(xiàn)突破,保證人工智能發(fā)展的根基穩(wěn)固。同時,要大力鼓勵產(chǎn) 學研合作,讓企業(yè)成為人工智能創(chuàng)新的主導力量。積極參與到人工智能全球治理機制的構(gòu)建中,在人工智能未來的技術(shù)發(fā)展、風險防范、道理倫理規(guī)范制定等領域發(fā) 揮中國獨特的作用。
這份報告由清華大學中國科技政策研究中心、清華公共管理學院政府文獻中心、北京賽時科技有限公司、科睿唯安、中國信息通信研究院和北京字節(jié)跳動科技有限公司聯(lián)合。
論文總量世界第一,杰出人才占比偏低
報告中稱,在論文產(chǎn)出上,中國人工智能論文總量和高被引論文數(shù)量都是世界第一。中國在人工智能領域論文的全球占比從1997年4.26%增長至2017年的27.68%,遙遙領先其他國家。
高校是人工智能論文產(chǎn)出的絕對主力,在全球論文產(chǎn)出百強機構(gòu)中,87家為高校。中國頂尖高校的人工智能論文產(chǎn)出在全球范圍內(nèi)都表現(xiàn)十分出眾。
不僅如此,中國的高被引論文呈現(xiàn)出快速增長的趨勢,并在2013年超過美國成為世界第一。
但在全球企業(yè)論文產(chǎn)出排行中,中國只有國家電網(wǎng)公司的排名進入全球20。
從學科分布看,計算機科學、工程和自動控制系統(tǒng)是人工智能論文分布最多的學科。國際合作對人工智能論文產(chǎn)出的影響十分明顯,高水平論文中國通過國際合作而發(fā)表的占比高達42.64%。
專利申請上中國專利數(shù)量略微領先美國和日本。中國已經(jīng)成為全球人工智能專利布局最多的國家,數(shù)量略微領先于美國和日本,三國占全球總體專利公開數(shù)量的74%。
全球?qū)@暾堉饕性谡Z音識別、圖像識別、機器人、以及機器學習等細分方向。中國人工智能專利持有數(shù)量前30名的機構(gòu)中,科研院所與大學和企業(yè)的表現(xiàn)相當,技術(shù)發(fā)明數(shù)量分別占比52%和48%。
企業(yè)中的主要專利權(quán)人表現(xiàn)差異巨大,但中國國家電網(wǎng)近五年的人工智能相關技術(shù)發(fā)展迅速,在國內(nèi)布局專利技術(shù)量遠高于其他專利權(quán)人,而且在全球企業(yè)排名中位列第四。
中國的專利技術(shù)領域集中在數(shù)據(jù)處理系統(tǒng)和數(shù)字信息傳輸?shù)龋渲袌D像處理分析的相關專利占總發(fā)明件數(shù)的16%。電力工程也已成為中國人工智能專利布局的重要領域。
雖然在論文總量和高被引用論文數(shù)量上中國排名領先,但在人才投入上,中國表現(xiàn)并不突出。
根據(jù)該報告,截至2017年,中國的人工智能人才擁有量達到18232人,占世界總量8.9%,僅次于美國(13.9%)。高校和科研機構(gòu)是人工智能人才的主要載體,清華大學和中國科學院系統(tǒng)成為全球國際人工智能人才投入量最大的機構(gòu)。
然而,按高H因子衡量的中國杰出人才只有977人,不及美國的五分之一,排名世界第六。企業(yè)人才投入量相對較少,高強度人才投入的企業(yè)集中在美國,中國僅有華為">華為一家企業(yè)進入全球前20。
中國人工智能人才集中在東部和中部,但個別西部城市如西安和成都也表現(xiàn)十分突出。國際人工智能人才集中在機器學習、數(shù)據(jù)挖掘和模式識別等領域,而中國的人工智能人才研究領域比較分散。
中國人工智能企業(yè)數(shù)量全球第二,但投融資規(guī)模最大
報告稱,中國人工智能企業(yè)數(shù)量從2012年開始迅速增長,截至2018年6月,中國人工智能企業(yè)數(shù)量已達到1011家,位列世界第二,但與美國的差距還非常明顯(2028家)。
中國人工智能企業(yè)高度集中在北京、上海和廣東。在全球人工智能企業(yè)最多的20個城市中,北京以395家企業(yè)位列第一,上海、深圳和杭州也名列其中。中國人工智能企業(yè)應用技術(shù)分布主要集中在語音、視覺和自然語言處理這三個技術(shù),而基礎硬件的占比很小。
風險投資上,從2013到2018年第一季,中國人工智能領域的投融資占到全球的60%,成為全球最“吸金”的國家。但從投融資筆數(shù)來看,美國仍是人工智能領域創(chuàng)投最為活躍的國家。
在國內(nèi),北京的融資金額和融資筆數(shù)都遙遙領先其他地區(qū),上海和廣東的人工智能投資也很活躍。從2014年開始,國內(nèi)人工智能投融資活動的早期投資的占比逐漸下降,投資活動日趨理性,但A輪融資還是占主導地位。
中 國人工智能市場增長迅速,計算機視覺市場規(guī)模最大。2017年中國人工智能市場規(guī)模達到237億元,同比增長67%。計算機視覺、語音、自然語言處理的市 場規(guī)模分別占34.9%、24.8%、21%,而硬件和算法的市場規(guī)模合計不足20%。預計2018年中國人工智能市場增速將達到75%。
煙草企業(yè)使用先進的技術(shù)和先進的設備,使得煙草的生產(chǎn)更加自動化,生產(chǎn)效率和質(zhì)量都能得到保證。采用先進的煙草倉儲管理方案,也是煙草公司生產(chǎn)的關鍵。其在煙草的物流管理中所采取的傳統(tǒng)做法是:條碼技術(shù)。這種技術(shù)的使用可以使得生產(chǎn)效率大大提高,同時也存在著許多缺點:容易損壞、需要逐個掃描、在出庫入庫時需要大量掃描時間以及有較高的誤碼等等。企業(yè)采用這種方式還需要許多人工錄入信息,效率并沒有顯著提高。采用RFID技術(shù)可以解決上述問題,同時能夠使得企業(yè)的成本大大降低。目前我國煙草公司采用RFID技術(shù)作為倉儲管理的方案還處于初步階段,本論文對基于RFID的煙草倉儲管理方案作簡要介紹。
【關鍵詞】RFID 倉儲管理
1 引言
煙草企業(yè)使用先進的技術(shù)和先進的設備,使得煙草的生產(chǎn)更加自動化,生產(chǎn)效率和質(zhì)量都能得到保證。采用先進的煙草倉儲管理方案,也是煙草公司生產(chǎn)的關鍵。其在煙草的物流管理中所采取的傳統(tǒng)做法是:條碼技術(shù)。這種技術(shù)的使用可以使得生產(chǎn)效率大大提高,同時也存在著許多缺點:容易損壞、需要逐個掃描、在出庫入庫時需要大量掃描時間以及有較高的誤碼等等。企業(yè)采用這種方式還需要許多人工錄入信息,效率并沒有顯著提高。
采用RFID技術(shù)可以解決上述問題,同時能夠使得企業(yè)的成本大大降低。目前我國煙草公司采用RFID技術(shù)作為倉儲管理的方案還處于初步階段,本論文對基于RFID的煙草倉儲管理方案作簡要介紹。
2 RFID技術(shù)
RFID的中文是射頻識別技術(shù),也叫做“電子標簽”。人們通過該技術(shù)能夠識別特點的信息,同時讀取相關的數(shù)據(jù)并進行相應處理。作為一種新興的技術(shù),該技術(shù)具有許多優(yōu)點:具有很強的穿透性、很大的存儲空間、更快的讀取速度以及更高的安全性能。RFID一般由以下幾個部分組成:天線、標簽、讀寫器以及中間件等等。圖1所示是RFID系統(tǒng)的結(jié)構(gòu)圖。
3 基于RFID的煙草倉儲管理方案
本論文設計的煙草倉儲系統(tǒng),主要業(yè)務是對卷煙的出入庫管理。采用RFID技術(shù),可以使得每個環(huán)節(jié)的信息更加透明,使得管理者和操作人員能夠更方便及時地了解煙草的數(shù)量、位置等狀態(tài),從而實現(xiàn)了信息流和物流的融合。
3.1 系統(tǒng)整體架構(gòu)
基于RFID的煙草倉儲管理系統(tǒng)的主要工作原理是:所有的卷煙都存放在托盤上,每個托盤都貼有相應的電子標簽。數(shù)據(jù)庫通過相應處理,將每個托盤上電子標簽的信息整合在一起,同時一一對應。采集到相應的電子標簽的信息,就可以獲得相應的各種條碼信息。
3.2 系統(tǒng)流程設計
整體的系統(tǒng)流程如下:
(1)處理件煙的信息:通過掃描托盤上安裝的RFID電子標簽來讀取相應的信息(生產(chǎn)日期、數(shù)量等等)。倉儲管理系統(tǒng)在物流的過程中及時更新信息,使得供貨商可以確定合適的入庫方案。
(2)對于煙草入庫的管理:煙草在入庫的過程中,在通道口的RFID讀寫器對件煙信息進行讀取,同時對電子標簽進行信息寫入,主要是入庫時間和地點等信息。同時這些信息應該及時更新到倉儲的管理系統(tǒng)中。系統(tǒng)自動識別,如果這批貨物是所訂的煙草,就發(fā)送信息使搬運車對其進行搬運,將貨物存儲;如果不是所訂的煙草,系統(tǒng)會提示工作人員進行相應處理。貨物全部入庫后,及時更新數(shù)據(jù)庫信息,打印入庫清單。
(3)對于煙草庫存的管理:工作人員通過RFID讀寫器可以實時掌握煙草的各種基本信息。工作人員可以通過其實時了解困村信息,在庫存量減少時可以及時補貨;在煙草貨物移動位置時,RFID會自動讀取貨物的位置信息,并傳送到管理系統(tǒng)中,實現(xiàn)庫存的精確控制。
4 系統(tǒng)性能分析
其在煙草的物流管理中所采取的傳統(tǒng)做法是:條碼技術(shù)。這種技術(shù)的使用可以使得生產(chǎn)效率大大提高,同時也存在著許多缺點:容易損壞、需要逐個掃描、在出庫入庫時需要大量掃描時間以及有較高的誤碼等等。企業(yè)采用這種方式還需要許多人工錄入信息,效率并沒有顯著提高。我們可以看出,基于RFID的煙草倉儲管理方案有如下特點:
(1)整個管理過程都采用了先進的RFID射頻識別技術(shù),倉儲管理的各個環(huán)節(jié)都得到有效覆蓋。這樣做可以提高管理效率,使得管理過程更加人性化,同時縮短了出入庫的時間。
(2)以外的成品卷煙識別率都不高,采用RFID技術(shù)后可以大大提高其出入庫的識別率。這樣不僅使得時間大大縮短,同時節(jié)約了大量的人力勞動。RFID可以在同一時刻識別很多標簽信息,這就使得煙草在出入庫過程的效率成倍增加了。
5 總結(jié)
本論文首先介紹了基于RFID的煙草倉儲管理方案的必要性,進而介紹了RFID技術(shù),并對整個系統(tǒng)方案進行了簡要介紹。從中我們可以看出,采用RFID技術(shù)能夠使得企業(yè)的成本大大降低。
參考文獻
[1]郎為民.射頻識別(RFID)技術(shù)原理與應用[M].北京:機械工業(yè)出版社,2011.
[2]程珊珊,朱景鋒.物聯(lián)網(wǎng)情景感知技術(shù)在智能倉儲領域的應用展望[J].物聯(lián)網(wǎng)技術(shù),2012,2(5):47-49.
[3]鄧明明.RFID技術(shù)在倉儲信息化管理中的應用[J].鐵路采購與物流,2008(05).
[4]王運峰.RFID技術(shù)在發(fā)動機裝配生產(chǎn)線上的應用[J].裝備制造技術(shù),2010(05).
[5]楊永生.基于RFID的物流倉儲管理系統(tǒng)設計[J].科技信息,2011(01).
關鍵詞:自然語言處理 語言翻譯 人工智能
一、引言
近年來隨著計算機技術(shù)和人工智能的快速發(fā)展,自然語言信息處理技術(shù)已取得了長足的發(fā)展。于此同時人們在快速信息檢索、語言翻譯、語音控制等方面的需求越來越迫切。如何將自然語言處理中取得的研究成果應用于文本、語音等方面已成為目前應用研究的一個關鍵。論文將從自然語言信息處理的基礎出發(fā),系統(tǒng)的論述它在語音和文本方面的廣泛應用。
二、自然語言信息處理技術(shù)簡介
自然語言信息處理技術(shù)產(chǎn)生于上個世紀40年代末期,它是通過采用計算機技術(shù)來對自然語言進行加工處理的一項技術(shù)。該技術(shù)主要是為了方便人與計算機之間的交流而產(chǎn)生的。由于計算機嚴密規(guī)范的邏輯特性與自然語言的靈活多變使得自然語言處理技術(shù)較復雜。通過多年的發(fā)展,該項技術(shù)已取得了巨大的進步。其處理過程可歸納為:語言形式化描述、處理算法設計、處理算法實現(xiàn)和評估。其中,語言形式化描述就是通過對自然語言自身規(guī)律進行研究,進而采用數(shù)學的方法將其描述出來,以便于計算機處理,也可認為是對自然語言進行數(shù)學建模。處理的算法設計就是將數(shù)學形式化描述的語言變換為計算機可操作、控制的對象。處理算法實現(xiàn)和評估就是通過程序設計語言(如C語言)將算法實現(xiàn)出來,并對其性能和功能進行評估。它主要涉及到計算機技術(shù)、數(shù)學(主要是建模)、統(tǒng)計學、語言學等多個方面。
三、智能應用
通過多年的研究,自然語言信息處理技術(shù)已經(jīng)取得了巨大的進步,特別是在應用方面。它主要被應用于文本和語音兩個方面。
(一)自然語言信息處理在文本方面的智能應用
在文本方面,自然語言處理技術(shù)主要應用在語言翻譯、字符識別、文本信息過濾、信息檢索與重組等方面。其中,語言自動翻譯是一個十分重要并具有極大現(xiàn)實意義的項目。它涉及到計算機技術(shù)、數(shù)學建模技術(shù)、心理學以及語言學等多個方面的學科。通過近些年的努力已得到了一定的發(fā)展。自然語言處理技術(shù)已在多個方面提升了翻譯的效率和準確性。如自然語言處理中的語言形態(tài)分析與歧義分析對翻譯技術(shù)來說十分重要,可以很好的處理翻譯中的多意現(xiàn)象和歧義問題,從而提高翻譯的準確性。字符識別具有廣泛的商業(yè)應用前景,它是模式識別的一個分支。字符識別的主要過程可分為預處理、識別以及后期處理。目前,字符識別已得到了廣泛的應用,并且效果良好,但還存在識別不準確的問題,其主要問題就出在合理性上,其中后期處理就涉及到采用詞義或語料庫等對識別結(jié)果進行合理性驗證,通過該技術(shù)就能很好的解決識別不準確的問題,當出現(xiàn)識別不準確、出現(xiàn)多個識別結(jié)果時可以通過合理性驗證技術(shù)高效的過濾掉異常選項,從而實現(xiàn)快速、準確的識別。目前自然語言信息處理技術(shù)在文本方面應用最廣的就是文本檢索。通過采用自然語言信息處理技術(shù),一方面能快速分析用戶輸入信息并進行準確理解為檢索提供更加準確的關鍵詞,并且可以擴展檢索輸入的范圍,讓其不僅僅局限在文本輸入方面,如采用語音輸入或基于圖像的輸入;另一方面,通過采用自然語言信息處理技術(shù)可以對搜索到的信息進行處理讓用戶獲取的是更加有效、準確的信息而不是海量的信息源(如許多網(wǎng)頁)。因為將自然語言處理技術(shù)與文本重組技術(shù)相結(jié)合就可以極大的提高檢索的效果,縮小答案的范圍,提高準確性。當然,還可以提高檢索的效率。目前,在中文全文檢索中已得到了廣泛的應用,并且效果良好。
如果能進一步的研究自然語言信息處理技術(shù),將能實現(xiàn)信息的自動獲取與重組,這樣將能實現(xiàn)自動摘要生成、智能文本生成、文件自動分類與自動整理。若能進一步結(jié)合人工智能技術(shù),將能實現(xiàn)文學規(guī)律探索、自動程序設計、智能決策等諸多方面的應用。這樣可以減輕人類的工作強度,讓我們從繁瑣的基礎工作中走出來,擁有更多思考的時間,從而能更加有效的推動技術(shù)的進步。