亚洲激情综合另类男同-中文字幕一区亚洲高清-欧美一区二区三区婷婷月色巨-欧美色欧美亚洲另类少妇

首頁(yè) 優(yōu)秀范文 語(yǔ)音識(shí)別系統(tǒng)

語(yǔ)音識(shí)別系統(tǒng)賞析八篇

發(fā)布時(shí)間:2023-03-02 15:05:52

序言:寫作是分享個(gè)人見解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了8篇的語(yǔ)音識(shí)別系統(tǒng)樣本,期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā),請(qǐng)盡情閱讀。

語(yǔ)音識(shí)別系統(tǒng)

第1篇

自上世紀(jì)中期以來(lái),語(yǔ)音教學(xué)在語(yǔ)言教學(xué)中逐步受到重視,教育部《高等學(xué)校英語(yǔ)專業(yè)英語(yǔ)教學(xué)大綱》對(duì)學(xué)生的語(yǔ)音能力提出明確的要求,即要求發(fā)音正確,語(yǔ)調(diào)比較自然,以此目標(biāo)指導(dǎo)語(yǔ)音教學(xué)。語(yǔ)音教學(xué)隨同外語(yǔ)教學(xué)理論、模式的演變也在經(jīng)歷著一系列的變革,教學(xué)重點(diǎn)從初期的音素和單詞發(fā)音,發(fā)展到目前著重超切分音,如中信、節(jié)奏和語(yǔ)調(diào)等(羅立勝,2002)。而語(yǔ)言教學(xué)方式也由機(jī)械的模仿、重復(fù)、跟讀、單音糾正發(fā)展到今天交際性的練習(xí)和自主練習(xí)。但是在對(duì)新生的語(yǔ)音情況調(diào)查中發(fā)現(xiàn),往往這種交際性練習(xí)和自主練習(xí)存在以下幾方面問(wèn)題:學(xué)生水平參差不齊,受母語(yǔ)影響程度不一,大部分中學(xué)學(xué)習(xí)過(guò)英語(yǔ)語(yǔ)音但不系統(tǒng),也不夠重視。中學(xué)教師因受應(yīng)試教育的影響,少有時(shí)間教授語(yǔ)音發(fā)音,經(jīng)調(diào)查,80%的學(xué)生稱中學(xué)學(xué)習(xí)過(guò)程中惟一的語(yǔ)音輸入來(lái)自英語(yǔ)教師。僅有30%的學(xué)生稱聽過(guò)磁帶、看過(guò)英文電影。語(yǔ)音學(xué)習(xí)雙層面的脫節(jié)性和去語(yǔ)境化學(xué)習(xí)97%學(xué)生因高考需要背記過(guò)國(guó)際音標(biāo)及其在英語(yǔ)單詞中的讀音,但80%的學(xué)生表示沒(méi)有進(jìn)行過(guò)系統(tǒng)的語(yǔ)音訓(xùn)練,缺乏語(yǔ)境化教學(xué)。自主語(yǔ)音學(xué)習(xí)效果欠佳,孤立的語(yǔ)音練習(xí)很難在實(shí)際語(yǔ)言交流中應(yīng)用。目前,語(yǔ)音課上教師主要幫助學(xué)生一對(duì)一,對(duì)比模仿練習(xí)發(fā)音,縮小學(xué)生在語(yǔ)音認(rèn)知上母語(yǔ)和目標(biāo)語(yǔ)之間的差異。課后學(xué)生僅能通過(guò)模仿有聲資料提高語(yǔ)音。標(biāo)準(zhǔn)程度往往由學(xué)生自行判斷,由于學(xué)生聽說(shuō)能力的差異,自行判斷發(fā)音是否準(zhǔn)確是不確定的。本文試圖以現(xiàn)代的語(yǔ)音教學(xué)技術(shù)Reading Assistant語(yǔ)音識(shí)別系統(tǒng)的引入探討語(yǔ)音教學(xué)模式的改革。

二、對(duì)Reading Assistant語(yǔ)音識(shí)別系統(tǒng)有效手段的分析

Reading Assistant語(yǔ)言學(xué)習(xí)系統(tǒng)由美國(guó)科學(xué)學(xué)習(xí)公司研發(fā)的,以語(yǔ)言學(xué)習(xí)理論和過(guò)程為基礎(chǔ),旨在通過(guò)朗讀提高語(yǔ)音、詞匯、語(yǔ)法等語(yǔ)言綜合技能即“以讀促學(xué)”,筆者所在西安外國(guó)語(yǔ)大學(xué)英文學(xué)院于2008年9月開始使用該系統(tǒng),擁有600個(gè)賬號(hào),僅供一年級(jí)新生使用。目前主要用于配合語(yǔ)音課程,輔助完善語(yǔ)音自主學(xué)習(xí)。根據(jù)上述語(yǔ)音教學(xué)中存在的問(wèn)題和應(yīng)該堅(jiān)持的教學(xué)原則,和以下Reading Assistant的教學(xué)特點(diǎn)作一對(duì)照,就不難理解該語(yǔ)音識(shí)別系統(tǒng)對(duì)英語(yǔ)語(yǔ)音學(xué)習(xí)及語(yǔ)言學(xué)習(xí)的可行性了。

1.根據(jù)Reading Assistant(語(yǔ)音識(shí)別)系統(tǒng)的(以下簡(jiǎn)稱語(yǔ)音識(shí)別)的設(shè)計(jì)。實(shí)行學(xué)生每人擁有一個(gè)使用賬號(hào),便于展開個(gè)性化的、有針對(duì)性的指導(dǎo)。滿足不同層次學(xué)生的要求,在語(yǔ)音教學(xué)中眾多語(yǔ)言教師發(fā)現(xiàn)模仿是提高語(yǔ)音的最有效方法之一,但是模仿什么語(yǔ)音材料,模仿哪種語(yǔ)音,怎樣模仿和自主學(xué)習(xí)能否模仿后是否準(zhǔn)確仍有很大的困難,在使用語(yǔ)音識(shí)別系統(tǒng)時(shí),學(xué)生首先要根據(jù)其設(shè)定的不同級(jí)別,和原有的測(cè)試級(jí)別自行測(cè)試,從精選的不同層次的150篇文章中選擇適合自己水平和類別的進(jìn)行朗讀。

每次朗讀后根據(jù)語(yǔ)音發(fā)音有成績(jī)記錄,每篇文章可以朗讀10次。語(yǔ)音識(shí)別系統(tǒng)是建立在建構(gòu)主意語(yǔ)音教學(xué)模式的理論智商,學(xué)生是學(xué)習(xí)的主體,不是被動(dòng)地接受知識(shí),而是主動(dòng)地在原有的知識(shí)體系中,通過(guò)不斷地積極實(shí)踐,構(gòu)建自己的新的知識(shí)和經(jīng)驗(yàn)。因此在這種長(zhǎng)期的語(yǔ)音練習(xí)過(guò)程中,學(xué)生可以根據(jù)自己的學(xué)習(xí)需要“建構(gòu)”語(yǔ)音學(xué)習(xí)材料,提高自主學(xué)習(xí)能力。

2.導(dǎo)入語(yǔ)音練習(xí)的語(yǔ)境化,模仿對(duì)象的本土化。在實(shí)際交往活動(dòng)中,聽、說(shuō)、讀、寫不是以孤立的因素和單詞為單位進(jìn)行思想交流的,取而代之的是以綜合的句子和更高層次的話語(yǔ)單位進(jìn)行的,孤立的因素和單詞的發(fā)音在綜合運(yùn)用中會(huì)產(chǎn)生很大的變異,如連讀、失去爆破、弱讀等影響,因此,語(yǔ)音識(shí)別系統(tǒng)通過(guò)不同類別的文章(包括科技、生活、文藝、人物傳記)等等構(gòu)建不同的語(yǔ)境,除了傳統(tǒng)意義對(duì)話中包含的語(yǔ)境外,文章中還涉及各個(gè)年齡段,男聲、女聲等讀音。錄音及文章內(nèi)容的選擇全部出自母語(yǔ)國(guó)家。確保模仿對(duì)象發(fā)音的準(zhǔn)確性。

3.判讀過(guò)程的準(zhǔn)確性和可調(diào)節(jié)性。根據(jù)語(yǔ)音識(shí)別系統(tǒng)讀音匹配程度的設(shè)計(jì),學(xué)生在閱讀過(guò)程中分別會(huì)出現(xiàn)完全正確發(fā)音、誤讀、不會(huì)讀、不準(zhǔn)確等情況,并以不同顏色標(biāo)注。每次閱讀完成后,學(xué)生可以查看有哪些單詞不準(zhǔn)確。開始閱讀后,每讀一個(gè)單詞就會(huì)有不同顏色顯示。而在本身閱讀中如果出現(xiàn)嚴(yán)重的錯(cuò)讀,該識(shí)別系統(tǒng)會(huì)停止前進(jìn),并隨機(jī)開始正確讀音,要求練習(xí)者跟讀。教師也可以根據(jù)自己的界面監(jiān)控學(xué)生朗讀過(guò)程,隨時(shí)抽聽不同學(xué)生的朗讀情況。過(guò)度的糾錯(cuò)會(huì)挫傷部分水平較低學(xué)生的學(xué)習(xí)積極性,因此在開始學(xué)習(xí)階段教師可以根據(jù)學(xué)生各個(gè)層次的學(xué)習(xí)調(diào)整不同的匹配度以提高學(xué)生學(xué)習(xí)興趣。

三、學(xué)生對(duì)語(yǔ)音識(shí)別使用情況及存在的問(wèn)題

經(jīng)過(guò)對(duì)英文學(xué)院2008級(jí)540名學(xué)生一學(xué)年使用情況的調(diào)查,86%的學(xué)生表示自己經(jīng)常去RA實(shí)驗(yàn)室,80%的學(xué)生認(rèn)為RA有助于閱讀水平的提高,95%的學(xué)生認(rèn)為RA對(duì)語(yǔ)音語(yǔ)調(diào)有幫助,90%的學(xué)生認(rèn)為RA對(duì)聽力有幫助,85%的學(xué)生認(rèn)為RA對(duì)整體學(xué)習(xí)有提高。對(duì)于語(yǔ)音識(shí)別系統(tǒng)進(jìn)一步的學(xué)習(xí)和開發(fā),學(xué)生表示除英語(yǔ)專業(yè)學(xué)生初期應(yīng)用在語(yǔ)音教學(xué)以外,還應(yīng)考慮繼續(xù)輔助閱讀、寫作等課程。而語(yǔ)音識(shí)別系統(tǒng)中文章內(nèi)容選擇可以適當(dāng)考慮本土化,多針對(duì)中國(guó)學(xué)生發(fā)音中存在的問(wèn)題進(jìn)一步涉及文章和練習(xí)。

綜上所述,外語(yǔ)語(yǔ)音教學(xué)目標(biāo)不再是僵硬的單音、音素教學(xué),而是融合更多語(yǔ)言交際任務(wù)的綜合教學(xué),而隨著計(jì)算機(jī)、數(shù)字化和語(yǔ)音識(shí)別技術(shù)的發(fā)展,充分利用現(xiàn)代教育技術(shù)不僅可以豐富教學(xué)內(nèi)容,更重要的是注意到學(xué)生的情感因素,培養(yǎng)學(xué)生自主學(xué)習(xí)能力,讓語(yǔ)音教學(xué)改變以往依賴性、單一性、枯燥性,使其更具創(chuàng)造性,讓以讀促學(xué)全方位體現(xiàn)在英語(yǔ)學(xué)習(xí)中。

參考文獻(xiàn)

[1]羅立勝等.英語(yǔ)語(yǔ)音教學(xué)的回顧及對(duì)目前英語(yǔ)語(yǔ)音教學(xué)的幾點(diǎn)意見.外語(yǔ)與外語(yǔ)教學(xué),2002(10).

[2]顧佩婭等.基于構(gòu)建主義的計(jì)算機(jī)輔助項(xiàng)目教學(xué)實(shí)踐.外語(yǔ)與外語(yǔ)教學(xué),2003(7).

[3]陳愛勤,石春熙.英語(yǔ)專業(yè)新生語(yǔ)音教學(xué)的語(yǔ)境論研究.長(zhǎng)春師范學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版),2008(1).

第2篇

論文關(guān)鍵詞:VC,Matlab,實(shí)時(shí)語(yǔ)音識(shí)別,MFCC,DTW,非特定人,MEX

 

1引言

VC和Matlab的混合編程共同運(yùn)用于語(yǔ)音識(shí)別,可以借助VC實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的采集,同時(shí)通過(guò)Matlab強(qiáng)

大的矩陣計(jì)算功能,簡(jiǎn)便化的編程方法,實(shí)現(xiàn)對(duì)語(yǔ)音

信號(hào)的識(shí)別處理。

其中,VC主要做語(yǔ)音信號(hào)的采集,通過(guò)借助于微

軟提供的WindowsMultimedia API 開發(fā)了在線實(shí)時(shí)語(yǔ)

音采集程序,實(shí)現(xiàn)了人機(jī)在線實(shí)時(shí)交互。

2 語(yǔ)音識(shí)別系統(tǒng)概述

語(yǔ)音信號(hào)的一般處理過(guò)程如圖 1所示,其中首先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理DTW,其中預(yù)處理包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測(cè)、預(yù)加重等。然后是信號(hào)特征量的提取,本文對(duì)信號(hào)的特征量進(jìn)行Mel 頻率倒譜系數(shù)(Mel-Frequency Cepstrum Coefficients)處理。最后通過(guò)對(duì)已經(jīng)建立好的參數(shù)模板進(jìn)行對(duì)比,測(cè)試的依據(jù)是失真度最小準(zhǔn)測(cè),如本文用到的動(dòng)態(tài)時(shí)間規(guī)整: DTW(DynamicTime Warping)。

圖 1 語(yǔ)音識(shí)別過(guò)程基本流程圖

3 語(yǔ)音信號(hào)的采集

語(yǔ)音信號(hào)的兩個(gè)過(guò)程為:對(duì)語(yǔ)音信號(hào)進(jìn)行實(shí)時(shí)

的采集,對(duì)采集的語(yǔ)音信號(hào)做出識(shí)別。本文對(duì)語(yǔ)音信號(hào)的采集是通過(guò)VC調(diào)用Microsoft的Windows系統(tǒng)中提供了多媒體應(yīng)用程序接口(Multimedia API)實(shí)現(xiàn)。

3.1 用VC生成動(dòng)態(tài)鏈接庫(kù)供Matlab調(diào)用

通過(guò)mex文件來(lái)實(shí)現(xiàn)VC與Matlab的混合編程。mex

代表 MatlabExecutable。Matlab中可以調(diào)用的C或

Fortran語(yǔ)言程序稱為mex文件。mex文件是一種特殊的動(dòng)態(tài)連接庫(kù)函數(shù),它能夠在MATLAB里像一般的M函數(shù)那樣來(lái)執(zhí)行。

VC編譯的時(shí)候應(yīng)該包含頭文件mex.h。與C中的主函數(shù)main()函數(shù)一樣,mex程序中的開始函數(shù)為:

void mexFunction(int nlhs,mxArray *plhs[], int nrhs, const mxArray *prhs[])其中

nlhs指的是在調(diào)用函數(shù)時(shí)返回值的個(gè)數(shù);

plhs[]是每個(gè)返回值(在MATLAB中都是矩陣)的指針;

nrhs指的是調(diào)用函數(shù)時(shí)的參數(shù)個(gè)數(shù);

prhs[]是每個(gè)參數(shù)的指針。

對(duì)mexFunction的參數(shù)是進(jìn)行指針操作的,不能用單純的return返回值。mex程序傳送回來(lái)的整數(shù)數(shù)據(jù)要變?yōu)殡p精度型數(shù)據(jù),才能為其它函數(shù)所處理。

3.2 Multimedia API函數(shù)介紹

API(ApplicationProgramming Interface,應(yīng)用程序編程接口)是一些預(yù)先定義的函數(shù),目的是提供應(yīng)用程序與開發(fā)人員基于某軟件或硬件的以訪問(wèn)一組例程的能力,而又無(wú)需訪問(wèn)源碼,或理解內(nèi)部工作機(jī)制的細(xì)節(jié)。

MultimediaAPI 函數(shù)主要有以下幾個(gè):獲取音頻設(shè)備信的函數(shù)waveInGetNumDevs(),該函數(shù)用于獲取當(dāng)前系統(tǒng)中所安裝的音頻輸入設(shè)備的數(shù)目。

查詢音頻設(shè)備的能力函數(shù)waveInOpen(),該函數(shù)的作用是打開波形輸入輸入設(shè)備。

通過(guò)CALLBACK_FUNCTION命令來(lái)打開設(shè)備。錄音緩沖區(qū)的組織WAVEHDR結(jié)構(gòu), 一般都是設(shè)置雙緩存區(qū)對(duì)語(yǔ)音信號(hào)進(jìn)行平穩(wěn)緩沖站。開始和停止錄音時(shí)用到waveInStart()和waveInStop()兩個(gè)函數(shù)。

4 用Matlab實(shí)現(xiàn)語(yǔ)音識(shí)別過(guò)程

4.1 端點(diǎn)檢測(cè)

從背景噪聲中找出語(yǔ)音的開始和終止點(diǎn)這是在很多語(yǔ)音處理應(yīng)用中的基本問(wèn)題。端點(diǎn)檢測(cè)對(duì)于語(yǔ)音識(shí)別有著重要的意義。本文主要采用短時(shí)能量與短時(shí)平均過(guò)零率雙門限結(jié)合的方式,來(lái)對(duì)漢語(yǔ)語(yǔ)音的起止點(diǎn)進(jìn)行檢測(cè)。短時(shí)能量和過(guò)零率分別確定兩個(gè)門限, 信號(hào)必須達(dá)到比較高的強(qiáng)度, 該門限才可能被超過(guò)。且低門限被超過(guò)未必就是語(yǔ)音的開始, 有可能是由短時(shí)間的噪聲引起; 高門限被超過(guò)則可以基本確定是由于語(yǔ)音信號(hào)引起的。

%每幀過(guò)零率

4.2 特征函數(shù)的提取

語(yǔ)音信號(hào)完成分幀處理和端點(diǎn)檢測(cè)后,下一步就是特征參數(shù)的提取。目前在語(yǔ)音識(shí)別中較為常用的特征參數(shù)是線性預(yù)測(cè)倒譜系數(shù)(LPCC,LinearPredictive Cepstrum Coefficients)和Mel頻率倒譜系數(shù)(MFCCDTW,Mel-FrequencyCepstrum Coefficients),這兩種特征參數(shù)都是將語(yǔ)音信號(hào)從時(shí)域變換到倒頻域上。LPCC從人的發(fā)聲模型角度出發(fā),利用線性預(yù)測(cè)編碼(LPC,LinearPredictive Coding)技術(shù)求出倒譜系數(shù),而MFCC則是構(gòu)造人的聽覺(jué)模型,把通過(guò)該模型(濾波器組)的語(yǔ)音輸出為聲學(xué)特征,直接通過(guò)離散傅立葉變換(DFT,DiscreteFourier Transform)進(jìn)行變換。本文采用MFCC方法。Mel頻率倒譜系數(shù),即MFCC為:

其中,S(m)為語(yǔ)音信號(hào)通過(guò)預(yù)加重、離散傅里葉變換、通過(guò)MEL濾波器、并通過(guò)對(duì)數(shù)能量處理等得到的對(duì)數(shù)頻譜。

4.3 非特定人孤立詞語(yǔ)音識(shí)別算法

通常,語(yǔ)音識(shí)別的方法可以大致分為三類,即模板匹配法、隨機(jī)模型法、和概率語(yǔ)法分析法。這三類方法都屬于統(tǒng)計(jì)模式識(shí)別方法。其中模板匹配法是將測(cè)試語(yǔ)音與參考模板的參數(shù)逐一進(jìn)行比較和匹配,判決的依據(jù)是失真測(cè)度最小準(zhǔn)測(cè),隨機(jī)模型法是使用隱馬爾可夫模型(HMM,HiddenMarkov Model)來(lái)對(duì)似然函數(shù)進(jìn)行估計(jì)與判決,從而得到相應(yīng)的識(shí)別結(jié)果。而概率語(yǔ)法分析法利用連續(xù)語(yǔ)音中的語(yǔ)法約束知識(shí)來(lái)對(duì)似然函數(shù)進(jìn)行估計(jì)和判決,更適用于大規(guī)模連續(xù)語(yǔ)音識(shí)別。本文用小詞匯量的DTW方法。動(dòng)態(tài)時(shí)間規(guī)整(DTW)是采用動(dòng)態(tài)規(guī)劃(DP,DynamicProgramming)技術(shù),將一個(gè)復(fù)雜的全局最優(yōu)化問(wèn)題轉(zhuǎn)化為許多局部最優(yōu)化問(wèn)題DTW,一步一步地進(jìn)行決策。假設(shè)時(shí)間規(guī)整函數(shù)為:其中,表示時(shí)間規(guī)整函數(shù)中的第個(gè)匹配點(diǎn)對(duì)

這個(gè)匹配點(diǎn)對(duì)是由待測(cè)語(yǔ)音的第個(gè)特征矢量和參考模板第個(gè)特征矢量構(gòu)成的,其中兩者之間的距離(或失真值)稱為局部匹配距離,記做,處于最優(yōu)時(shí)間規(guī)整情況下兩矢量的距離稱為全局匹配距離,記做,表達(dá)式如下所示:

由于DTW不斷地計(jì)算兩矢量的距離以尋找最優(yōu)的匹配路徑,所以得到的兩矢量的匹配距離是累計(jì)距離最小的規(guī)整函數(shù),這就保證了它們之間存在最大的聲學(xué)相似特性。

5 結(jié)束語(yǔ)

在本語(yǔ)音識(shí)別系統(tǒng)中, 設(shè)定采樣率為11025Hz,幀數(shù)為300幀,幀長(zhǎng)為240點(diǎn),則最長(zhǎng)的語(yǔ)音段長(zhǎng)度不會(huì)超過(guò)300*240/11025=6.5秒。采樣樣本為男女各5個(gè)人的數(shù)碼語(yǔ)音資料, 實(shí)驗(yàn)表明, 系統(tǒng)達(dá)到了較好的實(shí)時(shí)性和較高的識(shí)別率。由于Matlab功能強(qiáng)大, 在處理中可直接利用許多現(xiàn)成的函數(shù), 編程方便, 結(jié)果可視化也容易實(shí)現(xiàn)。

參考文獻(xiàn)

[1]楊熙,蘇娟,趙鵬.MATLAB環(huán)境下的語(yǔ)音識(shí)別系統(tǒng)[J].電聲技術(shù),2007,31(2): 51-53.

[2]龍銀東,劉宇紅,敬嵐,等.在MATLAB環(huán)境下實(shí)現(xiàn)的語(yǔ)音識(shí)別[J]

第3篇

關(guān)鍵詞:語(yǔ)音識(shí)別;文本識(shí)別;多線程瀏覽器

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)21-4949-02

語(yǔ)音識(shí)別,也被稱為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition(ASR),是一門跨越多門學(xué)科的技術(shù)。早在計(jì)算機(jī)的發(fā)明之前,語(yǔ)音識(shí)別就被人們所提出,早期的聲碼器可以認(rèn)為是語(yǔ)音識(shí)別及合成的雛形。最早的語(yǔ)音識(shí)別器是產(chǎn)生于20世紀(jì)20年代生產(chǎn)的“Radio Rex”玩具狗,當(dāng)人們呼喚該產(chǎn)品的名字的時(shí)候,它能夠從底座上自動(dòng)彈出來(lái)。而最早的基于計(jì)算機(jī)的語(yǔ)音識(shí)別系統(tǒng)是由AT&T 貝爾實(shí)驗(yàn)室開發(fā)的Audrey語(yǔ)音識(shí)別系統(tǒng),該系統(tǒng)的正確率達(dá)到98%。

1 C#語(yǔ)言的語(yǔ)音識(shí)別及合成的接口

C#是一種安全的、穩(wěn)定的、簡(jiǎn)單的、優(yōu)雅的,由C和C++衍生出來(lái)的面向?qū)ο蟮木幊陶Z(yǔ)言。C#實(shí)現(xiàn)語(yǔ)音識(shí)別功能的主要接口有:IsRecoContext接口、IspRecognizer接口、IsRecoGrammar接口、IspVoice接口。

1)IsRecoContext接口:是主要的用于語(yǔ)音識(shí)別的接口,能關(guān)注不同的語(yǔ)音識(shí)別事件,安裝或者卸載識(shí)別時(shí)使用的語(yǔ)法文件。

2)IspRecognizer接口:一個(gè)程序擁有兩種不同的語(yǔ)音識(shí)別引擎(ISpRecognizer)類型。一個(gè)是共享的語(yǔ)音識(shí)別引擎,需要建立一個(gè)采用共享語(yǔ)音識(shí)別引擎的識(shí)別環(huán)境(IspRecoContext),應(yīng)用程序需要調(diào)用COM接口位于CoCreateInstance結(jié)構(gòu)上的CLSID_SpSharedRecoContext。然后SAPI會(huì)設(shè)立一個(gè)音頻輸入流,并把這個(gè)音頻輸入流定義為默認(rèn)的SAPI音頻輸入流。由于它可以與其他語(yǔ)音識(shí)別應(yīng)用程序共享其程序資源,所以在大多數(shù)場(chǎng)合中被推薦使用。另一個(gè)是非共享的語(yǔ)音識(shí)別引擎的語(yǔ)音識(shí)別環(huán)境,應(yīng)用程序首先需要調(diào)用COM接口位于CoCreateInstance結(jié)構(gòu)上的CLSID_SpInprocRecoIns-

tance。然后,應(yīng)用程序必須調(diào)用IspRecognizer的SetInput方法來(lái)設(shè)立一個(gè)音頻輸入流。最后,應(yīng)用程序通過(guò)調(diào)用IspRecognizer的CreateRecoContext方法來(lái)建立它自己的識(shí)別環(huán)境。

C#語(yǔ)言的語(yǔ)音合成的主要接口有:Voice Commands 接口,Voice Dictation接口,Voice Text,Voice Telephone接口,Audio Objects接口。

1)Voice Commands API。對(duì)應(yīng)用程序進(jìn)行控制,一般用于語(yǔ)音識(shí)別系統(tǒng)中。識(shí)別某個(gè)命令后,會(huì)調(diào)用相關(guān)接口是應(yīng)用程序完成對(duì)應(yīng)的功能。如果程序想實(shí)現(xiàn)語(yǔ)音控制,必須使用此組對(duì)象。

2)Voice Dictation API。聽寫輸入,即語(yǔ)音識(shí)別接口。

3)Voice Text API。完成從文字到語(yǔ)音的轉(zhuǎn)換,即語(yǔ)音合成。

4)Voice Telephone API。語(yǔ)音識(shí)別和語(yǔ)音合成綜合運(yùn)用到電話系統(tǒng)之上,利用此接口可以建立一個(gè)電話應(yīng)答系統(tǒng),甚至可以通過(guò)電話控制計(jì)算機(jī)。

5)Audio Objects API。封裝了計(jì)算機(jī)發(fā)音系統(tǒng)。

其中Voice Text API,就是微軟TTS引擎的接口,通過(guò)它我們可以很容易地建立功能強(qiáng)大的文本語(yǔ)音程序。

2 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

2.1 系統(tǒng)功能概述

根據(jù)對(duì)系統(tǒng)需求進(jìn)行分析,本系統(tǒng)需要完成操作、工具、用戶管理、皮膚管理和幫助功能。這些功能將分成五個(gè)功能模塊。操作功能:朗讀、命令識(shí)別、文本識(shí)別、生成語(yǔ)音文件、添加操作命令、網(wǎng)頁(yè)瀏覽;工具功能:訓(xùn)練、開機(jī)自動(dòng)運(yùn)行、取消開機(jī)自動(dòng)運(yùn)行;用戶管理:添加用戶、刪除用戶、修改用戶;皮膚管理功能:皮膚的修改功能;幫助功能:幫助文檔、關(guān)于作者

2.2 語(yǔ)音識(shí)別功能的實(shí)現(xiàn)

語(yǔ)音識(shí)別的原理就是將人發(fā)出的語(yǔ)音通過(guò)麥克風(fēng)傳到電腦的聲卡,然后語(yǔ)音引擎對(duì)對(duì)語(yǔ)音信息進(jìn)行采取,最后和語(yǔ)音庫(kù)里面的信息匹配從而識(shí)別出相應(yīng)的語(yǔ)音信息輸出到電腦屏幕進(jìn)行各種各樣的操作。

語(yǔ)音識(shí)別的一個(gè)最大的難點(diǎn)就在于不能正確地對(duì)語(yǔ)音信息進(jìn)行正確的識(shí)別,這里在系統(tǒng)開發(fā)的時(shí)候需要做兩個(gè)處理工作。

第一是對(duì)語(yǔ)音庫(kù)進(jìn)行大量的語(yǔ)音訓(xùn)練,可以通過(guò)windows內(nèi)置的語(yǔ)音識(shí)別訓(xùn)練系統(tǒng)進(jìn)行訓(xùn)練,該功能集成與微軟的XP系統(tǒng)的控制面板的語(yǔ)音選項(xiàng)里面。鑒于每個(gè)人的發(fā)音都是有所差異的,使用人必須先對(duì)語(yǔ)音引擎進(jìn)行大量持久的語(yǔ)音訓(xùn)練,這樣才能不斷地提高語(yǔ)音識(shí)別的正確率,以方便計(jì)算機(jī)正確地識(shí)別出來(lái)需要操作的動(dòng)作和需要對(duì)電腦輸入的文字。在進(jìn)行對(duì)語(yǔ)音庫(kù)訓(xùn)練的前提是要安裝微軟提供的語(yǔ)音引擎Speech SDK 5.1,在安裝了該引擎之后方能對(duì)語(yǔ)音進(jìn)行訓(xùn)練,可以支持中英日三種語(yǔ)言的使用。

第二是對(duì)語(yǔ)音識(shí)別的結(jié)果進(jìn)行模糊處理,也就是說(shuō),在不可能實(shí)現(xiàn)100%的識(shí)別率的情況下,要盡可能地考慮到語(yǔ)音識(shí)別出來(lái)的錯(cuò)誤信息,比如本來(lái)要識(shí)別的信息是:open,但是電腦識(shí)別出來(lái)的是opened,這時(shí)候就要“將錯(cuò)就錯(cuò)”,通過(guò)數(shù)據(jù)庫(kù)將識(shí)別出來(lái)的opened告訴電腦這是一個(gè)open。如此進(jìn)行常用字的多次測(cè)試,并通過(guò)微軟的sql server2000進(jìn)行海量的數(shù)據(jù)識(shí)別模糊處理,最大化地考慮到所出現(xiàn)的錯(cuò)誤來(lái)更正。

2.3文本識(shí)別功能的實(shí)現(xiàn)

文本識(shí)別功能的實(shí)現(xiàn)是要借助于微軟的TTS(Test To Speech)引擎進(jìn)行來(lái)實(shí)現(xiàn)。TTS是“文本到語(yǔ)音(Text To Sound)”的簡(jiǎn)稱,TTS語(yǔ)音引擎為我們提供清晰和標(biāo)準(zhǔn)的發(fā)音,所用的關(guān)鍵技術(shù)就是語(yǔ)音合成(SpeechSynthesis)。

該文本識(shí)別引擎可以支持中英日三種語(yǔ)言。要使用該功能是只需要進(jìn)入文本識(shí)別界面并啟動(dòng)文本識(shí)別按鈕,然后將要識(shí)別的文字通過(guò)鍵盤輸入到編輯框里面,再單擊朗讀按鈕,這就可以將文本信息轉(zhuǎn)化為語(yǔ)音信息通過(guò)音響發(fā)出。

2.4多標(biāo)簽的語(yǔ)音識(shí)別瀏覽器功能的實(shí)現(xiàn)

首先是多標(biāo)簽瀏覽器功能的實(shí)現(xiàn)。由于C#有自帶的WebBrowser瀏覽器控件,使用其自帶的方法。而對(duì)于多標(biāo)簽功能的實(shí)現(xiàn)則要使用C#的多線程的技術(shù),也就是說(shuō)支持多個(gè)線程同時(shí)不互相干擾的工作。

其次是具有語(yǔ)音識(shí)別功能瀏覽器的實(shí)現(xiàn)。這個(gè)過(guò)程可以參照之前所制作的語(yǔ)音識(shí)別制作的過(guò)程,只需要的瀏覽器里面添加一個(gè)開啟語(yǔ)音識(shí)別和關(guān)閉語(yǔ)音識(shí)別功能的按鈕即可。當(dāng)單擊開啟語(yǔ)音識(shí)別功能時(shí),系統(tǒng)將會(huì)提示已經(jīng)開啟語(yǔ)音識(shí)別功能,這個(gè)時(shí)候就可以使用語(yǔ)音識(shí)別功能進(jìn)行網(wǎng)上沖浪;當(dāng)單擊關(guān)閉語(yǔ)音識(shí)別功能是,系統(tǒng)將會(huì)提示已經(jīng)關(guān)閉語(yǔ)音識(shí)別功能,這個(gè)時(shí)候系統(tǒng)會(huì)系統(tǒng)語(yǔ)音識(shí)別功能已經(jīng)關(guān)閉,此時(shí)的瀏覽器就和傳統(tǒng)的多標(biāo)簽瀏覽器如360安全瀏覽器一樣。

3 結(jié)論

本系統(tǒng)主要研究了用語(yǔ)音控制電腦的技術(shù),成功地利用微軟新一代開發(fā)平臺(tái).NET Framework開發(fā)了語(yǔ)音識(shí)別系統(tǒng)的新產(chǎn)品。本系統(tǒng)打破了傳統(tǒng)的人機(jī)交互方式,實(shí)現(xiàn)的使用語(yǔ)音對(duì)計(jì)算機(jī)進(jìn)行操作。使用微軟的TTS語(yǔ)音引擎可以使系統(tǒng)具備識(shí)別中英日三種語(yǔ)言,并且添加了國(guó)內(nèi)的捷通語(yǔ)音公司的語(yǔ)音引擎,可以識(shí)別粵語(yǔ),閩南語(yǔ)等方言,對(duì)于文本識(shí)別的功能的實(shí)現(xiàn),提高了語(yǔ)言學(xué)習(xí)者的學(xué)習(xí)效率,這給廣大的語(yǔ)言學(xué)習(xí)者帶來(lái)了福音。設(shè)計(jì)實(shí)現(xiàn)具有語(yǔ)音識(shí)別功能的多標(biāo)簽瀏覽器技術(shù)。主要是方便一些不會(huì)使用鍵盤打字的人群,使得這類人群可以通過(guò)語(yǔ)音控制就可以上網(wǎng)沖浪。

參考文獻(xiàn):

[1] ZHANG Jinsong, Takatoshi Jitsuhir.An Introduction to the Chinese Speech Recognition Front—End of the NICT/ATR Multi-·Lingual Speech Translation System [J].O'Reilly. 2008.

[2] Arun Krishnaraj, Joseph K. T. Lee. Voice Recognition Software: Effect on Radiology Report Turnaround Time at an Academic Medical Center [J]. 2010.

[3] wu Zhiyong. CAO Guangqi. Voice Recognition Software: Effect on Radiology Report Turnaround Time at an Academic Medical Center [J]. 2008.

[4] Jing Li. Thomas Fang Zhen91. A Dialectal Chinese Speech Recognition Framework [J]. 2006.

[5] 國(guó)玉晶,劉剛,劉健,郭軍.基于環(huán)境特征的語(yǔ)音識(shí)別置信度研究[J].清華大學(xué)學(xué)報(bào),2009,49(S1).

[6] 林琳,王樹勛,郭綱. 短語(yǔ)音說(shuō)話人識(shí)別新方法的研究[J].系統(tǒng)仿真學(xué)報(bào),2007(10).

[7] 姚琳,梁春霞,張德干.基于實(shí)例推理的人機(jī)對(duì)話系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2007(03)

[8] 林茜,歐建林,蔡駿.基于Microsoft Speech SDK的語(yǔ)音關(guān)鍵詞檢出系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J].心智與計(jì)算,2007,12-30:433.

[9] 韓紀(jì)慶,張磊,鄭鐵然.網(wǎng)絡(luò)環(huán)境下的語(yǔ)音識(shí)別方法[J]. 計(jì)算機(jī)科學(xué),2005(01).

第4篇

 

1 項(xiàng)目建設(shè)目標(biāo)

 

1.1 項(xiàng)目背景

 

目前,固網(wǎng)用戶撥打電話,必須先查出被叫的號(hào)碼,并按鍵進(jìn)行撥叫。而隨著通信業(yè)的發(fā)展,要記的電話號(hào)碼越來(lái)越多,而目前大部分的固定電話都沒(méi)有號(hào)碼存儲(chǔ)的功能,所以很多時(shí)候使用固話打電話時(shí),要么從手機(jī)上查找被叫的電話,或者是從紙制電話簿去查找,既不方便,又浪費(fèi)時(shí)間。

 

“語(yǔ)音電話本”完全可以幫助用戶解決以上問(wèn)題,用戶只需撥打一個(gè)號(hào)碼接入系統(tǒng)平臺(tái),說(shuō)出聯(lián)系人的姓名,系統(tǒng)就可以自動(dòng)將話路轉(zhuǎn)到該人的電話上。整個(gè)過(guò)程通過(guò)自然的語(yǔ)音方式交互,即感到親切自然方便快捷,又節(jié)省時(shí)間,提高工作效率。

 

從服務(wù)管理的角度來(lái)看,隨著信息通信客服業(yè)務(wù)受理的不斷發(fā)展,座席客服話務(wù)量越來(lái)越多,用戶對(duì)服務(wù)的質(zhì)量要求也越來(lái)越高,傳統(tǒng)客服系統(tǒng)在傳統(tǒng)語(yǔ)音信息處理上的局限性制約了系統(tǒng)服務(wù)和管理能力的提升。

 

服務(wù)方面,由于業(yè)務(wù)的多樣性和復(fù)雜性帶來(lái)的海量數(shù)據(jù)信息不能得到快速、有效的關(guān)聯(lián)處理而產(chǎn)生的問(wèn)題,影響了客戶服務(wù)體驗(yàn)。

 

運(yùn)營(yíng)管理方面,雇傭人工座席每天接聽大量的信息查詢電話,座席業(yè)務(wù)人員的更替帶來(lái)的培訓(xùn),消耗了部分運(yùn)維成本,影響了服務(wù)質(zhì)量。

 

1.2 建設(shè)目標(biāo)

 

本項(xiàng)目通過(guò)研究智能語(yǔ)音技術(shù)在國(guó)網(wǎng)遼寧公司信息通信客服系統(tǒng)中的應(yīng)用,將語(yǔ)音識(shí)別及客服查號(hào)業(yè)務(wù)相結(jié)合,使用先進(jìn)的語(yǔ)音識(shí)別技術(shù)來(lái)代替繁重的人工勞動(dòng),提高省公司內(nèi)部溝通的效率。目前,語(yǔ)音電話本技術(shù)實(shí)現(xiàn)主要包含:ASR 、TTS 、IVR 三項(xiàng)技術(shù),其中TTS和IVR技術(shù)對(duì)于語(yǔ)音電話本業(yè)務(wù)來(lái)說(shuō)已經(jīng)非常成熟。

 

ASR語(yǔ)音識(shí)別技術(shù)近年來(lái)發(fā)展十分迅速,其應(yīng)用也逐步得到推廣,佳都新太也一直開發(fā)、調(diào)試、應(yīng)用這項(xiàng)重要的語(yǔ)音技術(shù),自2001年以來(lái)佳都新太先后在廣西、天津、廣東、河北、湖北、江蘇、遼寧等省的多個(gè)項(xiàng)目中使用了ASR 自動(dòng)語(yǔ)音識(shí)別系統(tǒng),佳都新太通過(guò)對(duì)ASR測(cè)試、改進(jìn),自動(dòng)語(yǔ)音識(shí)別率達(dá)到95%以上。

 

語(yǔ)音電話本業(yè)務(wù)可以說(shuō)是CTI平臺(tái)上的典型應(yīng)用,佳都新太把ASR語(yǔ)音自動(dòng)識(shí)別技術(shù)、TTS語(yǔ)音合成技術(shù)與CTI 的IVR技術(shù)三者融合為一體,為語(yǔ)音電話本業(yè)務(wù)的技術(shù)實(shí)現(xiàn)提供了可靠的保障。

 

本項(xiàng)目可以達(dá)到目標(biāo):

 

1.2.1 對(duì)語(yǔ)音信息的自動(dòng)化處理

 

通過(guò)建立具備智能語(yǔ)音分析能力的語(yǔ)音識(shí)別平臺(tái),實(shí)現(xiàn)對(duì)用戶查號(hào)業(yè)務(wù)的語(yǔ)音實(shí)時(shí)識(shí)別及關(guān)聯(lián)處理,同時(shí)實(shí)現(xiàn)對(duì)語(yǔ)音文件的統(tǒng)一分析,提供支撐客服業(yè)務(wù)受理的有效工具。

 

1.2.2 文件分析處理

 

通過(guò)語(yǔ)音分析引擎對(duì)送入的語(yǔ)音進(jìn)行文字轉(zhuǎn)寫、維度結(jié)合后生成索引文件,這些結(jié)構(gòu)化的索引文件中包含了語(yǔ)音中的所有信息。索引文件存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中,通過(guò)對(duì)有效的海量錄音文件、音頻文件進(jìn)行分析處理。

 

1.2.3 實(shí)現(xiàn)自助查號(hào)功能

 

通過(guò)實(shí)現(xiàn)語(yǔ)音中的知識(shí)挖掘和語(yǔ)音文件的快速檢索,實(shí)現(xiàn)自動(dòng)語(yǔ)音查號(hào)功能。

 

2 項(xiàng)目技術(shù)方案

 

2.1 項(xiàng)目設(shè)計(jì)原則

 

本次項(xiàng)目是對(duì)省公司固定電話語(yǔ)音自動(dòng)查號(hào)系統(tǒng)的功能完善,使用先進(jìn)的語(yǔ)音識(shí)別技術(shù)來(lái)代替繁重的人工勞動(dòng),提高省公司內(nèi)部溝通的效率。

 

本次項(xiàng)目的關(guān)鍵點(diǎn)和技術(shù)難點(diǎn)在于語(yǔ)音識(shí)別,因此在方案設(shè)計(jì)過(guò)程中我們著重考慮了這個(gè)問(wèn)題,選用了國(guó)內(nèi)領(lǐng)先的智能語(yǔ)音技術(shù)來(lái)作為語(yǔ)音識(shí)別引擎,結(jié)合座席客服系統(tǒng)的需求提供定制化專業(yè)服務(wù)。

 

2.2 整體架構(gòu)設(shè)計(jì)

 

如圖1,用戶通過(guò)撥打查號(hào)服務(wù)電話,系統(tǒng)為用戶播放自動(dòng)語(yǔ)音并引導(dǎo)用戶按鍵選擇功能和需要查號(hào)的人名,系統(tǒng)根據(jù)語(yǔ)音分析出內(nèi)容,并在數(shù)據(jù)庫(kù)中查詢對(duì)應(yīng)的號(hào)碼,系統(tǒng)將查到的號(hào)碼以自動(dòng)語(yǔ)音方式播報(bào)給用戶。

 

系統(tǒng)部署需新增接入網(wǎng)關(guān)1臺(tái),用于與電力內(nèi)部電話程控交換機(jī)對(duì)接,實(shí)現(xiàn)平臺(tái)電話呼入呼出。采用電信級(jí)語(yǔ)音接入網(wǎng)關(guān)Dialogic DMG2030,接入規(guī)模1E1(即30路通話),PRI信令,通過(guò)電路中繼上聯(lián)到遼寧電力內(nèi)部程控交換機(jī)。遼寧電力內(nèi)部程控交換系統(tǒng)為語(yǔ)音電話本系統(tǒng)分配一個(gè)內(nèi)部接入服務(wù)號(hào)碼和一個(gè)外部接入服務(wù)號(hào)碼。同時(shí)網(wǎng)關(guān)接入虛擬資源池虛機(jī)網(wǎng)絡(luò)。

 

新增虛擬資源池虛機(jī)1臺(tái),用于部署媒體處理軟件、CTI平臺(tái)、語(yǔ)音電話本業(yè)務(wù)應(yīng)用軟件、科大訊飛ASR軟件和TTS軟件、Oracle數(shù)據(jù)庫(kù)。

 

新增核心網(wǎng)絡(luò)交換機(jī)1臺(tái),用于系統(tǒng)組網(wǎng)。

 

2.3 系統(tǒng)邏輯結(jié)構(gòu)

 

IVR與TTS、ASR通過(guò)語(yǔ)音引擎實(shí)現(xiàn)整個(gè)語(yǔ)音交互過(guò)程的自動(dòng)識(shí)別、自動(dòng)播放功能。系統(tǒng)采用B/S結(jié)構(gòu),方便用戶對(duì)電話本的修改,也便于各營(yíng)業(yè)網(wǎng)點(diǎn)的開戶、受理以及對(duì)用戶的電話本進(jìn)行維護(hù)等。整個(gè)系統(tǒng)采用模塊化結(jié)構(gòu),具有很高的可靠性和可擴(kuò)充性。

 

邏輯結(jié)構(gòu)見圖2。

 

2.4 系統(tǒng)建設(shè)方案

 

新建“語(yǔ)音電話本”業(yè)務(wù)平臺(tái),其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖3所示。

 

設(shè)備組成說(shuō)明:

 

系統(tǒng)平臺(tái)需要以下設(shè)備:

 

(1)IPS數(shù)字排隊(duì)機(jī);

 

(2)信令網(wǎng)關(guān)節(jié)點(diǎn);

 

(3)數(shù)據(jù)庫(kù)服務(wù)器: 實(shí)現(xiàn)用戶數(shù)據(jù)的存儲(chǔ)和系統(tǒng)認(rèn)證等功能;

 

(4)TTS服務(wù)器: 通過(guò)IPS平臺(tái)的MS模塊來(lái)實(shí)現(xiàn)資源調(diào)用;

 

(5)ASR服務(wù)器:通過(guò)IPS平臺(tái)的MS模塊來(lái)實(shí)現(xiàn)資源調(diào)用;

 

(6)WEB服務(wù)器:實(shí)現(xiàn)用戶通過(guò)互聯(lián)網(wǎng)對(duì)電話簿的維護(hù)管理功能;

 

(7)業(yè)務(wù)處理服務(wù)器:用于處理個(gè)人語(yǔ)音電話本業(yè)務(wù)流程;

 

(8)管理維護(hù)節(jié)點(diǎn);

 

(9)路由器和防火墻等網(wǎng)絡(luò)設(shè)備;

 

2.5 配置計(jì)算依據(jù)

 

2.5.1 中繼和語(yǔ)音的配置比例

 

語(yǔ)音電話本業(yè)務(wù),用戶報(bào)出要找的人的姓名后,ASR進(jìn)行識(shí)別,系統(tǒng)根據(jù)ASR識(shí)別出的名字,找出對(duì)應(yīng)的電話號(hào)碼并進(jìn)行外呼,被叫接通后,主被叫進(jìn)行通話的過(guò)程中,語(yǔ)音資源即可釋放。整個(gè)業(yè)務(wù)實(shí)現(xiàn)和呼叫卡類業(yè)務(wù)的資源配置非常相似,根據(jù)200業(yè)務(wù)的實(shí)際運(yùn)行經(jīng)驗(yàn)數(shù)據(jù),建議中繼和語(yǔ)音的比例為4:1。

 

2.5.2 中繼和ASR的配置比例

 

在一個(gè)呼叫的過(guò)程中,用戶說(shuō)出要找人的姓名,ASR資源進(jìn)行識(shí)別,在識(shí)別完成系統(tǒng)呼通被叫后,ASR資源釋放,主被叫雙方進(jìn)行通話,按平均呼叫時(shí)長(zhǎng)為150秒,其中ASR識(shí)別的時(shí)間大概為30秒,而在一次通話中占用一入一出兩個(gè)通道,按上面的估算數(shù)據(jù),中繼和ASR的配比大約為 2×150/30=10:1。

 

2.5.3 中繼容量和所能支持的用戶數(shù)的比例

 

假設(shè)一些呼叫參數(shù)如下:

 

系統(tǒng)中繼容量A

 

用戶數(shù) B

 

每用戶每天使用次數(shù)C:8次

 

每次呼叫時(shí)長(zhǎng)D:150秒

 

忙時(shí)集中系統(tǒng)E:10%

 

忙時(shí)中繼Erl數(shù)F:0.8

 

根據(jù)公式:A=B*C*D*E/F/3600

 

則 A:B=8×150×10%/0.8/3600=1:24

 

因?yàn)檎Z(yǔ)音電話本業(yè)務(wù)每次呼叫要占用一入一出兩個(gè)端口,所以中繼容量和所支持的用戶數(shù)的比例約為1:10。

 

2.5.4 數(shù)據(jù)庫(kù)處理能力計(jì)算

 

忙時(shí)TPMC=(忙時(shí)呼叫次數(shù)×(平均每次呼叫數(shù)據(jù)庫(kù)訪問(wèn)次數(shù)+其他應(yīng)用模塊平均每次呼叫事務(wù)訪問(wèn)處理次數(shù)))/60

 

按4.3.3假設(shè)的數(shù)據(jù),當(dāng)使用語(yǔ)音電話本的用戶數(shù)為10,000用戶時(shí),系統(tǒng)的忙時(shí)呼叫次數(shù)為 10000×8×10%=8000次/小時(shí)

 

按每次呼叫對(duì)數(shù)據(jù)庫(kù)的訪問(wèn)操作次數(shù)為10次來(lái)計(jì)算,則10,000用戶時(shí),對(duì)數(shù)據(jù)庫(kù)的TPMC值的要求為:

 

TPMC=8000×10/60=1333

 

2.6 業(yè)務(wù)系統(tǒng)功能

 

2.6.1 業(yè)務(wù)流程(如圖4)

 

2.6.2 聲控?fù)芴?hào)

 

用戶使用綁定電話撥打接入號(hào)碼“***”進(jìn)入系統(tǒng)后,系統(tǒng)直接會(huì)提示用戶報(bào)出用戶想找的人的姓名,并進(jìn)行呼叫。

 

(1)“聯(lián)系人名字” 選中默認(rèn)呼叫號(hào)碼:

 

(2)用戶撥打“語(yǔ)音電話本”服務(wù)號(hào)碼;

 

(3)說(shuō)出對(duì)方姓名,如:張三;

 

(4)系統(tǒng)識(shí)別語(yǔ)音,查詢對(duì)應(yīng)的默認(rèn)電話號(hào)碼;

 

(5)系統(tǒng)通過(guò)語(yǔ)音播報(bào)查詢到的電話號(hào)碼。

 

(6)“聯(lián)系人名字+電話類型” 精確查詢:

 

(7)用戶撥打“語(yǔ)音電話本”服務(wù)號(hào)碼;

 

(8)說(shuō)出對(duì)方姓名+電話類型,如:張三 手機(jī);

 

(9)系統(tǒng)識(shí)別語(yǔ)音,查詢對(duì)應(yīng)的電話類型的號(hào)碼;

 

系統(tǒng)通過(guò)語(yǔ)音播報(bào)查詢到的電話號(hào)碼。用戶通過(guò)綁定電話使用語(yǔ)音電話本業(yè)務(wù)流程如圖5所示。

 

用戶使用非綁定電話使用語(yǔ)音電話本業(yè)務(wù)時(shí),必須先通過(guò)輸入帳號(hào)和密碼,經(jīng)過(guò)系統(tǒng)鑒權(quán)后才能使用。

 

2.6.3 原始通訊錄的錄入

 

語(yǔ)音電話業(yè)務(wù)開展的一個(gè)關(guān)鍵問(wèn)題,就是用戶申請(qǐng)?jiān)摌I(yè)務(wù)后首批通訊錄的錄入問(wèn)題,首批通訊錄相對(duì)來(lái)說(shuō)量比較大,錄入的方式建議采用營(yíng)業(yè)廳前臺(tái)填表錄入、通過(guò)WEB錄入的方式,也可以采用電話、傳真、信函的方式進(jìn)行錄入。在首批通訊錄錄入后,用戶在使用過(guò)程中做一些號(hào)碼本的修改和維護(hù),維護(hù)量都比較小,可以通過(guò)WEB方式、電話、短消息、傳真等多種方式進(jìn)行修改。

 

批量導(dǎo)入電話本:

 

通過(guò)Excel文件導(dǎo)入企業(yè)通訊錄,可以參考如表1格式。

 

可以根據(jù)實(shí)際需求增加其他列。

 

2.6.4 電話本維護(hù)(Web)

 

系統(tǒng)提供后臺(tái)管理界面,管理員登錄后臺(tái)對(duì)電話本進(jìn)行管理,如圖6。

 

個(gè)人電話本資料可通過(guò)Web、人工坐席、電話、傳真、短消息等多種方式進(jìn)行電話本資料的維護(hù)管理,包括修改用戶密碼等。

 

業(yè)務(wù)流程如圖7所示。

 

“增加、刪除、修改”用戶記錄:

 

系統(tǒng)提供對(duì)單個(gè)記錄的“增加”、“刪除”、“修改”功能,方便對(duì)電話本進(jìn)行靈活管理。

 

2.6.5 多個(gè)號(hào)碼優(yōu)先呼功能

 

當(dāng)用戶錄入的某個(gè)聯(lián)系人有多個(gè)通訊號(hào)碼時(shí),如有手機(jī)、小靈通、固定電話,可以把這些號(hào)碼都錄入在系統(tǒng)中,在呼叫時(shí),用戶可以自行設(shè)置優(yōu)先呼叫的號(hào)碼,在號(hào)碼不通時(shí)再按設(shè)置的優(yōu)先策略逐一呼叫被叫其他的聯(lián)系方式。

 

2.6.6 信息查詢(Web)

 

系統(tǒng)提供電話本查詢界面給座席和管理員使用。

 

座席和管理員可根據(jù)聯(lián)系人姓名,查詢聯(lián)系人對(duì)應(yīng)的所有電話信息。

 

該功能主要在座席提供人工服務(wù)時(shí)使用。

 

3 技術(shù)創(chuàng)新點(diǎn)

 

本次項(xiàng)目采用國(guó)內(nèi)領(lǐng)先的智能語(yǔ)音識(shí)別技術(shù)(ASR)結(jié)合客服后臺(tái)定制化查詢需求,在滿足用戶傳統(tǒng)的查詢基礎(chǔ)上,語(yǔ)音定制化為用戶報(bào)出相關(guān)信息,由用戶按鍵選擇即可,大大方便了用戶的操作和客服的工作時(shí)間。

 

4 總體性能指標(biāo)

 

通過(guò)研究智能語(yǔ)音技術(shù)在信息通信客服系統(tǒng)中的應(yīng)用,實(shí)現(xiàn)客服查號(hào)業(yè)務(wù)的自能化,實(shí)現(xiàn)語(yǔ)音的自動(dòng)識(shí)別及數(shù)據(jù)分析,減少人工運(yùn)維成本,提高客服服務(wù)質(zhì)量及服務(wù)效率。

 

5 技術(shù)展望

 

隨著科學(xué)技術(shù)的飛速發(fā)展。信息技術(shù)領(lǐng)域未來(lái)必然是智能化,自動(dòng)化的主流方向。在語(yǔ)音識(shí)別領(lǐng)域?qū)⒋笥锌蔀?,傳統(tǒng)的人工繁瑣的操作將被解放。系統(tǒng)語(yǔ)音智能識(shí)別,自動(dòng)處理將是主流趨勢(shì)。該項(xiàng)目正是在這樣主流的發(fā)展趨勢(shì)下不斷完善提升,用專業(yè)的技術(shù)實(shí)現(xiàn)客戶的需求,達(dá)到節(jié)省人力物力目的。

第5篇

論文關(guān)鍵詞:CIS;高職學(xué)生;自我識(shí)別;探索

CIS,全稱“Corporate Identity System”,即“企業(yè)識(shí)別系統(tǒng)”,分為理念識(shí)別MI(Mind Identity)、行為識(shí)別BI(Behavior Identity)和視覺(jué)識(shí)別VI(Visual Identity)。MI是核心和原動(dòng)力,BI是動(dòng)態(tài)識(shí)別形式,VI是靜態(tài)識(shí)別系統(tǒng)。CIS源起于西方,由IBM公司首次導(dǎo)入企業(yè)并加以全面推廣。20世紀(jì)70年代,日本開始引進(jìn)CIS并大量融入東方文化內(nèi)涵,使其得到深化和豐富。20世紀(jì)80年代末,太陽(yáng)神、健力寶等企業(yè)CIS系統(tǒng)的成功建立和推廣引發(fā)了中國(guó)企業(yè)界導(dǎo)入CIS的熱潮。

經(jīng)濟(jì)領(lǐng)域中任何事物的出現(xiàn),都有其客觀必然性,CIS的產(chǎn)生及運(yùn)用是由其自身的文化性(Culture)、活動(dòng)性(Activity)和可識(shí)別性(Distinction),即其CAD特征所決定的。通過(guò)CIS的運(yùn)作,可以強(qiáng)化企業(yè)文化建設(shè)、提升企業(yè)凝聚力、擴(kuò)大企業(yè)知名度,獲取消費(fèi)者的認(rèn)同。

培養(yǎng)目標(biāo)為高素質(zhì)技能型人才的高等職業(yè)教育與企業(yè)的發(fā)展息息相關(guān)。1996年9月,《職業(yè)教育法》確立了高等職業(yè)教育在中國(guó)的合法地位;2005年國(guó)務(wù)院頒布了《關(guān)于大力發(fā)展職業(yè)教育的決定》,提出“到2010年高等職業(yè)教育招生規(guī)模占高等教育招生規(guī)模的一半以上”,進(jìn)一步推進(jìn)了我國(guó)高等職業(yè)院校在數(shù)量和招生規(guī)模上的突飛猛進(jìn)。

作為未來(lái)的企業(yè)職工,高職大學(xué)生的素質(zhì)直接影響著企業(yè)的發(fā)展,目前很多企業(yè)反映新進(jìn)員工普遍存在著缺乏實(shí)際工作能力、難以融入團(tuán)隊(duì)、工作熱情不能持久等問(wèn)題,究其原因主要有三點(diǎn):一是從“學(xué)生”到“職工”的身份轉(zhuǎn)變未做好;二是從“學(xué)?!钡健捌髽I(yè)”的環(huán)境轉(zhuǎn)變未做好;三是從“學(xué)習(xí)”到“社會(huì)”的責(zé)任轉(zhuǎn)變未做好。究其深層次原因,很關(guān)鍵的一點(diǎn)來(lái)自于高職學(xué)生自我識(shí)別的普遍弱化上。

PIS,“Personal Identity System”,是CIS主要理念在個(gè)體上的運(yùn)用和體現(xiàn),通過(guò)價(jià)值觀建設(shè)、知識(shí)性構(gòu)建、自我意識(shí)能力、自覺(jué)行為導(dǎo)向等方面的努力,塑造個(gè)體的特定形象,以期得到社會(huì)的廣泛了解、認(rèn)同和接納。強(qiáng)化高職學(xué)生的自我識(shí)別,塑造高職學(xué)生的全新形象,才能提升高職信息的傳遞能力和形象訴求,從而大幅提升高職學(xué)生的就業(yè)率和就業(yè)質(zhì)量。據(jù)此,四川電力職業(yè)技術(shù)學(xué)院在以下領(lǐng)域做了一些積極的探索。

一、在理念上強(qiáng)化高職學(xué)生的自我識(shí)別

1.在學(xué)生思想政治教育中融入企業(yè)元素

學(xué)院堅(jiān)持“以人為本,德育為先”,將學(xué)生的思想政治教育與職業(yè)教育緊密結(jié)合,在人才培養(yǎng)過(guò)程中始終以“責(zé)任”、“誠(chéng)信”、“創(chuàng)新”、“感恩”等為主題。在全校學(xué)生中評(píng)選“十佳愛崗敬業(yè)明星”、“自強(qiáng)之星”、“感恩之星”,樹立意志堅(jiān)定、積極向上、心態(tài)陽(yáng)光的健康形象;組織學(xué)生參加國(guó)網(wǎng)系統(tǒng)的“青春光明行”志愿服務(wù),先后參與“電力天路”圖書館捐書、“電力三下鄉(xiāng)”等活動(dòng);組織學(xué)生學(xué)習(xí)愛崗敬業(yè)模范呂清森、職業(yè)道德標(biāo)兵江小金等先進(jìn)人物及行業(yè)中涌現(xiàn)出的“抗冰保電”、“抗震救災(zāi)”等先進(jìn)事跡,讓學(xué)生在感動(dòng)之余深刻領(lǐng)悟優(yōu)秀的電力企業(yè)文化和企業(yè)精神。

2.企業(yè)優(yōu)秀員工到校兼職教育

為了讓學(xué)生對(duì)企業(yè)文化和企業(yè)精神有更直接的感悟,學(xué)院聘請(qǐng)電力企業(yè)優(yōu)秀員工到校參與學(xué)生的教育。這些來(lái)自一線工作崗位的優(yōu)秀職工,不僅將豐富的實(shí)踐經(jīng)驗(yàn)和行業(yè)發(fā)展的最新成果帶進(jìn)課堂,提升了學(xué)生的專業(yè)技能;同時(shí)也以自身吃苦耐勞、愛崗敬業(yè)、誠(chéng)實(shí)守信等優(yōu)秀品質(zhì)潛移默化的影響學(xué)生,讓學(xué)生形成企業(yè)所需的優(yōu)秀職業(yè)道德。

二、在行為上強(qiáng)化高職學(xué)生的自我識(shí)別

1.教學(xué)班引進(jìn)企業(yè)班組建制

高職教學(xué)班身著統(tǒng)一的工作裝,借鑒企業(yè)的班組建制,采取學(xué)生自愿、教師指導(dǎo)的方式將全班分成若干個(gè)班組,各班組民主選舉班組長(zhǎng)、制定班組制度和共同愿景;班組將學(xué)院、班級(jí)事務(wù)下放、劃撥到每個(gè)班組成員,成員間既有共同目標(biāo),又有各自不同的任務(wù)。利用看板定時(shí)呈現(xiàn)各班組的學(xué)習(xí)和生活情況,為每位成員建立個(gè)人成長(zhǎng)記錄,根據(jù)目標(biāo)實(shí)現(xiàn)程度及任務(wù)推進(jìn)情況定期評(píng)選優(yōu)秀班組和班組之星,為學(xué)生樹立勤學(xué)守紀(jì)的典型,引導(dǎo)正確的發(fā)展方向。該項(xiàng)舉措既強(qiáng)化了班組成員間的團(tuán)結(jié)協(xié)作,又加強(qiáng)了班組間的良性競(jìng)爭(zhēng)意識(shí)。

2.教室、寢室、實(shí)訓(xùn)場(chǎng)地的5S企業(yè)現(xiàn)場(chǎng)管理

借助于5S企業(yè)現(xiàn)場(chǎng)管理的方法,要求學(xué)生對(duì)教室、寢室、實(shí)訓(xùn)場(chǎng)地進(jìn)行整理,區(qū)分要與不要的物品,把不需要的雜物清除掉;教室里的桌椅、清潔工具,寑室里的洗漱用品、生活用具,實(shí)訓(xùn)場(chǎng)地里的設(shè)備、工具、圖紙、資料等全部按規(guī)定合理、規(guī)范放置;各種標(biāo)示一目了然、物品放置易于取用、區(qū)域劃線清晰分明,定期進(jìn)行清掃,制定相應(yīng)的規(guī)章制度,通過(guò)不間斷的檢查來(lái)確保改善的持續(xù)深入推進(jìn)。企業(yè)優(yōu)秀管理方法的實(shí)施,不僅能夠使校園保持清潔,更能使高職學(xué)生養(yǎng)成良好的生活和工作習(xí)慣,提高個(gè)人素養(yǎng),從而更好地適應(yīng)現(xiàn)代企業(yè)精益化、標(biāo)準(zhǔn)化的管理要求。

3.校園內(nèi)的企業(yè)文化活動(dòng)

在學(xué)院“素質(zhì)拓展訓(xùn)練基地”對(duì)學(xué)生開展攀巖、跨越、求生等訓(xùn)練,強(qiáng)化學(xué)生的良好心理素質(zhì),增強(qiáng)學(xué)生的競(jìng)爭(zhēng)意識(shí)和團(tuán)隊(duì)精神;舉辦“電力安全知識(shí)競(jìng)賽”、“水利工程中的CAD應(yīng)用”、“電能計(jì)量裝置誤接線判斷”、“登桿作業(yè)”、“全站儀控制測(cè)量及放樣”、“觸電救護(hù)”等各類技能訓(xùn)練和技能比賽,在校園中創(chuàng)設(shè)企業(yè)的仿真環(huán)境,進(jìn)行崗位適應(yīng)性訓(xùn)練,讓學(xué)生把所學(xué)理論轉(zhuǎn)化為實(shí)際的動(dòng)手能力。

4.校外社會(huì)實(shí)踐活動(dòng)

在學(xué)生中大力開展黨團(tuán)建設(shè),端正學(xué)生的人生觀、價(jià)值觀、世界觀;對(duì)學(xué)生干部實(shí)行素質(zhì)拓展認(rèn)證制度;組織青年志愿者參與社區(qū)服務(wù);組織學(xué)生到偏遠(yuǎn)地區(qū)調(diào)研水利、電力、教育等情況,開展電力科技、農(nóng)村安全用電等科普宣傳,建立“社會(huì)實(shí)踐服務(wù)基地”,完成調(diào)研論文上報(bào)省電機(jī)工程學(xué)會(huì)。

5.校外企業(yè)頂崗實(shí)習(xí)

學(xué)院與四川省電力公司、國(guó)電集團(tuán)川渝公司、中國(guó)水電五局、中國(guó)水電七局等多家企業(yè)建立了長(zhǎng)期的合作關(guān)系,為學(xué)生提供用電檢查、電力營(yíng)銷、架控線路施工、電能計(jì)量等專業(yè)對(duì)口的企業(yè)崗位實(shí)踐,讓學(xué)生進(jìn)入企業(yè)、下到車間,以企業(yè)職工的身份代班代崗。通過(guò)頂崗實(shí)習(xí),學(xué)生們熟悉了企業(yè)環(huán)境、工作流程、生產(chǎn)要求,也清晰了自身與工作崗位間的差距,既促進(jìn)學(xué)生對(duì)自身高職角色的認(rèn)知,更有利于學(xué)生向企業(yè)職工的角色轉(zhuǎn)換。

三、在視覺(jué)上強(qiáng)化高職學(xué)生的自我識(shí)別

視覺(jué)識(shí)別獨(dú)具直觀性和形象性,對(duì)人有最直接的沖擊力和感染力,最容易被感知、記憶和認(rèn)同,學(xué)院特別注意強(qiáng)化學(xué)生對(duì)自己高職身份的識(shí)別。

1.基礎(chǔ)視覺(jué)識(shí)別

作為國(guó)家電網(wǎng)下屬的高職院校,學(xué)院在基礎(chǔ)視覺(jué)方面呈現(xiàn)出與企業(yè)相同的風(fēng)格:使用國(guó)家電網(wǎng)徽記,標(biāo)準(zhǔn)色統(tǒng)一為深綠色,在標(biāo)志外環(huán)的企業(yè)名稱下加注學(xué)院名稱。這種集標(biāo)志、標(biāo)準(zhǔn)字、標(biāo)準(zhǔn)色于一體的徽記,在向?qū)W生傳達(dá)國(guó)家電網(wǎng)為社會(huì)提供潔凈能源,與客戶建立互惠和諧關(guān)系的企業(yè)服務(wù)理念的同時(shí),也體現(xiàn)了學(xué)院植根電力,與光明同行的辦學(xué)方針。

2.應(yīng)用視覺(jué)識(shí)別

第6篇

【關(guān)鍵詞】語(yǔ)音識(shí)別 音頻文字自動(dòng)提取

一、引言

由于計(jì)算機(jī)技術(shù)近年來(lái)發(fā)展非常迅速,使人們用語(yǔ)言與計(jì)算機(jī)進(jìn)行通信與交流已成為可能,而起草文稿、撰寫文章、準(zhǔn)備教案、會(huì)議記錄等都需要文字整理,對(duì)比傳統(tǒng)的鍵盤和鼠標(biāo)輸入方式,語(yǔ)音識(shí)別技術(shù)在速度上要提高2~4倍。

從音頻中自動(dòng)提取文字是以語(yǔ)音識(shí)別系統(tǒng)為核心,對(duì)參考文本和對(duì)應(yīng)語(yǔ)音進(jìn)行強(qiáng)制對(duì)準(zhǔn)的過(guò)程,其目的在于將音頻信息轉(zhuǎn)換為文本文字。作為語(yǔ)音識(shí)別領(lǐng)域中一種常見的預(yù)處理技術(shù),音頻文字自動(dòng)提取廣泛應(yīng)用在政府機(jī)關(guān)、企事業(yè)單位的會(huì)議記錄;網(wǎng)絡(luò)文字直播;媒體采訪速記;錄像文字整理;廣播電視媒體;錄音文字整理;大量文字的錄入排版、打印輸出,計(jì)算機(jī)輔助語(yǔ)言教學(xué)等方面,此外,還可為現(xiàn)場(chǎng)直播的新聞、演講、會(huì)議等生成字幕;為語(yǔ)言教學(xué)、游戲娛樂(lè)、電影制作等生成多媒體庫(kù);為歌曲制作同步的歌詞顯示等。

由此可見,音頻中提取文字這項(xiàng)技術(shù)的用處很大,而目前能實(shí)現(xiàn)自動(dòng)翻譯的語(yǔ)音識(shí)別同生速記系統(tǒng)還正在研究之中。市場(chǎng)上要將錄音轉(zhuǎn)換成文字的方法就是找專業(yè)的速記公司,進(jìn)行人工翻譯,工作量大,效率慢,而且收費(fèi)很高,一般每小時(shí)錄音收費(fèi)為200元左右。

二、背景及發(fā)展現(xiàn)狀

語(yǔ)音識(shí)別技術(shù)的研究工作起始于20世紀(jì)50年代,貝爾實(shí)驗(yàn)室通過(guò)提取語(yǔ)音特征參數(shù),第一個(gè)實(shí)現(xiàn)了可以識(shí)別10個(gè)英文數(shù)字的語(yǔ)音識(shí)別系統(tǒng)。20世紀(jì)80年代,人工神經(jīng)網(wǎng)絡(luò)技術(shù)引入語(yǔ)音識(shí)別,HMM模型和人工神經(jīng)元網(wǎng)絡(luò)ANN被成功應(yīng)用,進(jìn)入90年代后語(yǔ)音識(shí)別系統(tǒng)從實(shí)驗(yàn)室逐步走向?qū)嵱?。我?guó)語(yǔ)音識(shí)別研究工作起步于20世紀(jì)80年代,從1987年開始執(zhí)行國(guó)家863計(jì)劃后,以清華大學(xué)電子工程系與中科院自動(dòng)化研究所為代表的研究機(jī)構(gòu),得到了國(guó)家自然科學(xué)基金重大和重點(diǎn)項(xiàng)目等基金的支持,取得了豐碩的研究成果。目前市場(chǎng)上主要產(chǎn)品有北京陽(yáng)宸電子技術(shù)公司的 VS-99 語(yǔ)音自動(dòng)識(shí)別系統(tǒng)、科大訊飛的 InterVeri 系列等開發(fā)的語(yǔ)音自動(dòng)識(shí)別系統(tǒng)等。

三、語(yǔ)音識(shí)別原理

自動(dòng)語(yǔ)音識(shí)別技術(shù)(Auto Speech Recognize,簡(jiǎn)稱ASR),在整個(gè)構(gòu)建過(guò)程中包括兩個(gè)階段:訓(xùn)練階段和識(shí)別階段。在訓(xùn)練階段,ASR系統(tǒng)進(jìn)行語(yǔ)音收集,然后對(duì)收集的語(yǔ)音進(jìn)行降噪處理,消除部分噪音和發(fā)音者的個(gè)性特點(diǎn),為了使處理后的信號(hào)更清晰,可以將發(fā)音者語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為數(shù)字格式,即計(jì)算機(jī)可讀的輸入,例如二進(jìn)制編碼,然后ASR系統(tǒng)將提取的每個(gè)語(yǔ)音單位的特征矢量進(jìn)行一定的處理,然后存入到模板庫(kù)中。

在模式匹配(即識(shí)別)過(guò)程中,ASR系統(tǒng)通過(guò)學(xué)習(xí)算法產(chǎn)生特征矢量,在識(shí)別時(shí)將輸入語(yǔ)音的特征矢量與模板庫(kù)征矢量相比較,找到最匹配的單詞序列。目前最具有代表性的ASR技術(shù)有動(dòng)態(tài)時(shí)間環(huán)繞技術(shù)、隱馬爾科夫(markov)模型(HMM)和人工神經(jīng)網(wǎng)(ANN)模型。其中基于HMM的技術(shù)最為流行且語(yǔ)音識(shí)別性能最好。

四、 音頻文字自動(dòng)提取的設(shè)計(jì)與實(shí)現(xiàn)

通常音頻素材所占的容量都比較大,為了節(jié)省工作量,在使用素材之前,一般使用goldwave將音頻素材分割成所需要的長(zhǎng)度。再配合使用Windows 7系統(tǒng)中的語(yǔ)音識(shí)別功能,通過(guò)該功能,可以讓我們徹底拋開鼠標(biāo)和鍵盤,只用語(yǔ)音控制電腦,特別是配合word軟件,還能實(shí)現(xiàn)文本的語(yǔ)音輸入,識(shí)別的準(zhǔn)確性也較高。為了使win7語(yǔ)音識(shí)別系統(tǒng)獲得更清晰的語(yǔ)音素材,需要在播放音頻素材的同時(shí)使用內(nèi)錄功能,文本軟件會(huì)記錄下提取到的音頻文字內(nèi)容,創(chuàng)建文本文檔,也可在文檔中進(jìn)行修改或更正錯(cuò)誤。

盡管win7系統(tǒng)可以實(shí)現(xiàn)音頻文字的自動(dòng)提取,由于環(huán)境噪聲、使用者的語(yǔ)音差別等等因素,所以其最終識(shí)別率并不高。所以,我們還需要對(duì)win7語(yǔ)音識(shí)別系統(tǒng)進(jìn)行模型訓(xùn)練。通過(guò)不斷糾正其錯(cuò)誤識(shí)別文字,在數(shù)據(jù)庫(kù)中加入生僻名詞,反復(fù)使用音頻素材對(duì)模型進(jìn)行訓(xùn)練,使語(yǔ)音識(shí)別系統(tǒng)最終能完全識(shí)別音頻素材,以此來(lái)優(yōu)化模型,提高語(yǔ)音系統(tǒng)的識(shí)別率。

五、總結(jié)和展望

如今計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)作為一股潛在的發(fā)展技術(shù)極大提高人們的現(xiàn)實(shí)生活需要,不僅轉(zhuǎn)變了人們的生活方式,提高了工作效率,更加推動(dòng)了社會(huì)的進(jìn)步和文明的發(fā)展,所以從音頻中自動(dòng)提取文字具有廣闊的應(yīng)用前景,由于語(yǔ)音自動(dòng)識(shí)別的局限性,使得這項(xiàng)技術(shù)任重而道遠(yuǎn),。

在今后的科研中,音頻中自動(dòng)提取文字將被更加廣泛的應(yīng)用,各種具有音頻自動(dòng)提取文字的產(chǎn)品也將漸漸在市場(chǎng)上出現(xiàn),隨著計(jì)算機(jī)信息技術(shù)的不斷發(fā)展創(chuàng)新,語(yǔ)音識(shí)別系統(tǒng)將會(huì)引領(lǐng)我們的信息技術(shù)革命到一個(gè)新的臺(tái)階。

第7篇

關(guān)鍵詞:語(yǔ)音識(shí)別;動(dòng)態(tài)時(shí)間規(guī)整算法;人工神經(jīng)元網(wǎng)絡(luò)

中圖分類號(hào):H017文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-3198(2008)02-0199-02

1 背景介紹

語(yǔ)言是人類特有的功能,是人們思維最重要的寄托體,是人類交流最主要的途徑。語(yǔ)音是語(yǔ)言的聲學(xué)表現(xiàn),是人類交流信息最自然、最有效、最方便的手段。語(yǔ)言和語(yǔ)音與人類社會(huì)科學(xué)文化發(fā)展緊密相連。

語(yǔ)音識(shí)別技術(shù)是讓機(jī)器接收,識(shí)別和理解語(yǔ)音信號(hào),并將其轉(zhuǎn)換成相應(yīng)的數(shù)字信號(hào)的技術(shù)。它是一門交叉學(xué)科,涉及到語(yǔ)音語(yǔ)言學(xué)、數(shù)理統(tǒng)計(jì)、計(jì)算機(jī)、信號(hào)處理等一系列學(xué)科。

2 發(fā)展歷史

1952年貝爾實(shí)驗(yàn)室的Davis等人研制成功了能識(shí)別十個(gè)英文數(shù)字發(fā)音的Audry系統(tǒng),標(biāo)志著語(yǔ)音識(shí)別技術(shù)研究工作開始。20世紀(jì)60年代計(jì)提出了動(dòng)態(tài)規(guī)劃(Dynamic programming)和線性預(yù)測(cè)分析技術(shù)(Liner Predictive)等重要成果。20世紀(jì)70年代,語(yǔ)音識(shí)別領(lǐng)域取得了突破。實(shí)現(xiàn)了基于線性預(yù)測(cè)倒譜和DTW技術(shù)的特定人孤立語(yǔ)音識(shí)別系統(tǒng)。20世紀(jì)80年代語(yǔ)音識(shí)別研究進(jìn)一步走向深入, 基于特定人孤立語(yǔ)音技術(shù)的系統(tǒng)研制成功, 隱馬爾可夫模型和人工神經(jīng)元網(wǎng)絡(luò)(Artificial Neural Network)在語(yǔ)音識(shí)別中的成功應(yīng)用。進(jìn)入20世紀(jì)90年代后語(yǔ)音識(shí)別系統(tǒng)開始從實(shí)驗(yàn)室走向?qū)嵱?。我?guó)對(duì)語(yǔ)音識(shí)別的研究開始于20世紀(jì)80年代,近年來(lái)發(fā)展迅速,并取得了一系列的成果。

3 具體應(yīng)用

隨著計(jì)算機(jī)技術(shù)、模式識(shí)別等技術(shù)的發(fā)展,適應(yīng)不同場(chǎng)合的語(yǔ)音識(shí)別系統(tǒng)相繼被開發(fā)出來(lái),語(yǔ)音識(shí)別及處理技術(shù)已經(jīng)越來(lái)越突現(xiàn)出其強(qiáng)大的技術(shù)優(yōu)勢(shì)。近三十年來(lái),語(yǔ)音識(shí)別在計(jì)算機(jī)、信息處理、通信與電子系統(tǒng)、自動(dòng)控制等領(lǐng)域的應(yīng)用越來(lái)越廣泛。

在許多政府部門、商業(yè)機(jī)構(gòu),語(yǔ)音識(shí)別技術(shù)的應(yīng)用,可免除大量操作人員的重復(fù)勞動(dòng),既經(jīng)濟(jì)又方便。如:語(yǔ)音郵件、IP電話和IP傳真、電子商務(wù)、自動(dòng)語(yǔ)音應(yīng)答系統(tǒng)、自動(dòng)語(yǔ)音信箱、基于IP的語(yǔ)音、數(shù)據(jù)、視頻的CTI系統(tǒng)、綜合語(yǔ)音、數(shù)據(jù)服務(wù)系統(tǒng)、自然語(yǔ)音識(shí)別系統(tǒng)、專家咨詢信息服務(wù)系統(tǒng)、尋呼服務(wù)、故障服務(wù)、秘書服務(wù)、多媒體綜合信息服務(wù)、專業(yè)特別服務(wù)號(hào)(168自動(dòng)信息服務(wù)系統(tǒng),112、114、119等信息查詢系統(tǒng))等。許多特定環(huán)境下,如工業(yè)控制方面,在一些工作環(huán)境惡劣、對(duì)人身有傷害的地方(如地下、深水及輻射、高溫等)或手工難以操作的地方,均可通過(guò)語(yǔ)音發(fā)出相應(yīng)的控制命令,讓設(shè)備完成各種工作。

當(dāng)今,語(yǔ)音識(shí)別產(chǎn)品不僅在人機(jī)交互中,占到的市場(chǎng)比例越來(lái)越大,而且在許多領(lǐng)域都有了廣闊的應(yīng)用前景,在人們的社會(huì)生活中起著舉足輕重的作用。

4 語(yǔ)音識(shí)別系統(tǒng)原理

語(yǔ)音識(shí)別一般分為兩個(gè)步驟:學(xué)習(xí)階段和識(shí)別階段。學(xué)習(xí)階段的任務(wù)是建立識(shí)別基本單元的聲學(xué)模型以及語(yǔ)言模型。識(shí)別階段是將輸入的目標(biāo)語(yǔ)音的特征參數(shù)和模型進(jìn)行比較,得到識(shí)別結(jié)果。

語(yǔ)音識(shí)別過(guò)程如圖所示。下面對(duì)該流程作簡(jiǎn)單介紹:

(1)語(yǔ)音采集設(shè)備如話筒、電話等將語(yǔ)音轉(zhuǎn)換成模擬信號(hào)。

(2)數(shù)字化一般包括預(yù)濾波、采樣和A/D變換。該過(guò)程將模擬信號(hào)轉(zhuǎn)變成計(jì)算機(jī)能處理的數(shù)字信號(hào)。

(3)預(yù)處理一般包括預(yù)加重、加窗分幀。經(jīng)預(yù)處理后的信號(hào)被轉(zhuǎn)換成了幀序列的加窗的短時(shí)信號(hào)。

(4)參數(shù)分析是對(duì)短時(shí)信號(hào)進(jìn)行分析,提取語(yǔ)音特征參數(shù)的過(guò)程,如時(shí)域、頻域分析,矢量量化等。

(5)語(yǔ)音識(shí)別是目標(biāo)語(yǔ)音根據(jù)特征參數(shù)與模型庫(kù)中的參數(shù)進(jìn)行匹配,產(chǎn)生識(shí)別結(jié)果的過(guò)程。一般有模板匹配法、隨機(jī)模型法和神經(jīng)網(wǎng)絡(luò)等。

(6)應(yīng)用程序根據(jù)識(shí)別結(jié)果產(chǎn)程預(yù)定動(dòng)作。

(7)該過(guò)程是語(yǔ)音模型的學(xué)習(xí)過(guò)程。

5 現(xiàn)有算法介紹

語(yǔ)音識(shí)別常用的方法有:模板匹配法、人工神經(jīng)網(wǎng)絡(luò)法。

(1)模板匹配法是語(yǔ)音識(shí)別中常用的一種相似度計(jì)算方法。模板匹配法一般將語(yǔ)音或單詞作為識(shí)別單元,一般適用于詞匯表較小的場(chǎng)合。在訓(xùn)練階段,對(duì)用戶語(yǔ)音進(jìn)行特征提取和特征維數(shù)的壓縮,這個(gè)過(guò)程常用的方法是采用矢量量化(VQ)技術(shù)。然后采用聚類方法或其他方法,針對(duì)每個(gè)模式類各產(chǎn)生一個(gè)或幾個(gè)模板。識(shí)別階段將待識(shí)別的語(yǔ)音模式的特征參數(shù)與各模板進(jìn)行相似度的計(jì)算,將最高相似者作為識(shí)別結(jié)果。但由于用戶在不同時(shí)刻發(fā)同一個(gè)音的時(shí)間長(zhǎng)度有較大隨意性,所以識(shí)別時(shí)必須對(duì)語(yǔ)音時(shí)間進(jìn)行伸縮處理。研究表明,簡(jiǎn)單的線性伸縮是不能滿足要求的。由日本學(xué)者板倉(cāng)在70年代提出的動(dòng)態(tài)時(shí)間伸縮算法(DTW)很好的解決了這一問(wèn)題。DTW算法能夠較好地解決小詞匯量、孤立詞識(shí)別時(shí)說(shuō)話速度不均勻的難題。DTW算法示意圖如圖所示。

設(shè)測(cè)試的語(yǔ)音參數(shù)共有M幀矢量,而參考模板有N幀矢量,且M≠N,則DTW 就是尋找一個(gè)時(shí)間歸整函數(shù)tn=f(tm),它將測(cè)試矢量的時(shí)間軸tm非線性地映射到模板的時(shí)間軸tn上,并使該函數(shù)滿足第k幀(k=1,2,…M)測(cè)試矢量I和第f(k)幀(f(k)=1,2…N)模板矢量J之間的距離測(cè)度之和最小:

Distance=min∑Mk=1d[I(k)-J(f(k))]

另外,在實(shí)際識(shí)別系統(tǒng)中,語(yǔ)音的起點(diǎn)或終點(diǎn)由摩擦音構(gòu)成,環(huán)境噪聲也比較大,語(yǔ)音的端點(diǎn)檢測(cè)會(huì)存在較大的誤差。DTW 算法起點(diǎn)點(diǎn)可以固定在(tm,tn)=(1,1),稱為固定起點(diǎn);也可以選擇在(1,2)、(2,1)等點(diǎn),稱為松馳起點(diǎn)。同樣,中止點(diǎn)可以選擇在(M,N)點(diǎn),稱為固定終點(diǎn);也可以選擇在(N一1,M)、(N,M一1)等點(diǎn),稱為松弛終點(diǎn)。松弛的DTW 算法的起始點(diǎn)從(1,1)、(1,2)、(2,1)等點(diǎn)中選擇一最小值,終止點(diǎn)從(M,N)、(M,N-1)、(M-1,N)等點(diǎn)中選擇一最小值,兩語(yǔ)音樣本之間的相互距離在相應(yīng)的點(diǎn)放松后選擇一最小距離。松弛DTW可以克服由于端點(diǎn)檢測(cè)不精確引起的誤差,但運(yùn)算量加大。

(2)人工神經(jīng)網(wǎng)絡(luò)法。現(xiàn)實(shí)世界的語(yǔ)音信號(hào)會(huì)隨著許多特征如:說(shuō)話人語(yǔ)速、語(yǔ)調(diào)以及環(huán)境的變化而動(dòng)態(tài)變化的,想要用傳統(tǒng)的基于模板的方法建立一個(gè)適應(yīng)動(dòng)態(tài)變化的語(yǔ)音識(shí)別系統(tǒng)是非常困難的。因此需要設(shè)計(jì)一個(gè)帶有自學(xué)習(xí)能力的自適應(yīng)識(shí)別系統(tǒng),以便可以適應(yīng)語(yǔ)音的動(dòng)態(tài)變化。

人工神經(jīng)網(wǎng)絡(luò)由神經(jīng)元、網(wǎng)絡(luò)拓樸和學(xué)習(xí)方法構(gòu)成。人工神經(jīng)網(wǎng)絡(luò)拓樸結(jié)構(gòu)可分為反饋型和非反饋型(前饋型)。學(xué)習(xí)方法可分為監(jiān)督型和非監(jiān)督型。各種人工神經(jīng)網(wǎng)絡(luò)模型中應(yīng)用得最典型的是采用反向傳播(Back Propagation)學(xué)習(xí)算法的多層前饋網(wǎng)絡(luò)。多層前饋型網(wǎng)絡(luò)如圖所示。

除上述介紹的幾種常用的方法外,還有許多其它的識(shí)別方法以及改進(jìn)算法。

6 尚未解決的問(wèn)題及值得研究的方向

(1)就算法模型方面而言,需要有進(jìn)一步的突破。聲學(xué)模型和語(yǔ)言模型是聽寫識(shí)別的基礎(chǔ)。目前使用的語(yǔ)言模型只是一種概率模型,還沒(méi)有用到以語(yǔ)言學(xué)為基礎(chǔ)的文法模型,而要使計(jì)算機(jī)確實(shí)理解人類的語(yǔ)言,就必須在這一點(diǎn)上取得進(jìn)展。

(2)語(yǔ)音識(shí)別的自適應(yīng)性也有待進(jìn)一步改進(jìn)。同一個(gè)音節(jié)或單詞的語(yǔ)音不僅對(duì)隨著的講話者的不同而變化,而且對(duì)同一個(gè)講話者在不同場(chǎng)合,不同上下文環(huán)境中也會(huì)發(fā)生變化。這意味著對(duì)語(yǔ)言模型的進(jìn)一步改進(jìn)。

(3)語(yǔ)音識(shí)別技術(shù)還需要能排除各種環(huán)境因素的影響。目前,對(duì)語(yǔ)音識(shí)別效果影響最大的就是環(huán)境雜音或噪音。要在嘈雜環(huán)境中使用語(yǔ)音識(shí)別技術(shù)必須有特殊的抗噪麥克風(fēng)才能進(jìn)行,這對(duì)多數(shù)用戶來(lái)說(shuō)是不現(xiàn)實(shí)的。在公共場(chǎng)合中,如何讓語(yǔ)音識(shí)別技術(shù)能有摒棄環(huán)境嗓音并從中獲取所需要的特定聲音是一個(gè)艱巨的任務(wù)。

雖然在短期內(nèi)還不可能造出具有和人相比擬的語(yǔ)音識(shí)別系統(tǒng),但在未來(lái)幾年內(nèi),語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用將更加廣泛,各種語(yǔ)音識(shí)別系統(tǒng)產(chǎn)品將陸續(xù)進(jìn)入我們的生活。語(yǔ)音識(shí)別各個(gè)方面的技術(shù)正在不斷地進(jìn)步,一步步朝著更加智能化的方向發(fā)展。

參考文獻(xiàn)

[1]楊尚國(guó),楊金龍.語(yǔ)音識(shí)別技術(shù)概述[J].福建電腦,2006,(8).

[2]孫寧,孫勁光,孫宇. 基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別技術(shù)研究[J]. 計(jì)算機(jī)與數(shù)字工程,2006.

[3]Phil Woodland. Speech Recognition. Speech and Language Engineering-State of the Art (Ref. No. 1998/499).

第8篇

兩種識(shí)別技術(shù)的應(yīng)用模式

匯豐銀行的系統(tǒng)兼容兩種安全模式。首先,匯豐銀行面向 iPhone 5S、iPhone 6以及 iPhone 6S 的應(yīng)用將會(huì)利用手機(jī)的內(nèi)置指紋識(shí)別器以確認(rèn)用戶的身份,這一點(diǎn)和手機(jī)進(jìn)行解鎖及支付等操作中的指紋驗(yàn)證并無(wú)二致。而在語(yǔ)音方面,語(yǔ)音識(shí)別系統(tǒng)將會(huì)用超過(guò) 100 個(gè)識(shí)別碼對(duì)用戶的語(yǔ)音進(jìn)行比對(duì),包括節(jié)奏、口音、發(fā)音等等。除此以外,語(yǔ)音識(shí)別系統(tǒng)還可以辨別由不同的喉嚨結(jié)構(gòu)、鼻道以及聲道所發(fā)出的語(yǔ)音。

這兩種技術(shù)是否會(huì)讓生活更為便利?匯豐銀行希望通過(guò)語(yǔ)音識(shí)別技術(shù)為用戶免除需要記憶密碼之苦,現(xiàn)階段,電話銀行系統(tǒng)所使用的密碼、密令等驗(yàn)證信息給用戶造成了較大的不便。此外,Touch ID的整合無(wú)疑也會(huì)加快手機(jī)銀行應(yīng)用的登錄速度,用戶賬戶的安全性也有了保證。

聲音識(shí)別系統(tǒng)的工作原理

由聲音識(shí)別企業(yè)“Nuance”公司所提供的技術(shù)內(nèi)置有所謂的“Voice ID”(即聲音密匙)功能,它可以記錄并分析用戶的說(shuō)話方式,進(jìn)而辨別用戶口部、舌頭、喉部和呼吸的特有發(fā)音方式,用戶僅需經(jīng)過(guò)快捷的訓(xùn)練環(huán)節(jié)即可正常使用。在后續(xù)登錄時(shí),用戶將會(huì)被要求讀出特定單詞的發(fā)音,系統(tǒng)會(huì)對(duì)發(fā)音進(jìn)行比對(duì)。

有一個(gè)問(wèn)題,模仿者有可能騙過(guò)系統(tǒng)嗎?

計(jì)算機(jī)接受聲音的方式和人耳接受聲音的方式非常不一樣。模仿他人的聲音也許是可能的,但想要在超過(guò) 100 個(gè)識(shí)別碼上騙過(guò)計(jì)算機(jī)幾乎是不可能的,況且計(jì)算機(jī)還會(huì)辨識(shí)用戶的體征和行為模式。

如果那天我碰巧因?yàn)楦忻岸暰€有所不同會(huì)怎么樣?

即便是在因感冒而出現(xiàn)聲線不同的情況下,Voice ID 系統(tǒng)還是能夠識(shí)別出用戶的聲音,因?yàn)樗治龅穆曇魳?gòu)成因素有許多。即便是在感冒的情況下,你的口音、節(jié)奏、發(fā)音以及其他體征狀況還是不會(huì)發(fā)生變化。

另外,在信號(hào)不好的情況下也會(huì)是一樣,除非你的通話出現(xiàn)了中斷等情況。

如果我身處大街等較為嘈雜的地方又如何?

絕大多數(shù)智能手機(jī)都內(nèi)置有噪音消除技術(shù),這項(xiàng)技術(shù)可以阻隔絕大多數(shù)的外界噪音。而 Nuance 公司和 Voice ID 系統(tǒng)則會(huì)對(duì)剩余的噪音進(jìn)行處理。除非你在登錄的時(shí)候碰巧遇上防空警報(bào)等顯著的噪音,日常生活的正常噪音不會(huì)影響你的登錄操作。

其他銀行有沒(méi)有使用語(yǔ)音識(shí)別技術(shù)?事實(shí)上,以巴克萊銀行(Barclays)為首的其他銀行在數(shù)年前已經(jīng)開始面向少量用戶使用語(yǔ)音識(shí)別技術(shù),其中巴克萊銀行的語(yǔ)音識(shí)別技術(shù)僅對(duì)少量?jī)?yōu)質(zhì)的富裕客戶開放。截至目前,我們尚未獲悉這些銀行有被非法入侵的紀(jì)錄。

指紋識(shí)別是否足夠安全

iPhone 在主頁(yè)按鈕上整合了 Touch ID 傳感器,而你的指紋則被蘋果公司保存在一個(gè)加密的模塊當(dāng)中。每當(dāng)用戶用手指接觸主頁(yè)按鈕的時(shí)候,iPhone 會(huì)將 Touch ID 所讀取的指紋和儲(chǔ)存在加密模塊當(dāng)中的指紋進(jìn)行比對(duì),進(jìn)而給出允許或拒絕接入的判斷。用戶的指紋數(shù)據(jù)不會(huì)被外泄給任何公司,包括蘋果公司在內(nèi)。

有可能用斷指進(jìn)行解鎖嗎?

回答是不可能的,只要罪犯了解Touch ID的工作原理,你的手指都會(huì)非常安全。

Touch ID 傳感器會(huì)通過(guò)兩種方式讀取指紋。首先它會(huì)通過(guò)電容傳感器檢測(cè)由人體皮膚所釋放出來(lái)的電荷,這一點(diǎn)和觸摸屏檢測(cè)觸屏動(dòng)作時(shí)的工作原理一樣。此外,它還會(huì)使用無(wú)線電頻率掃描儀來(lái)讀取活體皮下組織的指紋。由于第二種方式只對(duì)活體皮下組織有效,因此斷指并不能通過(guò)掃描,除非罪犯能以某種方式讓其保持鮮活狀態(tài)。

Touch ID

有沒(méi)有被入侵的可能

如果非要說(shuō)Touch ID 有沒(méi)有被入侵的可能,確實(shí)有。

但盡管如此,想要入侵 Touch ID 也絕非易事,首先你需要一套價(jià)值超過(guò) 1000 英鎊的設(shè)備和材料,你還需要掌握犯罪現(xiàn)場(chǎng)偵察人員的技能,并收集到需要原用戶完整、清晰的指紋。入侵條件非??量?,一般的犯罪組織難以滿足。

尚未使用其他生物體征識(shí)別技術(shù)

語(yǔ)音和指紋僅僅是生物識(shí)別種類的其中兩項(xiàng),其他目前正在使用或開發(fā)的技術(shù)包括:

1.心率識(shí)別技術(shù),這項(xiàng)技術(shù)所使用的是每個(gè)人獨(dú)特的心率模式;

2.血管分布模式識(shí)別技術(shù),這項(xiàng)技術(shù)會(huì)檢測(cè)每個(gè)人特有的皮下血管分布情況,最常用的是手掌、手腕以及手臂等部位;

3.虹膜識(shí)別技術(shù),這項(xiàng)技術(shù)會(huì)通過(guò)設(shè)備的攝像頭辨認(rèn)用戶的虹膜;

4.視網(wǎng)膜識(shí)別技術(shù),和虹膜識(shí)別技術(shù)相似,這項(xiàng)技術(shù)會(huì)通過(guò)設(shè)備的攝像頭辨認(rèn)用戶的視網(wǎng)膜。

我們?cè)?jīng)在電影中看到過(guò)有人通過(guò)取出他人眼球的方式來(lái)解鎖保險(xiǎn)庫(kù),這個(gè)怎么解釋?

除了語(yǔ)音和指紋識(shí)別技術(shù)外,其他生物體征識(shí)別技術(shù)皆尚未得到廣泛應(yīng)用,因?yàn)檫@些技術(shù)在易用性、速度以及可靠性等維度上仍然有所欠缺。

有些識(shí)別系統(tǒng)甚至能夠辨別用戶使用鍵盤、鼠標(biāo)、觸摸屏等輸入設(shè)備的模式,每個(gè)用戶在使用這些設(shè)備時(shí)的速度、模式、壓力以及習(xí)慣都有所不同,因此也可被用于用戶登錄的辨別工作上。但目前這類識(shí)別系統(tǒng)尚不會(huì)被銀行等嚴(yán)肅的機(jī)構(gòu)采納。

這種情況也不會(huì)發(fā)生。首先,想要在保存眼球完整度的情況下取出眼球非常困難,而且想要通過(guò)視網(wǎng)膜掃描儀的驗(yàn)證,被掃描的視網(wǎng)膜需要保存在有血液流動(dòng)的鮮活狀態(tài)。虹膜掃描儀通常也會(huì)檢測(cè)用戶的虹膜是否發(fā)生運(yùn)動(dòng),失活的眼球顯然不符合這個(gè)條件。

相關(guān)鏈接