国产精品人成在线播放,亚洲欧美色19p

國際領(lǐng)先的“得意”聲紋識別引擎

2005/07/20

　　得意公司的聲紋識別引擎（d-Ear VPR）包括聲紋辨認(rèn)版本和聲紋確認(rèn)版本，可以是文本無關(guān)的，也可以是文本相關(guān)的，而且均支持開集的識別方式。其中文本無關(guān)的版本同時具有文本和語言的無關(guān)性，對語音長度的要求也非常低，通常訓(xùn)練只需要幾十秒有效語音，而識別階段只需幾秒鐘的有效語音即可。有很高的識別精度，也可以靈活地調(diào)整操作點(diǎn)參數(shù)從而適應(yīng)于不同應(yīng)用的需求。

"得意"聲紋識別引擎具備以下技術(shù)特征：

對聲紋的識別與所說的文本和語言無關(guān)性。用戶訓(xùn)練系統(tǒng)和系統(tǒng)對用戶的聲音進(jìn)行鑒別和確認(rèn)，可以是完全不同的文本，完全不同的語言。比如，在用戶在系統(tǒng)注冊聲音時，可以使用中文說一段文學(xué)章節(jié)，而識別時用戶可以用英文談?wù)撚?jì)算機(jī)的發(fā)展方向。

對語音長度沒有特殊要求。訓(xùn)練語音最長8秒，使用時的測試語音2-4 秒，并可不斷累積調(diào)整聲紋模型精度；用戶訓(xùn)練系統(tǒng)，讓其記住其聲紋，只需要幾秒種的聲音；而在識別時，系統(tǒng)只要獲得被測試人幾秒的聲音，就可以進(jìn)行聲紋識別。

很高的精度。d-Ear VPR技術(shù)的辨認(rèn)和確認(rèn)準(zhǔn)確度都很高，說話人辨認(rèn)的正確率不小于99%；說話人確認(rèn)的誤識率和誤拒率均低于1%；

識別速度快，能確保實(shí)時識別。聲紋識別引擎具有十倍以上的實(shí)時率，可多路并發(fā)識別，即10秒的語音片斷，引擎1秒內(nèi)就可以處理完成。

操作點(diǎn)調(diào)整方便：根據(jù)"準(zhǔn)確率＋不確定率＋錯誤率＝100%"，可按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值，使最終準(zhǔn)確率達(dá)到最高或使錯誤率降到最低。

聲紋模型存儲空間小：每個人的聲紋模型存儲空間小于5KB。

高安全性，不怕錄音冒用：如果別人用各類錄音設(shè)備（比如錄音機(jī)、MP3、錄音電話、竊聽器、高精度的專業(yè)錄音系統(tǒng)等）事先錄下您的聲音，即使錄音設(shè)備很先進(jìn)、錄音效果非常好，在把錄音回放嘗試進(jìn)行聲紋身份認(rèn)證時，聲音信號經(jīng)過模擬到數(shù)字、再從數(shù)字到模擬的兩次信號轉(zhuǎn)換過程，聲音的頻譜就會有明顯的衰減和失真，這種失真很容易被聲紋加密鎖的認(rèn)證程序分辯出來。所以依靠錄音去嘗試登錄，不能通過聲紋認(rèn)證，也就是說，通過錄音不能冒用身份。

"得意"聲紋識別技術(shù)與其他聲紋識別技術(shù)的比較

	得意聲紋識別技術(shù)	其他聲紋識別技術(shù)
1	具文本無關(guān)性，確保了身份確認(rèn)的安全性和用戶的方便性　　對聲紋的識別與所說的文本和語言無關(guān),用戶訓(xùn)練系統(tǒng)和系統(tǒng)對用戶的聲音進(jìn)行鑒別和確認(rèn)，可以是完全不同的文本，完全不同的語言。比如，在用戶在系統(tǒng)注冊聲音時，可以使用中文說一段文學(xué)章節(jié)，而識別時用戶可以用英文談?wù)撚?jì)算機(jī)的發(fā)展方向。	與文本相關(guān)，安全性和使用方便性都顯不足　　對聲紋的識別與所說的文本和語言相關(guān),用戶訓(xùn)練系統(tǒng)和系統(tǒng)對用戶的聲音進(jìn)行鑒別和確認(rèn)，必須是完全一致的文本，使用相同的語言，容易導(dǎo)致口令的外泄。
2	對語音長度沒有特殊要求，方便實(shí)際的應(yīng)用　　使用時的測試語音2-4 秒，并可不斷累積調(diào)整聲紋模型精度；用戶訓(xùn)練系統(tǒng)，讓其記住其聲紋，只需要幾秒種的聲音；而在識別時，系統(tǒng)只要獲得被測試人幾秒的聲音，就可以進(jìn)行聲紋識別。	要求進(jìn)行特定的語音訓(xùn)練，用戶需跟著朗讀和學(xué)習(xí)，方便性和實(shí)用性不強(qiáng)
3	很高的精度　　得意的技術(shù)辨認(rèn)和確認(rèn)準(zhǔn)確度都很高，說話人辨認(rèn)的正確率不小于99%；說話人確認(rèn)的誤識率和誤拒率均低于1%	精度一般　　識別精度約為90％，誤識率和誤拒率相對較高
4	操作點(diǎn)調(diào)整方便　　可根據(jù)實(shí)際情況和環(huán)境，按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值，使最終準(zhǔn)確率達(dá)到最高或使錯誤率降到最低。	沒有操作點(diǎn)調(diào)整功能　　不同用戶和不同的環(huán)境使用只能使用同一模型，不能確保高的安全性和準(zhǔn)確率
5	聲紋模型存儲空間小　　每個人的聲紋模型存儲空間小于5KB，能可靠地存儲于加密鑰匙內(nèi)，與硬件緊密結(jié)合能最高程度地保證系統(tǒng)的安全性，防止非法的攻擊和竊取	聲紋模型存儲空間小　　不能存儲于加密鑰匙內(nèi)，沒有硬件的保護(hù)，不能有效防止非法的攻擊和竊取

得意音通公司供稿 CTI論壇編輯

北京軟件產(chǎn)品質(zhì)量檢測檢驗(yàn)中心對《海量語音文件的目標(biāo)說話人篩選系統(tǒng)》進(jìn)行測試 2009-06-25

廣東政府和清華大學(xué)舉行了全面開展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25

得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23

得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

相關(guān)頻道: 文摘技術(shù)_語音識別_文摘