首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識別(ASR)  語音識別產(chǎn)品

藏在舌尖上的“身份證”:走向民品市場的聲音識別技術(shù)

2006/05/30

  由于有著巨大的市場需求和應(yīng)用前景,以指紋、面部特征和聲音等人體部分特征為基礎(chǔ)的各種各樣的身份識別技術(shù),正在得到政府部門、企業(yè)和研究人員的重視,研發(fā)和應(yīng)用都在高速推進(jìn)。聲音識別技術(shù),如監(jiān)聽和竊聽技術(shù)等,也揭去了過去只為國家執(zhí)法部門所用的神秘面紗,不斷被改進(jìn)和完善,以滿足更為廣闊的市場需要。

  隨著現(xiàn)代通信技術(shù)的迅速發(fā)展和普及,網(wǎng)絡(luò)技術(shù)和無線通信技術(shù)等,為聲音識別技術(shù)提供了可進(jìn)行遠(yuǎn)程操控的平臺,使得聲音識別技術(shù)不僅能夠?yàn)榧夹g(shù)偵察部門服務(wù),而且能夠?yàn)槠渌脩籼峁└鼮楸憬荨⒏訉?shí)用的口令和身份識別技術(shù)途徑,因此,得到了不同類型和不同層面用戶的青睞。目前聲音識別技術(shù)主要有四大應(yīng)用領(lǐng)域,即金融系統(tǒng)、通信網(wǎng)絡(luò)系統(tǒng)、國家執(zhí)法部門和從事訪客口令識別研究的研究機(jī)構(gòu)等。

  以色列有一家成立僅6年的公司,在聲音識別技術(shù)領(lǐng)域令人刮目相看,它就是位于雷拉拉市的PERSAY公司。目前該公司在聲音識別技術(shù)領(lǐng)域擁有的三個產(chǎn)品系列,在世界各地的用戶達(dá)到了40多個,如美國國土安全部正廣泛使用它的技術(shù)識別臨時訪問者定期打來的電話聲音,核實(shí)他們在美國的滯留情況和準(zhǔn)確位置等。

  “與競爭對手的技術(shù)相比,我們擁有的技術(shù)原理,是基于生物語音差異來實(shí)現(xiàn)對個體語音識別的!惫臼紫瘓(zhí)行官奧摩格•阿萊-雷茲在接受本報記者采訪時說,“我們的語音識別技術(shù)不僅準(zhǔn)確性較高,而且不受任何語言和口音差異的限制,使用方便!

  阿萊-雷茲向記者演示了如何用聲音作為用戶口令,通過打電話進(jìn)入銀行系統(tǒng)的。記者看到,如果線路通暢、發(fā)音清晰,那么利用這種方法來識別用戶的身份,其準(zhǔn)確性可以達(dá)到100%。“當(dāng)然,即便僅僅是在技術(shù)上讓任何一種識別方法做到完美無暇,都是非常困難的,但是,如果兩種識別方法配合使用,如聲音識別與密碼配合使用,那么其可靠性將會大大提高!

  除了上述聲音口令技術(shù)被銀行等金融系統(tǒng)用于識別用戶身份外,PERSAY于2002年開發(fā)出了識別通話者身份的自由通話技術(shù)——FreeSpeech。該技術(shù)產(chǎn)品通過生物語音識別技術(shù),可以向有關(guān)部門提供電話另一端說話者的準(zhǔn)確身份,確保通話的有效性,為通話雙方提供便利。阿萊-雷茲告訴記者,F(xiàn)reeSpeech的用途非常廣泛,比如,當(dāng)通話人需要向政府有關(guān)部門匯報情況和了解信息,用戶需要在服務(wù)商那里更改個人資料(信用卡號、服務(wù)期限等)和更新合同等等,首先需要確認(rèn)的是通話人的身份,如果通話人的身份不能得到確認(rèn),那么,就無法使用電話這種便捷的方法去解決問題。

  FreeSpeech具有的技術(shù)特點(diǎn)包括,不受語言和口音差異限制,準(zhǔn)確性高,具有干線與支線同等的音頻獲取能力,提供網(wǎng)絡(luò)服務(wù)APIs,與CTI和CRM應(yīng)用兼容,提供網(wǎng)絡(luò)管理服務(wù)等。

  2004年,PERSAY又為情報和執(zhí)法部門研制出了一種可以根據(jù)電話,來追蹤通話人的技術(shù)產(chǎn)品———S.P.I.D(說話者身份)。這一技術(shù)利用有線和無線通訊網(wǎng)絡(luò),可以使政府執(zhí)法部門從成千上萬的通話者中,鑒別出正在追蹤目標(biāo)的通話聲音,從而找到追蹤目標(biāo)。該技術(shù)在2005年通過了美國國家標(biāo)準(zhǔn)和技術(shù)研究所的鑒定,被認(rèn)為是一種不受通話內(nèi)容限制、準(zhǔn)確率高的通話人身份識別技術(shù)。

  作為一家已經(jīng)進(jìn)入快速發(fā)展通道的創(chuàng)新公司,年輕的阿萊-雷茲認(rèn)為在不久的將來會有更多的用戶使用他們的技術(shù)!氨M管聲音識別技術(shù)在口令和身份識別技術(shù)領(lǐng)域是一項(xiàng)比較新的技術(shù),目前仍處于不斷改進(jìn)和提升的階段,但是我們擁有的這三種產(chǎn)品技術(shù),都已經(jīng)具有規(guī);袌鰬(yīng)用的能力。目前推廣和應(yīng)用這種技術(shù)的主要困難是,需要花費(fèi)大量時間和精力,通過現(xiàn)場演示等方法,去說服各種用戶了解和相信聲音識別技術(shù)的可靠性和便捷性。”

科技日報



相關(guān)鏈接:
語音識別前端系統(tǒng)提高配送中心員工選貨的正確性 2006-03-14
語音技術(shù)“入侵”電話服務(wù) 顛覆傳統(tǒng)通信 2006-03-10
Aculab的Prosody語音卡支持teliSpeech語音識別技術(shù) 2006-03-06
探尋聲紋認(rèn)證技術(shù)的產(chǎn)業(yè)化模式 2006-02-27
鄭方:產(chǎn)學(xué)研合作肩負(fù)標(biāo)準(zhǔn)與產(chǎn)業(yè)重任 2006-02-27

相關(guān)頻道:           文摘   技術(shù)_語音識別_文摘