Nuance Verifier產(chǎn)品概述

2001/12/29

介紹

  Nuance是自然語音接口軟件的市場先驅(qū)。自然語音接口軟件提供通過電話獲取信息、服務(wù)并進(jìn)行交易的途徑。Nuance將Nuance Verifier 聲紋鑒別軟件和其核心識別引擎集成在一起,創(chuàng)建語音行業(yè)最安全、最具伸縮性、最方便的解決方案。Nuance Verifier 能通過語音識別,對用戶語音和以前登記的聲紋作比較,同時對用戶進(jìn)行身份校驗和鑒別。Verifier 所提供的安全性可與指紋媲美,而無需特殊的設(shè)備。在任何時候,用戶所需要一部電話,依靠獨特的語音便可被安全地鑒別。

  欺詐現(xiàn)象每年使各個公司損失慘重,Nuance Verifier 除了能夠防偽外,還避免了記憶密碼和PIN(個人身份識別碼)的麻煩。為使用各種帳號,顧客不再需要記住不同的密碼。很多公司每年為替換PIN需花費成千上萬美元。Verifier 完全免除了這項費用。而且,因為用戶無需講出密碼,縮短了整個通話時間,降低了需要電話口的數(shù)目和整個系統(tǒng)硬件的成本。

  另外,通過同時對特定呼叫者進(jìn)行識別和鑒別,Nuance Verifier 使各個公司能對顧客的交互進(jìn)行個性化、提供有效的一對一營銷。

  獨立的鑒別方案,即使和其它語音識別產(chǎn)品配合,也不能提供Nuance Verifier 的實用性、安全性和性能。

  本文檔詳述了Nuance Verifier 的主要功能,以及它們?nèi)绾谓Y(jié)合起來,提供最方便、安全和靈活的聲紋鑒別解決方案。第二部分對Nuance Verifier 的方便性和實用性功能進(jìn)行說明。第三部分集中在Nuance Verifier 的核心技術(shù)和準(zhǔn)確性等方面的內(nèi)容。最后部分說明Nuance的分布式結(jié)構(gòu),它保證了關(guān)鍵任務(wù)應(yīng)用的伸縮性和可靠性。

市場要求

應(yīng)用

  聲紋鑒別可用在很多應(yīng)用系統(tǒng)中來增強(qiáng)保密性。最關(guān)注聲紋鑒別的部門是金融、電訊、商務(wù)和企業(yè)安全。原因不言自明:這些市場中的交易和信息比較有價值,容易發(fā)生欺詐。

  在金融服務(wù)市場,關(guān)鍵應(yīng)用有:

  在通訊市場,聲紋鑒別的應(yīng)用包括:

  在商業(yè)領(lǐng)域,聲紋鑒別用于:

  在公司保密領(lǐng)域:

實用性

  這些應(yīng)用各自代表了對講話人鑒別技術(shù)的不同實用性要求。要作為實用的保密工具并為各種廣泛顧客所接受,鑒別方案必須做到:

準(zhǔn)確性和安全性

  高準(zhǔn)確性和安全性是任何聲紋鑒別系統(tǒng)的主要要求。

實施和伸縮性要求

  具有支持大型和關(guān)鍵任務(wù)應(yīng)用的實施路徑和軟件結(jié)構(gòu),對鑒別系統(tǒng)至關(guān)重要。它必須具有下列能力:

Nuance Verifier™——超越市場要求

  Nuance Verifier 軟件滿足并超越所有這些市場要求。下列章節(jié)詳述其主要的功能及其在創(chuàng)建實用、安全和可伸縮的聲紋鑒別方案中的應(yīng)用。

實用性特性

識別和鑒別同步進(jìn)行

  Nuance是唯一一個將自然語音識別和鑒別集成在同一個軟件結(jié)構(gòu)的公司。所以,基于Nuance的應(yīng)用程序在對同一個語句進(jìn)行有效的識別和校驗方面獨樹一幟,而且行之有效。Nuance Verifier 在鑒別處理的對話中甚至可使用以前的語音。

  這種高一層次的集成較之單獨的鑒別技術(shù)更為先進(jìn),使聲紋鑒別成為與用戶對話更高效、結(jié)合更緊密的部分。用戶的鑒別語音以字典為向?qū)В谦@取數(shù)據(jù)、啟動交易的一部分,用戶交互更加高效和更加合理。

任何接口均可選擇

  對Nuance方案,鑒別使用的密碼接口方案或類型都不受限制。各公司可自由選擇最適合于應(yīng)用系統(tǒng)的任何接口;如果以后覺得別的接口更加有效,用戶無需選擇新的技術(shù)提供商即可改變接口。聲紋鑒別中的這種靈活性和實用性是前所未有的。下表列出部分Nuance可實現(xiàn)的不同用戶接口:

  每個接口需要的登記和測試數(shù)據(jù)量大多是關(guān)于鑒別測試語音差異的函數(shù)。例如,不是每個呼叫均改變自定義密碼,所以登記很簡短,鑒別也是。帳號具有十位數(shù)字外加保密隨機(jī)數(shù)字(可進(jìn)一步防止使用錄音),可變性稍為多些。提問短語或背景測試具有更大的語音差異,需要對用戶語音作更多的采樣。Nuance在為各應(yīng)用決定最佳用戶接口和性能級別這方面具有豐富的專業(yè)知識,而軟件的靈活性確保了接口設(shè)計能符合這些要求。

  對于基于密碼的接口,要注意:只有Nuance Verifier 才能靈活地通過以下三種方法創(chuàng)建密碼:

  除了實用性優(yōu)點,并行進(jìn)行識別和密碼校驗功能增強(qiáng)了安全性。由于Nuance Verifier 和Nuance識別軟件集成,它能對這些接口的密碼進(jìn)行語音識別,不僅確保呼叫者的語音和被授權(quán)的用戶匹配,而且確保呼叫者知道正確的密碼。

辨別欺詐和用戶錯誤

  Nuance緊密集成的語音識別功能使軟件能區(qū)分用于語音識別的講話和別的一些背景噪音、或者用戶的無意誤啟動。在這些用戶錯誤的情況下,呼叫者要么清清嗓子、或者對提示做出不恰當(dāng)?shù)膽?yīng)答,基于Nuance的應(yīng)用系統(tǒng)能禮貌地重新提示用戶,然后才開始聲紋鑒別。單獨的鑒別技術(shù)沒有緊密集成的語音識別功能,在多數(shù)這些情況下,只能盲目地拒絕進(jìn)入。

動態(tài)決策

  在鑒別處理中,Nuance Verifier 有一定的智能,使應(yīng)用系統(tǒng)更加實用,同時提高了整體鑒別的準(zhǔn)確性。當(dāng)達(dá)到一定置信水平時,該軟件能促使應(yīng)用系統(tǒng)做出鑒別決定,并提示輸入更多數(shù)據(jù)。快速決定對用戶的影響最少。與此類似,如果初始鑒別結(jié)果不完全是定論,準(zhǔn)確鑒別用戶的可能性更大。提示輸入固定長度語句的辦法則會降低實用性和/或安全性。本功能,名為可變長度校驗,將在本文檔后續(xù)部分作更詳細(xì)的說明。

多語種支持

  Nuance Verifier 支持各種各樣的語言,包括美式英語、英式英語、西班牙語、日語、德語、法語、巴西葡萄牙語和瑞典語。另外幾種語言,如普通話、廣東話和意大利語,今年底將獲支持。請和Nuance核對最新支持的語種。對Nuance識別引擎未支持的語言,可通過獨立于語言的接口(例如,自定義密碼)進(jìn)行講話人鑒別。

多用戶接入和講話人鑒別

  對金融服務(wù)、電話卡使用、產(chǎn)品訂購等很多應(yīng)用,需要向多個授權(quán)用戶使用同一賬號提供接入服務(wù)。Nuance Verifier 通過允許順序鑒別的方法,讓多個用戶進(jìn)入帳戶。當(dāng)其中一個共同帳號持有者使用系統(tǒng)時,Verifier 將其語音與該帳號關(guān)連的講話模型一個接一個地進(jìn)行比較,直至找到匹配或者所有講話模型均比較完為止。

  這個功能不僅可提高系統(tǒng)的實用性,而且使公司能將用戶交互進(jìn)行個性化、提供一對一的營銷。Verifier 對特定的呼叫者從該帳號的有效用戶組中同時進(jìn)行識別和鑒別,使應(yīng)用系統(tǒng)或者處理呼叫的代理,能進(jìn)行服務(wù)和推銷定位。家庭購物網(wǎng)絡(luò)正是利用了這個聲紋鑒別功能為各呼叫者提供個性化的產(chǎn)品。

應(yīng)用功能的拓展空間

  即使一個公司的講話鑒別應(yīng)用開始時還相對簡單,隨著時間的推進(jìn),逐步增強(qiáng)后,系統(tǒng)的會話能力更加強(qiáng)大,功能更加豐富。Nuance Verifier 對這種功能和實用性的發(fā)展預(yù)留了空間,無需依靠將來的版本,更不必為了擴(kuò)充需要而更換技術(shù)和軟件商。

  現(xiàn)在的Nuance聲紋鑒別軟件方案能進(jìn)行安全的會話式交易,并具有最大的伸縮性和準(zhǔn)確率。對應(yīng)用系統(tǒng)的不斷發(fā)展,Nuance Verifier 將會持之以恒地給予支持。

核心技術(shù)和準(zhǔn)確率

登記處理

  聲紋鑒別包括兩個階段的處理:登記和鑒別。Nuance Verifier 根據(jù)用戶的數(shù)字化語音,通過創(chuàng)建聲紋或講話模型對用戶進(jìn)行登記。講話模型是用戶的語音表達(dá)形式,在后續(xù)的鑒別測試處理中,用于決定對用戶的接受還是拒絕。

  在登記過程中,Nuance Verifier 同時對各個登記語音的一致性進(jìn)行檢查。它確定用戶所講的短語和其他登記語音相比是否正確,并確保用戶所有登記語音的發(fā)音相當(dāng)相似。

  講話模型是一個代表講話者聲音特性的數(shù)字矩陣。無需為鑒別保存音頻樣本。每個講話模型約占20K的存儲量,加密存儲在標(biāo)準(zhǔn)數(shù)據(jù)庫中,如ORACLE或ODBC兼容的數(shù)據(jù)庫。由于它們不是音頻文件,即使被偷竊,也不能重播,以獲得非法進(jìn)入系統(tǒng)。

鑒別處理

  Nuance Verifier 通過將呼叫者的語音和登記的講話模型及通過組合其他講話者創(chuàng)建的冒名頂替者模型進(jìn)行比較,來鑒別呼叫者。比較后產(chǎn)生一個分值,根據(jù)由開發(fā)商確定、特定應(yīng)用軟件中設(shè)定的閥值和參數(shù),確定用戶的語音是否象講話模型(接受)還是冒名頂替者模型(拒絕)。

  下圖說明了Nuance軟件的處理流程。語音前端處理后,分類器將講話者的語音特性和有關(guān)的講話者和冒名頂替者模型進(jìn)行比較,產(chǎn)生分值。

  應(yīng)用系統(tǒng)的用戶數(shù)量對應(yīng)用的性能沒有影響。對不同應(yīng)用系統(tǒng)和用戶數(shù)均有是一貫的性能。

準(zhǔn)確性基準(zhǔn)

  生物統(tǒng)計上的準(zhǔn)確性常常在一條映射兩種可能校驗結(jié)果的曲線上進(jìn)行測量:

  這些錯誤和兩種不同的用戶群有關(guān)。特別是,比如,0.2%的誤接納率,并不意味著0.2%的呼叫者能闖入系統(tǒng),而是0.2%的冒名頂替者企圖闖入。這比例往往只是呼叫者總數(shù)的一個零頭。安全性和方便性須得到折衷平衡。當(dāng)誤接納率接近零時,誤拒絕率則上升,反之亦然。曲線上誤接受和誤拒絕率相等的點叫等錯率(ERR)。

  使用Verifier ,用戶可在曲線上選取符合其特定應(yīng)用準(zhǔn)確性要求的點。如果,不給系統(tǒng)合法用戶造成不便這一點是至關(guān)重要的話,那么,可將誤拒絕率設(shè)低些,但同時卻增加了誤接納的可能性。該作用點可根據(jù)應(yīng)用系統(tǒng)的安全需要、實用性要求和實施后的性能分析進(jìn)行調(diào)整。

  當(dāng)比較生物統(tǒng)計方案的準(zhǔn)確性級別時,理解影響準(zhǔn)確性的變量至關(guān)重要。必須先了解這些變量、所引用的測試與實際處理的接近程度后,才能作性能評估。對聲紋鑒別,準(zhǔn)確率是下列因素的函數(shù):

 選擇的登記/測試方案(例如自定義密碼、完全隨機(jī)數(shù)字、半隨機(jī)數(shù)字、背景語音等)

  Nuance公司設(shè)立了一個研發(fā)小組,專門負(fù)責(zé)保證Verifier 具有最新的技術(shù)、最高的準(zhǔn)確率和最具實用性,從在用的系統(tǒng)中獲得經(jīng)驗和數(shù)據(jù),用于不斷進(jìn)行技術(shù)改進(jìn)。同時,由于Nuance公司具有世界上最多的聲紋鑒別用戶,它對實用條件下的聲紋鑒別擁有豐富的經(jīng)驗。

  下列章節(jié)列出Verifier 的主要特性, 這些特性使Verifier 成為目前最準(zhǔn)確的聲紋鑒別軟件。

交叉信道下的性能健壯性

  當(dāng)用戶登記時采用的信道(如電介體電話、碳鍵、移動電話等)、以及在不同的信道進(jìn)行校驗時,信道不匹配現(xiàn)象對任何聲紋鑒別系統(tǒng)均是最具挑戰(zhàn)性的。電介體和碳鍵固定電話聽筒的微小差異都會對性能造成影響。而對于大行其道的移動電話,交叉信道在實際應(yīng)用中也非常普遍。

  Nuance技術(shù)擅長處理交叉信道情況。Nuance經(jīng)過對該領(lǐng)域的精心研究,已經(jīng)開發(fā)出處理這類問題的有效方法,并已獲得專利。由于這些技術(shù),Verifier 的性能大大超過其它商業(yè)產(chǎn)品及研究機(jī)構(gòu)研制的系統(tǒng)。

可變長度校驗

  校驗過程中收集的數(shù)據(jù)量對性能有很大影響。校驗過程收集的數(shù)據(jù)越多,準(zhǔn)確性就越高。但是,要求用戶每次呼叫時講話更長會降低系統(tǒng)的實用性,增加呼叫的時間。另外,在多數(shù)實用系統(tǒng)中,90%的錯誤來自10%的呼叫者,因此,難題在于處理10%的難點呼叫者而又不影響其它的90%。

  Nuance Verifier 使用可變長度校驗來解決這個矛盾。Verifier 自動檢測難點呼叫(由信道或者語音特性引起),并請求額外信息,然后才允許進(jìn)入。其它呼叫則由一句話可鑒別。

  變長校驗所需的校驗話語的數(shù)量最少,而準(zhǔn)確性最高。定長校驗則不同,它處理固定數(shù)量的話語,然后以此為依據(jù)做出決定;變長校驗在下列情況下停止對話語進(jìn)行校驗:

  變長校驗要求處理的語句更少,而且對有些應(yīng)用,用一句話可能已經(jīng)足夠鑒別用戶。結(jié)果提高了方便性、降低了成本,因為呼叫的時間更短了。使用變長校驗后平均校驗時間減少30%以上。

適應(yīng)性和個性化

  Verifier 能提供無需監(jiān)守的在線適應(yīng)功能,在應(yīng)用系統(tǒng)使用后,能不斷更新講話模型、更有效地捕捉用戶語音特性。利用在線適應(yīng)功能,一旦講話者經(jīng)校驗,其講話將用于豐富其講話模型。不同背景噪音和不同信道下的講話者語音特性均被獲取。這個功能顯著地提高了應(yīng)用系統(tǒng)的性能,特別是在交叉信道情況下。系統(tǒng)使用越多,性能則越好。使用在線適應(yīng)功能后可望降低50%的等錯率。

  Nuance Verifier 將適應(yīng)功能這一概念推進(jìn)了一步,允許對系統(tǒng)的各個用戶設(shè)置鑒別閥值、然后對閥值進(jìn)行調(diào)節(jié)(而不是對實際的講話模型進(jìn)行調(diào)節(jié))。這樣可以在保障系統(tǒng)安全的同時,進(jìn)行更深程度的個性化和適應(yīng)能力。

增加安全性的知識校驗

  由于集成了語音識別,Nuance Verifier 能根據(jù)用戶的語音和用戶對個人密碼和其它信息的了解程度對用戶身份進(jìn)行校驗。識別用于理解語音內(nèi)容,鑒別用于校驗講話者的語音,兩者結(jié)合起來能提供額外的保密性。

  下圖說明了生物統(tǒng)計聲紋鑒別和知識校驗的結(jié)合產(chǎn)生的增強(qiáng)效果。這種集成系統(tǒng)的保密級別由下列因素決定:

(聲紋鑒別被誤接納的概率) * (知識校驗被誤接納的概率)

  在少數(shù)情況下,合法用戶可能被生物統(tǒng)計上的校驗拒絕,但會被詢問個人信息方面。詢問的結(jié)果用于核準(zhǔn)呼叫者的有效性,同時調(diào)整講話模型以改善下次通話的性能。類似地,詢問個人信息可防止冒名頂替,因為僅僅根據(jù)其語音,他們中的少數(shù)還是可能被系統(tǒng)接納。

經(jīng)實際使用證明,具有極高的準(zhǔn)確性

  Nuance Verifier 的準(zhǔn)確性已經(jīng)被在用中的系統(tǒng)所證實。家庭購物網(wǎng)絡(luò)(HSN)、Schwab和Mitel等客戶現(xiàn)均使用Verifier,為客戶提供保密、個性化的交易和信息服務(wù)。利用Nuance技術(shù),客戶在實際條件下,可取得0.1%以下的誤接納率和95%以上的呼叫成功率。這些均包含了背景噪音、移動電話和交叉信道的情況。這些基準(zhǔn)只對純聲紋鑒別,沒有知識校驗和在線適應(yīng)功能。前面已經(jīng)提到,在線適應(yīng)功能可明顯改善性能。

軟件實施及其性能

Nuance的客戶/服務(wù)機(jī)軟件結(jié)構(gòu)

  Nuance Verifier 可作為Nuance語音識別客戶/服務(wù)機(jī)軟件的整體的一個部分。Nuance采取開放、純軟件方案,可在各種操作系統(tǒng)下運行。在實施中,它一般作為交互語音響應(yīng)(IVR)平臺的一個或一組服務(wù)器。

  Nuance的客戶/服務(wù)機(jī)體系可靠、可伸縮,對計算資源有最優(yōu)的利用。下圖是Nuance系統(tǒng)體系的概況圖。

  和Nuance的識別軟件的緊密集成,為同時利用兩種技術(shù)的應(yīng)用(如大多數(shù)講話者鑒別應(yīng)用)提供了最清晰、最具伸縮性和最可靠的系統(tǒng)結(jié)構(gòu)。系統(tǒng)開發(fā)商無需為在單一的應(yīng)用中集成無關(guān)聯(lián)的語音識別和講話者鑒別方案而對性能、效率和功能作折衷處理。

實施平臺選擇

  Nuance Verifier 可用于各種IVR平臺和操作系統(tǒng)。操作系統(tǒng)包括NT、Unix、Solaris Sparc、UnixWare、HP-UX 和 AIX,IVR平臺包括Periphonics、Syntellect、Edify、IBM DirectTalk、Aspect、Prima、Interactive Intelligence、Parity、Intervoice 和 Nuance Base。Nuance公司有全部IVR平臺的清單。

實地測試的軟件

  Nuance是會話式交易的語音識別和自然語言理解軟件的應(yīng)用先驅(qū),其軟件及實施路徑是市場上最成熟、最久經(jīng)考驗的。Nuance具有全球最大的聲紋鑒別應(yīng)用用戶家庭購物網(wǎng)絡(luò)。家庭購物網(wǎng)絡(luò)目前有41萬的登記客戶, 而且正迅速接近500萬。

吞吐量

  Nuance Verifier 對登記和鑒別處理的執(zhí)行速度大約是實際速度的10倍,從而使用戶響應(yīng)時間和系統(tǒng)伸縮性不會成為問題。

  登記和訓(xùn)練處理過程不存在延遲,呼叫者可立即使用系統(tǒng)。和其它聲紋鑒別技術(shù)不同的是,Nuance Verifier 在需要時,允許用戶在同一個通話中,登記完語音后立即進(jìn)行校驗。除了具有實用性的優(yōu)點,更顯示了Nuance Verifier 的處理效率。

  鑒別測試處理在計算要求方面等效于小詞匯量的識別處理,因此可取得相當(dāng)高的密度。單CPU服務(wù)器(Nuance RecServer)支持的具體交易密度是關(guān)于很多變量的函數(shù),包括服務(wù)器用于執(zhí)行語音識別的程度、使用的CPU的性能、應(yīng)用系統(tǒng)的運行周期、實施的測試/登記方案。

講話模型的存儲

  聲紋或講話模型是代表講話者語音特性的數(shù)字矩陣。無需為執(zhí)行校驗存儲音頻樣本。

  講話模型需要約20K的壓縮存儲空間。講話模型加密保存在標(biāo)準(zhǔn)的數(shù)據(jù)庫中。Nuance支持Oracle及兼容ODBC的數(shù)據(jù)庫。由于講話模型(聲紋)保存在獨立的數(shù)據(jù)庫中,用戶數(shù)量增長不受限制。

結(jié)論

  為了提供方便、高價值的電子服務(wù),各個公司需要可用、易用和安全的應(yīng)用方案。他們同時要求這些方案的結(jié)構(gòu)必須靈活、開放和具有伸縮性。Nuance Verifier 是唯一能滿足所有這些要求的聲紋鑒別解決方案。通過將Nuance Verifier 和Nuance的語音識別軟件緊密集成,Nuance公司為保密商務(wù)和通訊交易提供了更高的實用性、準(zhǔn)確性和更高的性能。

Nuance公司簡介

  Nuance公司是自然語音接口軟件的佼佼者。使用自然語音接口軟件,人們可以通過電話方便安全地獲取信息、服務(wù)并進(jìn)行交易。每天,千千萬萬的人通過撥打運行Nuance公司語音識別、語言理解和聲紋鑒別軟件的電話,進(jìn)行出游預(yù)訂、股票交易、與其它通訊媒體、企業(yè)和互聯(lián)網(wǎng)系統(tǒng)進(jìn)行交往等活動。美國航空、Bell Atlantic、Charles Schwab、家庭購物網(wǎng)絡(luò)、Lloyds TSB、Sears、UPS等大公司使用Nuance的軟件來為客戶提供更好的服務(wù),同時也大幅度降低了成本。Nuance公司是語音商務(wù)聯(lián)盟的發(fā)起成員,并領(lǐng)導(dǎo)創(chuàng)建了語音應(yīng)用程序開發(fā)的開放標(biāo)準(zhǔn)。Nuance公司的總部設(shè)在加州硅谷的Menlo Park,世界各地均有分部和合作伙伴,提供多語種支持的解決方案。來體驗Nuance公司最新的技術(shù)吧,請打電話1-888-NUANCE-8或瀏覽公司的網(wǎng)址www.nuance.com。

NDN - Nuance開發(fā)商網(wǎng)絡(luò)

  Nuance Developer Network (NDN - Nuance開發(fā)商網(wǎng)絡(luò)) 是語音識別行業(yè)第一個開發(fā)商網(wǎng)絡(luò),它向成員提供最新的產(chǎn)品發(fā)布信息、培訓(xùn)、在線技術(shù)論壇,以及和其它開發(fā)商進(jìn)行想法和方案共享的機(jī)會。通過www.nuance.com or extranet.nuance.com 網(wǎng)址,可以下載最新的Nuance產(chǎn)品和工具。

Nuance公司供稿 CTI論壇編輯



相關(guān)鏈接:
Nuance發(fā)布Vocalizer 5.0文本語音轉(zhuǎn)換方案 2009-09-04
化繁為簡,讓手機(jī)“一切行動聽指揮” 2009-08-13
Nuance語音識別技術(shù)助力醫(yī)學(xué)中心節(jié)省開支 2009-08-12
Nuance攜手IBM提供先進(jìn)的語音識別解決方案 2009-08-05
Nuance語音識別技術(shù)將進(jìn)軍中國 2009-06-17