首頁>>廠商>>CTI系統(tǒng)平臺廠商>>北京欣方

發(fā)表評論分享按鈕

語音識別技術(shù)在自動(dòng)外呼和洗號系統(tǒng)的應(yīng)用與優(yōu)勢

2011/07/18

摘要

  隨著呼叫中心系統(tǒng)呼出業(yè)務(wù)量的不斷增多,正確識別號碼狀態(tài),提高撥號效率已經(jīng)成為外呼型呼叫中心需要解決的重要問題。本文首先介紹了號碼識別在自動(dòng)外呼和洗號系統(tǒng)中的意義,接著分析了信令分析檢測方式的不足,進(jìn)而提出一種基于語音識別技術(shù)的外呼系統(tǒng),并闡述了語音識別技術(shù)在提高工作效率及降低成本上的優(yōu)勢及意義。

關(guān)鍵詞:呼叫中心;自動(dòng)外呼;洗號;語音識別;

1.引言

  隨著呼叫中心市場的不斷成熟,呼入型業(yè)務(wù)基本飽和,通過電話由坐席主動(dòng)對客戶進(jìn)行拜訪和推銷產(chǎn)品的呼出型業(yè)務(wù)正逐步成為贏得客戶的關(guān)鍵手段。而如何對外呼號碼進(jìn)行準(zhǔn)確識別和篩選(“洗號”),以通過提高撥號效率來提升營銷利潤,已經(jīng)成為迫在眉睫的問題。

  現(xiàn)有的自動(dòng)外呼及洗號系統(tǒng)中的號碼識別方法一般是通過信令處理等技術(shù)來實(shí)現(xiàn),而基于信令檢測的方式在準(zhǔn)確性和效率保證上又存在嚴(yán)重的問題。

  為了提高號碼識別的準(zhǔn)確性與效率,提出了一種基于語音識別技術(shù)的號碼識別方法,可應(yīng)用于自動(dòng)外呼和洗號系統(tǒng)。該方法通過與信令檢測方法相結(jié)合,可使自動(dòng)外呼和洗號系統(tǒng)中的語音識別準(zhǔn)確率達(dá)到95%以上;有效解決了傳統(tǒng)外呼和洗號系統(tǒng)中現(xiàn)存的弊端,很大程度上提高了撥號效率,從而達(dá)到了提高呼叫中心效益的目的。

2.自動(dòng)外呼和洗號系統(tǒng)

  自動(dòng)外呼系統(tǒng)是一個(gè)自動(dòng)執(zhí)行企業(yè)用戶定制的外呼任務(wù)的系統(tǒng)。它執(zhí)行的特點(diǎn)是系統(tǒng)根據(jù)座席狀態(tài)和算法策略對指定號碼集自動(dòng)發(fā)起呼叫,通過分析呼叫過程中的信令和信號,對呼叫采取合適的處理。具體處理方法為:當(dāng)呼叫接通時(shí),系統(tǒng)將呼叫轉(zhuǎn)接給座席;若用戶未接通,則繼續(xù)呼叫下一個(gè)號碼,同時(shí)代替座席記錄當(dāng)前呼叫的狀態(tài)。

  洗號系統(tǒng)也是自動(dòng)外呼系統(tǒng)的一個(gè)重要應(yīng)用,其原理是系統(tǒng)提前將雜亂的號碼試呼一遍,清除一些無效號碼,如空號、停機(jī)、欠費(fèi)、格式錯(cuò)誤等,以此來提高外呼效率。

  值得注意的是,自動(dòng)外呼和洗號系統(tǒng)都需要通過號碼識別來確定所呼號碼的狀態(tài),系統(tǒng)的效率很大程度上取決于其對號碼的識別能力。然而,目前常見的號碼狀態(tài)分為多種類型:
  1. 號碼不可用(空號,停機(jī),欠費(fèi),地址不全等);

  2. 暫時(shí)不可用(關(guān)機(jī),不在服務(wù)中,通話中等);

  3. 可用(無應(yīng)答,被叫忙等)、自動(dòng)應(yīng)答號碼(傳真、企業(yè)總機(jī)等)。
  由于三大運(yùn)商營對如此繁多的號碼狀態(tài)未作統(tǒng)一標(biāo)準(zhǔn),加上信令檢測方式存在很多弊端,使得對號碼的識別具有相當(dāng)大的挑戰(zhàn)。首先,錯(cuò)誤的識別會(huì)導(dǎo)致部分?jǐn)?shù)據(jù)的丟失,使企業(yè)失去一些潛在用戶,直接導(dǎo)致利益損失。其次,識別速度過慢,不但影響系統(tǒng)的整體效率,還會(huì)影響座席人員的工作熱情,這也成為了提高企業(yè)利潤的瓶頸。因此,如何對號碼進(jìn)行正確、高效的識別是當(dāng)前要解決的關(guān)鍵問題,這也使得對號碼識別方式的研究具有了現(xiàn)實(shí)意義。

3.號碼識別方式分析

  在實(shí)際網(wǎng)絡(luò)中,表示被叫用戶狀態(tài)有三種方式:標(biāo)準(zhǔn)Tone音、提示音和7號信令。每種方式又可細(xì)分為多種表現(xiàn)形式:

  標(biāo)準(zhǔn)的Tone音:振鈴音,忙音,空號,不可達(dá)音等,這種方式在固定網(wǎng)中比較常見。

  提示音:“該號碼不存在”,“該號碼是空號”,“該號碼已停機(jī)”等。通過提示音來顯示當(dāng)前被叫用戶狀態(tài)多發(fā)生在移動(dòng)網(wǎng)絡(luò)中。

  7號信令。在呼叫釋放的信令(releasecall),會(huì)帶釋放原因:“Unallocated Num”“user busy”等,也常被移動(dòng)網(wǎng)絡(luò)采用。

  目前自動(dòng)外呼和洗號系統(tǒng)主要采用信令分析、語音識別技術(shù)(包括檢測音頻)等進(jìn)行號碼識別和篩選。下面將對幾種檢測方式進(jìn)行詳細(xì)說明。

  3.1 信令檢測方式分析

  一般情況下,號碼識別需根據(jù)當(dāng)前呼叫失敗的原因來判斷,因此,通常會(huì)利用呼叫過程中產(chǎn)生的信令來檢測。然而這種檢測方式存在嚴(yán)重的準(zhǔn)確性和效率問題,不能滿足呼叫中心自動(dòng)外呼和洗號的功能要求。

  首先,采用這種方式進(jìn)行檢測準(zhǔn)確性差。其原因是:在中國三大運(yùn)營商現(xiàn)網(wǎng)中,反映被叫用戶的狀態(tài)沒有統(tǒng)一的標(biāo)準(zhǔn)。甚至同一個(gè)運(yùn)營商的同一個(gè)本地網(wǎng)都會(huì)出現(xiàn)不相同的情況。標(biāo)準(zhǔn)的不統(tǒng)一,為信令的檢測造成了困難,經(jīng)常出現(xiàn)號碼狀態(tài)無法識別、錯(cuò)誤識別的情況。

  其次,采用信令檢測方式效率低下,由于PSTN普遍實(shí)施了呼叫失敗后語音提示的人性化功能,語音提示時(shí)長可達(dá)60秒,然后才發(fā)送信令。這樣嚴(yán)重影響了信令檢測的效率。

  下例為對河北移動(dòng)某呼叫中心自動(dòng)外呼系統(tǒng)的信令測試結(jié)果分析(該系統(tǒng)使用的交換機(jī)為Dialogic IMG1010網(wǎng)關(guān),信令方式為ISUP):

  表1:信令號碼識別測試


  從歸納的情況看,只有無應(yīng)答和地址不全兩種情況是可靠信令分析來識別的,其他的5種情況都無法通過信令檢測識別。特別是暫時(shí)無法接通的語言提示,播放完提示音有3種不同的信令,應(yīng)該是屬于不同的情況,但是放了相同的語音。因此造成號碼識別錯(cuò)誤的現(xiàn)象。

  綜上,信令分析檢測方式,對于釋放7號信令來表示用戶狀態(tài)的情況是十分有效的。但是,該方式不具備區(qū)分標(biāo)準(zhǔn)Tone音和提示音的能力,同時(shí)效率低下。要準(zhǔn)確、高效的判斷用戶的當(dāng)前狀態(tài),必須要通過一種更為準(zhǔn)確可靠的方式——語音識別。

  3.2 語音識別檢測方式分析

  現(xiàn)有PSTN網(wǎng)絡(luò)普遍實(shí)施了呼叫失敗后語音提示或tone音的人性化功能,由于這些tone音和失敗提示音都是在臨時(shí)話路中播放的,因此信令的方式無法區(qū)分這兩種場景。但是語音識別技術(shù)恰恰是利用了這個(gè)特點(diǎn),對語音提示或tone音進(jìn)行快速的語音識別與匹配,在精確識別號碼的同時(shí),提升了識別的速率。

  首先,采用語音識別技術(shù)可幫助自動(dòng)外呼和洗號系統(tǒng)提高號碼識別的準(zhǔn)確率。系統(tǒng)通過語音匹配將相同信令的呼叫區(qū)分,幫助洗號系統(tǒng)正確的識別可用號碼,同時(shí)還能幫助自動(dòng)外呼系統(tǒng)正確的記錄座席呼叫狀態(tài),避免了因錯(cuò)誤識別而導(dǎo)致數(shù)據(jù)丟失的情況發(fā)生。

  其次,語音識別技術(shù)還可以幫助自動(dòng)外呼和洗號系統(tǒng)實(shí)現(xiàn)高效識別。系統(tǒng)通過特征和關(guān)鍵字匹配的方式,在幾秒鐘內(nèi)就能完成語音匹配,幫助自動(dòng)外呼系統(tǒng)真正的提高了座席工作效率;同樣也幫助洗號系統(tǒng)提高了效率,使其以更少的設(shè)備投入獲得更好的效益。

  綜上,采用語音識別技術(shù),進(jìn)行模式匹配,可以精確、高效的識別號碼狀態(tài),彌補(bǔ)了信令檢測方式的不足。但是語音識別技術(shù)也存在一些難點(diǎn),例如,樣本庫的建立、方言識別以及提高識別效率等等。這些技術(shù)難點(diǎn)也成為了語音識別檢測方式需要解決的重要問題。

4.語音識別技術(shù)的應(yīng)用

  4.1 基本原理

  語音識別技術(shù)就是讓機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。它可用于對用戶呼叫失敗的情況進(jìn)行自動(dòng)分類。

  我們采用的語音識別技術(shù)主要靠匹配方式來進(jìn)行,分成Tone音匹配、AM音匹配和人類自然語音檢測三部分。具體流程圖如下:

語音處理流程圖

圖:語音處理流程圖

(VAD: Voice Activity Detection;LV: Live Speech;AM: Answering Machine)

  圖中,Tone音匹配采用模式匹配方法,可以實(shí)現(xiàn)對振鈴音,忙音,空號,不可達(dá)音等100多種標(biāo)準(zhǔn)提示音的識別。AM(Answering Machine)音匹配主要負(fù)責(zé)識別傳真機(jī)、自動(dòng)答錄機(jī)等機(jī)器語音,同樣采用模式匹配方法,將收到的語音與標(biāo)準(zhǔn)樣本庫進(jìn)行比對。人類自然語音檢測的功能主要通過人真實(shí)聲音的檢測,來判斷是否需要進(jìn)行語音匹配。

  4.1.1 標(biāo)準(zhǔn)Tone音匹配

  Tone音匹配采用的是模式匹配方法,將模擬語音信號轉(zhuǎn)換為數(shù)字信號,再同音庫中的樣本進(jìn)行比對,實(shí)現(xiàn)號碼狀態(tài)識別。

  在標(biāo)準(zhǔn)Tone音匹配模塊里,因?yàn)槟承﹩晤lTone音的頻率區(qū)間和DTMF之間存在重疊,為了避免不必要的混淆,采取順序檢測,即首先檢測是否是DTMF,再檢測是否是單頻的Tone音。

  Tone音的一個(gè)顯要特點(diǎn)是在頻域上的某一個(gè)子帶上的能量特別強(qiáng),而且這種情況是在后續(xù)所有非靜音的連續(xù)幀上都是持續(xù)的(如圖1所示);诖颂攸c(diǎn),我們采用以下方法:

  1.取第一幀非靜音幀的16個(gè)子帶能量特征,求出其最大子帶能量所在的子帶序號(在DTMF階段是取最大的兩個(gè)子帶序號)。
  2.如果最大能量值所在的子帶序號一直保持若干幀不變,則我們認(rèn)為從頻率角度滿足了作為一個(gè)Tone音的基本條件。

  由于DTMF不存在時(shí)間持續(xù)長短的相關(guān)信息,所以經(jīng)過上述步驟后,只需將最大能量的兩個(gè)序號在事先準(zhǔn)備好的DTMF子帶序號表里查找即可得出結(jié)論,對于檢測DTMF顯然已經(jīng)足夠。但由于單頻的Tone音還存在持續(xù)時(shí)間長短及靜音間歇的問題,故對于輸入的信號,經(jīng)過前端數(shù)據(jù)處理過程之后,要利用它是否靜音幀的信息統(tǒng)計(jì)各段長度,最后,同時(shí)考慮頻率和時(shí)間段列表,如果滿足庫中某一條的相關(guān)標(biāo)準(zhǔn),才認(rèn)為是一個(gè)標(biāo)準(zhǔn)Tone音。

  4.1.2 AM音匹配

  AM音匹配同樣采用模式匹配方法,對語音信號進(jìn)行采樣、量化、歸一化處理后,將模擬語音信號轉(zhuǎn)變?yōu)閿?shù)字語音信號。再與庫文件中的特征模板進(jìn)行比較,選擇出最為相近的一條作為匹配結(jié)果返回。

  假設(shè)模板庫里的特征條目的時(shí)長應(yīng)該至少是一個(gè)完整的AM音模板,因此從時(shí)間長度上來看,輸入的待檢測語音長度應(yīng)小于模板里的最佳匹配項(xiàng)。

  不像Tone音檢測模塊中使用的是各幀在前端處理過程中產(chǎn)生的16個(gè)子帶上的能量具體值,這里使用的特征卻是經(jīng)過歸一化后的二進(jìn)制向量。如果要比較的兩幀特征向量分別設(shè)為:


  其中, 指異或操作,而函數(shù) 是求二進(jìn)制向量里“1”的個(gè)數(shù)。

  然后,如果輸入語音樣本的幀數(shù)目為 ,則總距離定義為相應(yīng)的 幀距離的和。

  至于要得到這條語音樣本與特征庫里某個(gè)模板的最小距離,比較傳統(tǒng)的方法是用這待匹配的 幀同模板的開始處 幀算距離,然后將待匹配音順次后移,一直到末端為止,得到的最小距離就是這個(gè)輸入樣本同這一模板的距離。然后,在實(shí)際實(shí)現(xiàn)過程中,因?yàn)閷λ惴ㄐ阅芤蟊容^高,可以考慮加入不同的索引而達(dá)到減小計(jì)算次數(shù)的目的。索引的種類和方法不一而足,在此就不再贅述了。

  4.1.3 自然語音(Live Speech)檢測

  該部分的主要功能是利用人類自然語音特有的一些規(guī)律進(jìn)行啟發(fā)式判斷,從而確定是否需要進(jìn)入Tone音或AM音識別流程。該部分采用的規(guī)律如下:

  A.如果正式語音之前的靜音段超過某一閾值,則認(rèn)為是人類自然語音
  B.如果問候語過長,時(shí)間上超過某一閾值,則認(rèn)為是應(yīng)答機(jī)錄音。
  C.如果問候語之后的靜音段過長以至于超過某個(gè)門限,則認(rèn)為是人類自然語音。
  D.如果問候語中的詞語數(shù)目過多,則認(rèn)為是應(yīng)答機(jī)錄音。

  除此之外,我們還設(shè)定了一個(gè)檢測最大時(shí)間,如果超過這一時(shí)間還沒有一個(gè)檢測結(jié)果,則返回一個(gè)“無法判斷”的結(jié)果。

  最后,相關(guān)參數(shù)、時(shí)間以及判斷結(jié)果的關(guān)系如圖所示:

人類自然語音情況下各參數(shù)相對于時(shí)間軸的說明

圖:人類自然語音情況下各參數(shù)相對于時(shí)間軸的說明

自動(dòng)應(yīng)答機(jī)錄音情況下各參數(shù)相對于時(shí)間軸的說明

圖:自動(dòng)應(yīng)答機(jī)錄音情況下各參數(shù)相對于時(shí)間軸的說明

5.產(chǎn)品與應(yīng)用

  根據(jù)以上語音識別的方法,設(shè)計(jì)了基于語音識別技術(shù)的自動(dòng)外呼和洗號系統(tǒng)。以下部分將對該產(chǎn)品的框架及模塊進(jìn)行介紹。

  5.1 技術(shù)架構(gòu)

系統(tǒng)技術(shù)架構(gòu)

圖:系統(tǒng)技術(shù)架構(gòu)

  上圖為基于語音識別的自動(dòng)外呼和洗號系統(tǒng)的技術(shù)架構(gòu),由接入部分和平臺部分組成。其中終端為接入部分,提供包括PSTN傳統(tǒng)交換機(jī)、NGN軟交換和內(nèi)部分機(jī)終端等多種網(wǎng)絡(luò)和終端的接入能力。平臺部分由ACD、CTI和MS等節(jié)點(diǎn)組成,提供呼叫中心語音接入、控制、管理和路由等功能。

  ACD是呼叫中心的核心控制系統(tǒng),主要負(fù)責(zé)呼叫中心信令、呼叫與控制節(jié)點(diǎn),負(fù)責(zé)信令識別。支持呼叫中心業(yè)務(wù)觸發(fā)到CTI。

  CTI提供座席資源管理和排隊(duì)、路由策略,支持座席接入,同時(shí)支持MS的訪問。

  MS(Media Server,媒體服務(wù)器)是NGN架構(gòu)中提供所有媒體資源的設(shè)備,是呼叫中心媒體匯聚與統(tǒng)一處理點(diǎn),所有的媒體資源處理都有MS來完成,包括IVR、DTMF、會(huì)議、錄音、傳真等。在媒體服務(wù)器上加入語音識別模塊,對收到的RTP語音流進(jìn)行實(shí)時(shí)的匹配和識別。

  MS中新增加的語音識別模塊,由前端語音數(shù)據(jù)處理模塊、數(shù)據(jù)管理模塊、標(biāo)準(zhǔn)Tone音匹配模塊、人類自然語音檢測模塊、AM音匹配模塊五部分組成,共同完成語音識別檢測。其模塊組成如下:

語音識別的模塊組成

圖:語音識別的模塊組成

  前端語音數(shù)據(jù)處理模塊,用來對語音進(jìn)行預(yù)處理和特征提取。數(shù)據(jù)管理模塊,主要工作為建庫。標(biāo)準(zhǔn)Tone音匹配模塊,匹配標(biāo)準(zhǔn)Tone音。人類自然語音(Live Speech)檢測模塊,進(jìn)行人類真實(shí)接聽語音的判斷。AM音匹配模塊,從庫中匹配合適的模板音和判斷是否為庫外音。

  該模塊負(fù)責(zé)進(jìn)行語音識別的第一步:預(yù)處理和特征提取。該模塊在模塊處理中的地位非常重要,對于數(shù)據(jù)管理模塊來說,AM庫文件的每一條內(nèi)容是經(jīng)過前段語音數(shù)據(jù)處理以后的特征;而后面的三個(gè)檢測或匹配模塊都是建立在前端數(shù)據(jù)處理以后的數(shù)據(jù)基礎(chǔ)之上的。因此,前端語音數(shù)據(jù)處理的方法和所選用的特征對于檢測或匹配的準(zhǔn)確率和算法的效率都至關(guān)重要。

  本模塊的核心工作是對給定的Tone音標(biāo)準(zhǔn)和AM模板音庫進(jìn)行分析和特征提取,并存成相應(yīng)的特征庫文件。特征庫主要分為Tone庫和AM庫,其建立過程如下:

  A.Tone庫

  Tone庫的建立過程比較簡單。因?yàn)橛屑榷ǖ臉?biāo)準(zhǔn),不需要從模板文件中讀取再生成。所以,采用的方法是直接從記錄有標(biāo)準(zhǔn)Tone音標(biāo)準(zhǔn)的文本文件中逐條逐項(xiàng)讀取,然后依樣存成二進(jìn)制庫文件Tone.dat。

  B.AM庫

  AM庫的建立過程比Tone音庫稍微復(fù)雜一些,原因是要經(jīng)過從相應(yīng)的pcm文件模板進(jìn)行分析和提取特征的過程,因此就多了一個(gè)前端語音數(shù)據(jù)處理模塊。存入庫中的信息包括模板ID號、是否靜音幀、模板幀數(shù)目、FFT特征序列以及歸一化后的特征序列。歸一化前的特征序列會(huì)用于tone音檢測模塊,而歸一化后的特征序列用于AM匹配。

  該模塊的功能是進(jìn)行標(biāo)準(zhǔn)Tone音匹配。該系統(tǒng)采取的是順序檢測,即首先檢測是否是DTMF,再檢測是否是單頻的Tone音。

  該模塊負(fù)責(zé)判斷人類真實(shí)語音。人類自然語音檢測在三個(gè)檢測或匹配模塊中是最難處理的一塊。因?yàn)楸举|(zhì)上說,自動(dòng)應(yīng)答機(jī)的話音也是人通過錄音機(jī)事先錄好的,所以從聲學(xué)層次并不能有效地將它們區(qū)分開。該系統(tǒng)利用人類自然語音特有的一些規(guī)律進(jìn)行啟發(fā)式判斷,來進(jìn)行人類語音的識別。

  AM音匹配模塊的主要任務(wù)是將輸入的語音經(jīng)過處理后,與庫文件中的特征模板進(jìn)行比較,選擇出最為相近的一條作為匹配結(jié)果返回。若經(jīng)過與所有的特征模板都進(jìn)行比較后得出的最小距離仍然大于某一個(gè)門限值,則認(rèn)為輸入語音是庫外音。

  同時(shí),該系統(tǒng)還通過提取各地不同網(wǎng)絡(luò)、運(yùn)營商的提示音庫,建立了一個(gè)龐大的樣本庫。目前該系統(tǒng)已擁有三大運(yùn)營商、30多個(gè)省市的近300個(gè)樣本庫,可根據(jù)項(xiàng)目需要靈活加載部署,從而解決了方言識別的問題。

  5.2 平臺架構(gòu)

  基于語音識別技術(shù)的自動(dòng)外呼和洗號系統(tǒng)主要由管理應(yīng)用、外呼與庫模塊、號碼與識別模塊三部分組成。每部分的功能如下:

系統(tǒng)組成

圖:系統(tǒng)組成

  5.2.1 管理應(yīng)用

  該部分由任務(wù)管理、號碼管理、提示音管理、自學(xué)系統(tǒng)四部分組成,任務(wù)管理負(fù)責(zé)創(chuàng)建洗號任務(wù),選擇號碼庫,設(shè)置時(shí)間速率等。號碼管理可以實(shí)現(xiàn)包括號碼導(dǎo)入導(dǎo)出,未洗號碼、已洗號碼分類檢查,重聽錄音等功能。提示音導(dǎo)入導(dǎo)出,試聽檢測靠提示音管理來進(jìn)行。自學(xué)習(xí)系統(tǒng)能對不能識別號碼進(jìn)行人工干預(yù)和二次識別,將提示音加入庫,從而保證了提示音樣本庫的不斷增長。

  5.2.2 外呼與庫模塊

  該部分由自動(dòng)外呼模塊、號碼庫、錄音庫、提示音庫四部分組成。自動(dòng)外呼模塊:按指定速率進(jìn)行外呼,并將呼叫結(jié)果保存入庫。號碼庫用來保存各種號碼資源,特別是有效號碼,包括移動(dòng)號碼(聯(lián)通、移動(dòng)、電信),固定號碼(電信、聯(lián)通)。提示音庫樣本庫覆蓋了各地、運(yùn)營商及網(wǎng)絡(luò)。錄音庫可對洗號結(jié)果進(jìn)行錄音,還可用于人工抽查,并且可進(jìn)行二次分析和自學(xué)習(xí),提供增值能力。

  5.2.3 呼叫與號碼識別模塊

  該部分由CTI、ACD、MS三部分組成,也是系統(tǒng)的主要組成部分。CTI負(fù)責(zé)指示ACD發(fā)起外呼,上報(bào)結(jié)果。ACD控制信令檢測,而MS負(fù)責(zé)提供語音導(dǎo)航和自動(dòng)服務(wù)功能,可解析執(zhí)行來實(shí)現(xiàn)語音交互能力,是完成語音識別的主要部分。

  5.3 基于語音識別的號碼識別流程

  下圖為該產(chǎn)品基于語音識別的號碼識別流程,具體洗號流程如下圖:

基于語音識別的洗號流程

圖:基于語音識別的洗號流程

  洗號流程發(fā)生在呼叫建立過程中,如果存在臨時(shí)話路(彩鈴、tone音、各種識別提示音等情況),則進(jìn)入到語音識別過程。具體:

  1. 系統(tǒng)發(fā)起呼叫,根據(jù)返回的信令確定下一步處理流程

  2. 如果是200響應(yīng)碼,表明呼叫接通,直接轉(zhuǎn)到座席處理

  3. 如果是3XX-6XX響應(yīng)碼,表明呼叫失敗,根據(jù)信令響應(yīng)碼和Reason原因值進(jìn)行檢測

  4. 如果是18X響應(yīng)碼,表明在振鈴階段,需要根據(jù)是否帶SDP確定下一步處理

  5. 如果18X帶了SDP,表明進(jìn)入了臨時(shí)話路,那么連接語音識別模塊進(jìn)行匹配處理

  6. 如果18X沒有帶SDP,則表明只是普通的振鈴,無需識別
  5.4 系統(tǒng)特點(diǎn)

  語音識別技術(shù)應(yīng)用于號碼識別領(lǐng)域,對呼叫建立過程中臨時(shí)話路播放的語音進(jìn)行快速匹配,以實(shí)現(xiàn)號碼快速和精確的識別具有非凡的意義;谝陨险Z音識別模塊的洗號系統(tǒng),相比單靠信令檢測的洗號系統(tǒng),更高效可靠。其特點(diǎn)如下:   從技術(shù)方面來看,欣方公司的洗號系統(tǒng)目前面向PSTN(固定電話網(wǎng))、PLMN(移動(dòng)電話網(wǎng))和NGN(軟交換)網(wǎng)絡(luò),能夠支持音頻(Tone音)檢測、信令(ISDN PRI、七號信令等)處理、語音識別等洗號產(chǎn)品關(guān)鍵技術(shù),號碼篩選準(zhǔn)確率在95%以上,是國內(nèi)洗號系統(tǒng)中有效號碼識別率最高的產(chǎn)品之一。   在固網(wǎng)中,交換機(jī)使用Tone標(biāo)識被叫用戶狀態(tài)的比較多,如正;剽徱、忙音等,欣方洗號系統(tǒng)針對Tone音的檢測能夠達(dá)到100%的準(zhǔn)確率。   在標(biāo)準(zhǔn)的信令處理方面,被叫的交換機(jī)會(huì)主動(dòng)釋放呼叫(Release),并在信令中包含釋放原因,如“Unallocated Num”(空號)、“User Busy”(被叫忙)等。欣方洗號系統(tǒng)在信令處理方面能夠達(dá)到100%的準(zhǔn)確率。   這是欣方洗號系統(tǒng)中最具難度、同時(shí)也是最具技術(shù)含量的部分。由于國內(nèi)三大電信運(yùn)營商在語音提示反映被叫狀態(tài)方面,沒有統(tǒng)一的標(biāo)準(zhǔn)。例如,同樣是被叫為空號的提示音,可能是“對不起,您撥的號碼是空號”,也可能是“對不起,您撥的號碼不存在”等等。為此,欣方洗號系統(tǒng)配置了一個(gè)可擴(kuò)展的音庫,將各種提示音以及其具體的含義定義在里面。目前音庫中包含固網(wǎng)提示音600多條,移動(dòng)提示音100多條,基本上覆蓋了三大運(yùn)營商全國各省的網(wǎng)絡(luò)提示音。   由于國內(nèi)三大電信運(yùn)營商(特別是固網(wǎng)運(yùn)營商)存在太多的不同品牌交換機(jī),并且各個(gè)本地網(wǎng)的提示音經(jīng)常不相同(有時(shí)候即使提示內(nèi)容相同,但是提示音的音調(diào)、語氣也可能不同),這就對洗號系統(tǒng)的語音識別能力提出了更高的要求。欣方洗號系統(tǒng)對外呼采用會(huì)議方式進(jìn)行全程錄音,會(huì)議方式錄音保證了錄音的可靠性。用戶通過對錯(cuò)誤檢測錄音的分析,可以生成新的語音識別樣本庫,動(dòng)態(tài)加載到系統(tǒng)中。從而進(jìn)一步提高識別精準(zhǔn)度。這種自學(xué)習(xí)的語音識別功能,保證了欣方洗號系統(tǒng)所具備的高識別率。
  欣方洗號系統(tǒng)中單個(gè)呼叫在5秒內(nèi)完成語音檢測,并結(jié)束呼叫。單個(gè)E1的配置情況下,每小時(shí)可以實(shí)現(xiàn)并發(fā)外呼8000個(gè)號碼。   欣方洗號系統(tǒng)軟件采用C++語言開發(fā),運(yùn)行于Linux環(huán)境下。由于使用的是呼叫中心、智能網(wǎng)平臺同一套底層代碼,因此系統(tǒng)穩(wěn)定性非常高,是電信級的產(chǎn)品。同時(shí),硬件成本低,根據(jù)用戶成本,可以分別配置工控機(jī)+板卡或PC服務(wù)器+語音網(wǎng)關(guān)的方式。同時(shí)該平臺具有良好的擴(kuò)展性,單臺機(jī)器可支持最少1E1,最大64E1的ISDN PRI或ISUP接入。

  具有重呼機(jī)制:

  對于語音識別出的用戶失敗的情況,例如用戶忙、無應(yīng)答、不在服務(wù)區(qū)等情況,系統(tǒng)可設(shè)置重呼策略,包括重呼時(shí)間和重呼次數(shù)的設(shè)置。例如設(shè)置在10分鐘后重呼、重呼次數(shù)為2次,則在第1次呼叫失敗完畢后的10分鐘后進(jìn)行第1次重呼,若第1次重呼時(shí)還是無應(yīng)答等情況,將在接下來的10分鐘后進(jìn)行第二次重呼。

6.測試結(jié)果

  通過撥打固定電話、手機(jī)、軟電話、傳真機(jī)等通信終端,對語音識別部分每個(gè)模塊的準(zhǔn)確性、時(shí)效性、并發(fā)性和穩(wěn)定性進(jìn)行了測試,結(jié)果如下表:

  表2 語音匹配系統(tǒng)系統(tǒng)功能表


  從測試結(jié)果可以看出,該系統(tǒng)能與各種可能的回傳語音進(jìn)行匹配,實(shí)現(xiàn)準(zhǔn)確、高效的語音檢測分類功能。

7.成功案例

  欣方綜合信令識別和語音識別技術(shù),為自動(dòng)外呼和洗號系統(tǒng)提供了完善的技術(shù)方案,典型案例如下: 8.結(jié)束語

  本文提出了一種基于語音識別的檢測方法,該方法采用模式匹配對tone音、AM音進(jìn)行快速匹配,可以準(zhǔn)確地識別號碼狀態(tài),很好的彌補(bǔ)了信令檢測方式的不足,很大程度上提高了號碼識別的準(zhǔn)確率與效率。

  目前,基于語音識別的檢測方法已經(jīng)產(chǎn)品化,并成功的應(yīng)用到河北移動(dòng)卓望和信元博雅固話洗號平臺上。經(jīng)過測試,該系統(tǒng)具有良好的并發(fā)性與穩(wěn)定性,同時(shí)通過對號碼的有效甄別和篩選,顯著減少了座席等待時(shí)長,顯著減少了座席等待時(shí)長,提高了撥號效率,進(jìn)而降低了外呼成本。

  隨著呼叫中心市場的成熟,基于語音識別檢測方法會(huì)對提高呼叫中心的效率、增加企業(yè)利潤具有重要意義,其應(yīng)用前景將十分廣闊。但是在號碼識別領(lǐng)域,仍有許多值得研究的問題。例如,隨著樣本庫的擴(kuò)增,號碼識別的準(zhǔn)確度和效率也會(huì)隨之下降,因此采用區(qū)別于模式匹配的ASR語音識別方法來進(jìn)行號碼識別,將是我們研究的下一個(gè)重點(diǎn)。
共 4 頁:1 2 3 4 

作者供稿 CTI論壇編輯



相關(guān)閱讀:
北京欣方承建河北博岳外呼呼叫中心系統(tǒng) 2011-07-15
案例:河南農(nóng)信部署ITSM服務(wù)平臺 2011-06-10
欣方中繼網(wǎng)關(guān)CIN-MG 2011-05-10
欣方外包呼叫中心及電銷企業(yè)洗號系統(tǒng)方案 2011-05-09
欣方多媒體呼叫中心系統(tǒng)解決方案 2011-05-06

熱點(diǎn)專題:  語音合成TTS 語音識別ASR  呼叫中心    電話營銷