您當(dāng)前的位置是:  首頁(yè) > 資訊 > 文章精選 >
 首頁(yè) > 資訊 > 文章精選 >

神州泰岳:無(wú)人值守智能客服中心

2017-09-21 16:17:42   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  由CTI論壇(www.ironandevergreencollection.com)主辦的2017中國(guó)客戶體驗(yàn)創(chuàng)新大會(huì)<http://www.ironandevergreencollection.com/expo/2017/awards2017/index.html>于9月14日在深圳益田威斯汀酒店盛大開(kāi)幕,本次會(huì)議以"在聯(lián)絡(luò)中心數(shù)字化轉(zhuǎn)型中搶得先機(jī)"為主題,北京神州泰岳軟件股份有限公司AI大數(shù)據(jù)副總裁張瑞飛應(yīng)邀出席此次會(huì)議并發(fā)表題為《無(wú)人值守智能客服中心》的主題演講。張瑞飛介紹了泰岳無(wú)人客服方案,包括:智能機(jī)器人虛擬坐席,多輪會(huì)話,知識(shí)管理,語(yǔ)音質(zhì)檢,語(yǔ)義質(zhì)檢,場(chǎng)景化應(yīng)用,智能IVR導(dǎo)航,工單機(jī)器學(xué)習(xí),對(duì)接業(yè)務(wù)流程引擎及客服智能運(yùn)維,以及同合作伙伴聯(lián)合打造無(wú)人客服生態(tài)。
北京神州泰岳軟件股份有限公司AI大數(shù)據(jù)副總裁張瑞飛
圖:北京神州泰岳軟件股份有限公司AI大數(shù)據(jù)副總裁張瑞飛
演講PPT下載pdf格式
  張瑞飛:大家好!我接下來(lái)的半個(gè)小時(shí)給大家介紹一下神州泰岳無(wú)人值守的客服中心的解決方案。我們?nèi)斯ぶ悄馨l(fā)展到現(xiàn)在到底有沒(méi)有可能形成真正無(wú)人值守的客戶中心的方式這是比較有爭(zhēng)議的,最近兩年我們做越來(lái)越多的工作,我們看到有越來(lái)越多輪工智能的東西在逐漸取代我們比較傳統(tǒng)的用人來(lái)實(shí)現(xiàn)的操作。這些內(nèi)容當(dāng)它越來(lái)越多的時(shí)候,我們想是不是真的有一天有可能逐漸代替人的10%的工作量,20%,甚至50%的工作量。這樣我們把人工智能技術(shù)的核心結(jié)合其他的流程技術(shù)、數(shù)據(jù)技術(shù),把它合成在一起,跟我們的客服中心的合作伙伴在一起,我們想打造無(wú)人值守的客服中心。我們?cè)诮鹑诤投悇?wù)兩個(gè)行業(yè)在進(jìn)行嘗試,我們發(fā)現(xiàn)用人工智能方式做虛擬座席和虛擬服務(wù)窗口的時(shí)候,效率和準(zhǔn)確率超出人們比較繁瑣工作流程的工作限度,減少工作時(shí)間,提高生產(chǎn)效率。
  簡(jiǎn)單介紹參與研究的人員,我們給這些人員做一個(gè)致謝。首先是李生教授,他是咱們國(guó)內(nèi)第一個(gè)獲得國(guó)際ACL國(guó)際語(yǔ)言協(xié)會(huì)的終身成就獎(jiǎng)的第一個(gè)科學(xué)家,是哈工大的黨委書(shū)記。也是人工智能研究院的名譽(yù)院長(zhǎng),是我們的首席科學(xué)家。顏永紅教授是Intel做人機(jī)界面的總架構(gòu)師,是中科院的科學(xué)家,主要負(fù)責(zé)語(yǔ)言學(xué)和聲學(xué)研究部分。趙慶衛(wèi)教授是中科院聲學(xué)所的研究員,推出的語(yǔ)音識(shí)別和語(yǔ)音上面具體的應(yīng)用場(chǎng)景。晉耀紅博士是我們?nèi)斯ぶ悄苎芯吭旱脑洪L(zhǎng),是原北京師范大學(xué)的博士生導(dǎo)師,他在語(yǔ)義里面曾經(jīng)參與過(guò)HAC概念層次網(wǎng)絡(luò)的語(yǔ)義研究,是當(dāng)時(shí)跟著中科院的團(tuán)隊(duì),是研究組的組長(zhǎng),提出一些不同的概念分詞和語(yǔ)義分局的方法。我們把這個(gè)方法用在現(xiàn)在人工智能平臺(tái)里面,去構(gòu)建OEC平臺(tái)。蔣宏飛博士是原來(lái)阿里做訓(xùn)練的訓(xùn)練小組的專家,他在我們這邊負(fù)責(zé)小富機(jī)器人的開(kāi)發(fā)。這是我們的核心研究團(tuán)隊(duì)。
  無(wú)人值守的客服系統(tǒng),傳統(tǒng)的電話服務(wù)和無(wú)人值守的智能服務(wù),我們想代替?zhèn)鹘y(tǒng)電話不足的地方,可能是用戶體驗(yàn)和用戶24小時(shí)接聽(tīng)電話的能力,他的感知和傳統(tǒng)IVR繁瑣的操作,我們想在其中優(yōu)化的地方。我們想做智能客服,但是智能客服和無(wú)人值守的客服中心還是有一點(diǎn)不一樣:1、智能客服沒(méi)有辦法有效解決口語(yǔ)標(biāo)準(zhǔn)化的問(wèn)題。2、多輪會(huì)話的場(chǎng)景里面表現(xiàn)不好。3、不能對(duì)復(fù)雜邏輯和復(fù)雜的業(yè)務(wù)流程進(jìn)行有效的診斷。4、缺乏語(yǔ)義糾錯(cuò)的能力。我們講傳統(tǒng)的智能客服只是在以前的客服里面部分注入人工智能的能力,并沒(méi)有形成基于人工智能形成判斷和形成虛擬座席的能力。
  我們的設(shè)計(jì)原則:在客服中心問(wèn)答的時(shí)候,我們想做到一步到位的精確語(yǔ)義理解。在進(jìn)行人機(jī)智能會(huì)話的時(shí)候進(jìn)行自由調(diào)整,人機(jī)會(huì)話,我們?cè)O(shè)想由機(jī)器和人進(jìn)行互動(dòng)和回答問(wèn)題的時(shí)候,無(wú)論問(wèn)題涉及其他的場(chǎng)景或者這個(gè)問(wèn)題涉及到要辦的業(yè)務(wù),比如要辦理一個(gè)房貸,買保險(xiǎn)或者申請(qǐng)信用卡,無(wú)論什么樣的業(yè)務(wù),我們希望在會(huì)話的過(guò)程中進(jìn)行自由跳轉(zhuǎn)。智能問(wèn)答除了渠道界面,更需要處理業(yè)務(wù)和保留歷史記憶來(lái)進(jìn)行多輪會(huì)話的能力,我們?cè)谶@個(gè)能力上取得一定突破,才取得無(wú)人客服的概念。
  無(wú)人客服并不是我們現(xiàn)在提得很新的話題,京東本身去年的時(shí)候開(kāi)始嘗試京東無(wú)人客服,我們這里講和京東的區(qū)別,我們發(fā)現(xiàn)一些在銀行或者是稅務(wù)或者政府、企業(yè)里面應(yīng)用的企業(yè)級(jí)客服重要需要的,不是消費(fèi)型市場(chǎng)的客服中心需要的東西,比如我們的業(yè)務(wù)流程需要更強(qiáng)的定制,比如我們對(duì)個(gè)人的肖像需要更好的面向企業(yè)的管理,這是企業(yè)里面不同的,我們打造的是面向企業(yè)級(jí)大B的生產(chǎn)端的無(wú)人構(gòu)成。技術(shù)架構(gòu),基于文本語(yǔ)義交互式引擎和智能語(yǔ)音交互式引擎,對(duì)語(yǔ)音系統(tǒng)和語(yǔ)義系統(tǒng)分別做解析。智能客服接入網(wǎng)關(guān)對(duì)各個(gè)業(yè)務(wù)進(jìn)行各個(gè)接口,比如銀行,存貸款、理財(cái)?shù)鹊葮I(yè)務(wù)的流程接口。部署架構(gòu),我們通過(guò)語(yǔ)音PBX系統(tǒng),進(jìn)入IVR,在IVR對(duì)接無(wú)人值守客服系統(tǒng),再生成語(yǔ)音,再和CTI系統(tǒng)進(jìn)行交互。
  這樣的會(huì)話架構(gòu)里面,我們需要能夠進(jìn)行智能交互的引擎結(jié)構(gòu),這個(gè)和傳統(tǒng)機(jī)器人不一樣,我們分五層:知識(shí)學(xué)習(xí)、知識(shí)引擎本身的建設(shè)、問(wèn)答引擎、對(duì)話引擎、場(chǎng)景引擎,這里面分五層進(jìn)行管理,所以它不再是我們單一的機(jī)器人,只是智能問(wèn)答的交互引擎,是知識(shí)構(gòu)建到最上層管理的完整功能。具體的組件,包括推薦學(xué)習(xí)、地圖學(xué)習(xí)、閑聊學(xué)習(xí)、場(chǎng)景關(guān)聯(lián)、碎片化的業(yè)務(wù)能力的架構(gòu)和業(yè)務(wù)要素的了解,概念的理解以及會(huì)話歷史和會(huì)話間的記憶,會(huì)話和場(chǎng)景的關(guān)聯(lián)。這里面的能力有這樣幾個(gè):1、我們?nèi)绾芜M(jìn)行相關(guān)意圖的學(xué)習(xí),有時(shí)候我們的人類自然問(wèn)法背后隱藏的是概念化的語(yǔ)義表示,比如我們說(shuō)能吃多少吃多少,能吃多少吃多少,重音不同意思不同。這是結(jié)合語(yǔ)音和語(yǔ)義一起做到的。2、知識(shí)加工,如何讓機(jī)器人去學(xué)習(xí)到一個(gè)業(yè)務(wù),我們以前做機(jī)器人智能問(wèn)答的時(shí)候,有一個(gè)標(biāo)準(zhǔn)問(wèn)答,對(duì)應(yīng)一些答案,做出擴(kuò)展。一個(gè)標(biāo)準(zhǔn)問(wèn)對(duì)應(yīng)1200個(gè)擴(kuò)展問(wèn),這個(gè)概念在現(xiàn)在的無(wú)人值守的客服中心里面可能要顛覆掉,首先不能以問(wèn)答來(lái)理解語(yǔ)義和用戶的業(yè)務(wù)系統(tǒng)。我們要有入口告訴機(jī)器人怎么學(xué)會(huì)業(yè)務(wù)知識(shí),然后我們構(gòu)建業(yè)務(wù)框架的東西,在這上面通過(guò)跟機(jī)器人的會(huì)話,首先交給一個(gè)機(jī)器人業(yè)務(wù)知識(shí)。這是傳統(tǒng)給人工座席的培訓(xùn),當(dāng)我的一個(gè)人工座席來(lái)的時(shí)候,我應(yīng)該講我的業(yè)務(wù)框架和業(yè)務(wù)要素,以前的機(jī)器人是沒(méi)有的,只有問(wèn)答,這個(gè)不夠,所以把這個(gè)補(bǔ)起來(lái)了。3、我們對(duì)概念歸一化的講解,我們?cè)趪L試能不能直接把問(wèn)題和答案自動(dòng)匹配,在銀行或者在特定的應(yīng)用場(chǎng)景里面,我們讓擴(kuò)展問(wèn)消失,這樣機(jī)器人維護(hù)過(guò)程中,我們就可以基于純粹的人工智能的語(yǔ)義技術(shù)來(lái)進(jìn)行維護(hù),這種場(chǎng)景到底可不可能發(fā)生,我們嘗試做這樣的場(chǎng)景。我們也做了測(cè)試,最近在上海銀行,我們做了兩輪:一是帶擴(kuò)展問(wèn)測(cè)試。二是把所有擴(kuò)展問(wèn)刪掉的測(cè)試,兩輪測(cè)試效果都很好。4、話題站的管理,話題記憶管理和場(chǎng)景管理,后面分別說(shuō)。
  整個(gè)構(gòu)成,無(wú)人值守的智能客服交互式架構(gòu),從知識(shí)學(xué)習(xí)到線下訓(xùn)練到線上的知識(shí)的發(fā)布,這是完整的框架。
  技術(shù)特色,語(yǔ)音識(shí)別,我們做了幾個(gè)特定功能:1、如何將連續(xù)的語(yǔ)音能夠自動(dòng)轉(zhuǎn)換為文字,這里面主要用到的算法是大家看到的雙向LSTM的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的算法,利用這個(gè)算法我們把這個(gè)速度做到比國(guó)際開(kāi)源軟件快5倍以上,基于WFST的語(yǔ)音和語(yǔ)音特點(diǎn)和句法進(jìn)行整合的識(shí)別技術(shù)。通過(guò)這個(gè)實(shí)現(xiàn)人機(jī)交互和人人交互,準(zhǔn)確率分別是90%和80%,我們?cè)趩闻_(tái)服務(wù)器處理并發(fā)語(yǔ)音。人機(jī)交互是手機(jī)打電話是最常見(jiàn)的人機(jī)交互,我們的語(yǔ)音進(jìn)入到手機(jī),在手機(jī)里面進(jìn)行識(shí)別。人人交互是通過(guò)電信的線路來(lái)進(jìn)行語(yǔ)音識(shí)別,他們主要的區(qū)別在于對(duì)音質(zhì)的線路損耗和后臺(tái)處理算法的差別。
  2、關(guān)鍵詞的檢索,對(duì)用戶的敏感詞、業(yè)務(wù)詞、提供詞和與說(shuō)話人無(wú)關(guān)的詞,還有支持電話、網(wǎng)絡(luò)和互聯(lián)網(wǎng)的自然語(yǔ)言的對(duì)話來(lái)進(jìn)行關(guān)鍵詞的檢索,保證在講話的時(shí)候,第一個(gè)是合規(guī),第二個(gè)是在質(zhì)檢的時(shí)候有些使用。
  3、通過(guò)對(duì)語(yǔ)音進(jìn)行語(yǔ)音、語(yǔ)速、輕重音以及語(yǔ)音相關(guān)概念的層次分析,通過(guò)層次分析理解基本音頻,以及語(yǔ)調(diào)之間的相關(guān)性,這是基于語(yǔ)音聲學(xué)特征進(jìn)行分析。
  4、場(chǎng)景分割,我能夠去定義語(yǔ)音的角色、場(chǎng)景的背景,可以把語(yǔ)音部分和人的身份去做自動(dòng)的聚類,可以給出客服語(yǔ)音和用戶語(yǔ)音相區(qū)分,即使在這兩個(gè)語(yǔ)音相重疊的時(shí)候,客服正在回答問(wèn)題,機(jī)器人正在回答問(wèn)題,你好,請(qǐng)您按照步驟一、步驟二,這時(shí)候打斷,客戶語(yǔ)音進(jìn)來(lái)了,他可以分出來(lái)客戶的語(yǔ)音是什么、要點(diǎn)是什么,不會(huì)吧兩個(gè)語(yǔ)音疊加在一起,造成含混不清。
  語(yǔ)音引擎突出體現(xiàn)幾個(gè)優(yōu)勢(shì):1、語(yǔ)音的性能優(yōu)勢(shì),首先準(zhǔn)確率上能做到80%和90%,這是語(yǔ)音性能上的優(yōu)勢(shì)。當(dāng)然我們?cè)趯?shí)驗(yàn)室里面有時(shí)候說(shuō)這不一定是很高的數(shù)據(jù)結(jié)果或者大家都差不多的數(shù)據(jù)結(jié)果,是這樣的。在語(yǔ)音識(shí)別里面,我想大家不會(huì)說(shuō)哪家的語(yǔ)音識(shí)別的效率會(huì)特別高或者會(huì)特別低,比如科大訊飛特別高或者特別低,都不會(huì)。我覺(jué)得關(guān)鍵在于我們是不是有專家在優(yōu)化,給企業(yè)級(jí)或者再一個(gè)領(lǐng)域里面優(yōu)化企業(yè)的使用場(chǎng)景。當(dāng)你的語(yǔ)音引擎在使用場(chǎng)景上進(jìn)行一系列的優(yōu)化之后,它的表現(xiàn)在應(yīng)用里面的差異特別大,這時(shí)候這是語(yǔ)音上面和別人的差別,我們?cè)趹?yīng)用的窄領(lǐng)域內(nèi)去聚焦和投入,去做這樣的語(yǔ)音引擎。
  2、語(yǔ)音的抗噪性,對(duì)于語(yǔ)速的識(shí)別,準(zhǔn)確率和語(yǔ)音的適應(yīng)性上,都做了相關(guān)的學(xué)習(xí)和建模的技術(shù)。
  為了配合無(wú)人職守的客服中心,語(yǔ)義上我們做了相關(guān)的提升,主要是三個(gè)方向:1、場(chǎng)景化;、多輪問(wèn)答。3、業(yè)務(wù)本體建模。說(shuō)白了是為了使得我們的智能問(wèn)答的機(jī)器人更接近予人類的操作能力。它除了能夠回答問(wèn)題以外,它應(yīng)該還能夠去干活,能夠做業(yè)務(wù),能夠進(jìn)行系統(tǒng)的錄入,甚至能夠辦理一些簡(jiǎn)單的業(yè)務(wù)流程或者能夠提示或者能夠進(jìn)行推銷。我們定義不同的業(yè)務(wù)場(chǎng)景,要能基于人類的一個(gè)問(wèn)題,讓機(jī)器有多輪問(wèn)答,引導(dǎo)出它整個(gè)問(wèn)題。第三個(gè)是機(jī)器人要了解業(yè)務(wù),它要進(jìn)行業(yè)務(wù)的建模。
  場(chǎng)景,它等于業(yè)務(wù)框架+知識(shí)類型+交互方式,這就是我們實(shí)際上對(duì)場(chǎng)景基于語(yǔ)義管理的定義。我們知道一個(gè)用戶有不同的業(yè)務(wù)類別,我們可以對(duì)應(yīng)不同的場(chǎng)景。這些業(yè)務(wù)類別對(duì)用戶而言,首先看到的是業(yè)務(wù)框架,對(duì)于學(xué)習(xí)的知識(shí)庫(kù)而言,能夠看到不同的業(yè)務(wù)框架下有不同的知識(shí)類型。在交互方式上也會(huì)看到機(jī)器人給他的表述方式是不同的,這個(gè)我們管它叫場(chǎng)景化。以前的機(jī)器人在過(guò)于單一的場(chǎng)景里面使用同一種方式,都是問(wèn)答。有時(shí)候不是,營(yíng)銷的時(shí)候交互方式是更副文本一點(diǎn),普通的時(shí)候可能交互方式適合簡(jiǎn)單的回答,這樣一方面考慮機(jī)器的復(fù)雜和成本,也使得我們?cè)诓煌瑘?chǎng)景下的使用變得更靈活,不同場(chǎng)景的答案不同。另外,以前過(guò)于強(qiáng)調(diào)單一的知識(shí),這里面大家看到的FAQ的知識(shí),像人類一樣,我們有不同的知識(shí),機(jī)器人也應(yīng)該學(xué)習(xí)不同的知識(shí)。等下我舉個(gè)海關(guān)的例子給大家講列表型知識(shí)。通常我們進(jìn)海關(guān),仿真槍能不能帶出海關(guān)?這時(shí)候機(jī)器人給的回答就是整個(gè)法規(guī),一個(gè)海關(guān)的規(guī)范,但實(shí)際上如果人回答那就直接回答仿真槍不能帶出海關(guān)就可以。這句話意思在列表知識(shí)型里面解析,如果以機(jī)器人不具備知識(shí)架構(gòu),永遠(yuǎn)做不到人類這樣回答問(wèn)題,就不能從列表中解析。這是我們想要求的讓他辦理業(yè)務(wù)或者做場(chǎng)景化所必備不同的知識(shí)能力。這三個(gè)我們叫場(chǎng)景定義。
  場(chǎng)景定義下涉及到建模,定義一個(gè)場(chǎng)景怎么建模,這里面引入BOT建模的方式,通過(guò)BOT框架,通過(guò)它的底層自帶的概念庫(kù)來(lái)滿足機(jī)器人在不同場(chǎng)景下的表現(xiàn)出不同角色的能力,這是BOT概念建模。BOT就是一個(gè)業(yè)務(wù)體系或者一個(gè)圖譜或者就是一個(gè)多維度的業(yè)務(wù)樹(shù),都可以。這是用戶很常見(jiàn)的BOT的拓普?qǐng)D。招商銀行的業(yè)務(wù)劃分,業(yè)務(wù)劃分是像我們培訓(xùn)普通座席一樣,有對(duì)公業(yè)務(wù)、個(gè)人業(yè)務(wù)。對(duì)公業(yè)務(wù)、個(gè)人業(yè)務(wù)再一級(jí)一級(jí)展開(kāi)。這樣可以告訴他,在機(jī)器的情況下,比如我個(gè)人業(yè)務(wù)里面信用卡,它包括什么,它的知識(shí)要點(diǎn)應(yīng)該包括業(yè)務(wù)流程、業(yè)務(wù)劃分等。機(jī)器人可以在相關(guān)類別情況下進(jìn)行回答,二是它可以去推測(cè)你下一個(gè)問(wèn)題可能是和什么相關(guān)的,就不會(huì)在所有的問(wèn)題里面隨意列舉,而是在業(yè)務(wù)框架里面推測(cè),這個(gè)思維是模仿人的思維進(jìn)行的。我們?nèi)嘶卮饐?wèn)題的時(shí)候也是這樣,屬于信用卡類,問(wèn)了這個(gè),我要找信用卡相關(guān)的,我們?cè)贐OT概念樹(shù)的情況下進(jìn)行分析,大家可以列為一個(gè)寬表對(duì)屬性的窮舉,這個(gè)概念展開(kāi)可以非常寬。這里面列舉了涉及BOT里面很多場(chǎng)景,不一一解釋,它的意義是一樣的;谶@個(gè)我們形成框架庫(kù),我給招商銀行建立BOT場(chǎng)景,我就可以把領(lǐng)域定義為整個(gè)銀行領(lǐng)域,這個(gè)框架我可以定義為銀行哪類業(yè)務(wù)框架,基金辦、概念型知識(shí)或者整個(gè)銀行框架或者信用卡框架,我可以把業(yè)務(wù)領(lǐng)域和業(yè)務(wù)框架定義下來(lái),結(jié)果是我到別的銀行的時(shí)候就可以復(fù)用。比如我到長(zhǎng)沙銀行或者基金管理公司的時(shí)候,我可以把知識(shí)進(jìn)行復(fù)用;疝k理的框架(見(jiàn)PPT)。
  概念庫(kù),這是業(yè)務(wù)領(lǐng)域常涉及到的場(chǎng)景。這個(gè)概念不單單是以前定義的打語(yǔ)義標(biāo)簽的概念,應(yīng)該還包括里面列舉的,比如它的集合概念、同義概念、業(yè)務(wù)概念、敏感概念、糾錯(cuò)概念、停用概念、成長(zhǎng)概念等,把復(fù)雜的概念進(jìn)行處理,使我們?cè)跇I(yè)務(wù)場(chǎng)景里,能使機(jī)器人應(yīng)答更加靈活,可以更符合我去探訪問(wèn)題本質(zhì)訴求的能力,我知道它應(yīng)該從屬概念的哪類,看到不同的概念進(jìn)行答案的提取。在這個(gè)基礎(chǔ)上我們?cè)龠M(jìn)行不同類型的知識(shí)加工,比如問(wèn)答類知識(shí),概念型知識(shí),列表型知識(shí)和要素型知識(shí)等等。不同知識(shí)的特色,這是典型問(wèn)答型知識(shí),信用卡怎么辦、信用卡如何辦理,這就是問(wèn)答型知識(shí)。概念型知識(shí),信用卡主要通過(guò)訪問(wèn)什么方式辦理,這里面提取的語(yǔ)義概念要素是信用卡辦理,信用卡辦理的方式、訪問(wèn)、網(wǎng)點(diǎn)等等,這些要素是被自動(dòng)提取出來(lái),提取出來(lái)以后,這句問(wèn)話變得更加靈活,信用卡怎么辦、信用卡該如何辦理、我該如何辦卡等等,這些內(nèi)容將被列舉成同一條知識(shí)。我們做過(guò)一個(gè)測(cè)試,剛才講了銀行里面一個(gè)基本問(wèn)會(huì)對(duì)應(yīng)1200個(gè)擴(kuò)展問(wèn)題,通過(guò)概念型知識(shí)加工,可以把問(wèn)題的類別擴(kuò)展類大大縮減,第一步縮減為幾十條,幾十條還不夠,我們希望最后消除擴(kuò)展問(wèn),我們拿到適當(dāng)?shù)恼Z(yǔ)料訓(xùn)練之后,最終的目的是消除擴(kuò)展問(wèn),讓問(wèn)題自動(dòng)找答案,或者使用很少的擴(kuò)展問(wèn),把機(jī)器人維護(hù)的工作降到最低,對(duì)機(jī)器人有知識(shí)的人知道它的維護(hù)工作有多復(fù)雜,大家看其他銀行上線的機(jī)器人可能就會(huì)有體會(huì)。概念型知識(shí),這是我們自動(dòng)提煉出來(lái)的語(yǔ)義概念,信用卡辦理等等。
  要素型知識(shí),典型的是剛才說(shuō)的賣保險(xiǎn)的問(wèn)題,我要辦一個(gè)保險(xiǎn)或者買一張火車票等等這樣的問(wèn)題,后面包含一個(gè)要素,保險(xiǎn)人是誰(shuí)、年齡是多少、辦什么樣的保險(xiǎn),火車票是從哪兒到哪兒,哪一天,買什么樣的座位、什么等級(jí),這就是要素型知識(shí)。里面避免不了的話題是要給用戶畫(huà)他的歷史肖像,以前的行為更喜歡什么樣的,喜歡買一等座還是二等座還是喜歡坐票還是臥鋪,這些是我們要給用戶畫(huà)像的能力。這要結(jié)合起來(lái)。列表型知識(shí),我們通過(guò)對(duì)列表型知識(shí)進(jìn)行加工的時(shí)候,我們可以把機(jī)器人的人機(jī)回答變化一下,例如仿真槍能不能帶上飛機(jī),這里說(shuō)某某違禁品是違禁品,不可以帶上飛機(jī)。這是從列表知識(shí)里面提取的答案,仿真槍能不能帶上飛機(jī)?他告訴你仿真槍是違禁品,不能帶上飛機(jī)。比如度秘搜索,他會(huì)回答整個(gè)公約,這不是客服想要的答案。
  語(yǔ)義技術(shù)在這方面進(jìn)行增強(qiáng),一是場(chǎng)景化。二是業(yè)務(wù)建模。三是知識(shí)不同表示和知識(shí)加工。四是持續(xù)化的優(yōu)化和服務(wù)的能力。
  我們用了深度學(xué)習(xí)的算法,一是信息抽取和信息發(fā)現(xiàn),主要是用在問(wèn)題的識(shí)別上,F(xiàn)在的算法主要是兩種,CNN的方式和LSTM的方式,在機(jī)器學(xué)習(xí)上學(xué)習(xí)情感表達(dá)和多輪會(huì)話的能力,這是用LSTM的算法來(lái)進(jìn)行提取,它也用在答案自動(dòng)生成和提取上,也用在實(shí)體提取和標(biāo)注上,實(shí)體標(biāo)注上我們對(duì)應(yīng)的CRF等等,還有其他算法的組合。這樣一些算法的提取,包括答案生成,我們用對(duì)抗學(xué)習(xí)的機(jī)制來(lái)自動(dòng)模擬人類自然語(yǔ)言生成答案,這樣的算法機(jī)制使我們完成了什么呢?我們說(shuō)一個(gè)和以前的對(duì)比,以前我們?cè)谧稣Z(yǔ)義標(biāo)簽的時(shí)候,我們自己的引擎是通過(guò)傳統(tǒng)的機(jī)器學(xué)習(xí)算法構(gòu)成的,我們做擴(kuò)展的時(shí)候,我們?cè)趺炊甲霾混`活,我們?cè)谏虾cy行實(shí)際測(cè)試的時(shí)候,我們用這樣的算法替掉原來(lái)的引擎,做兩種引擎的對(duì)比,在沒(méi)有擴(kuò)展論的時(shí)候,機(jī)器應(yīng)答的準(zhǔn)確率和召回效果,和以前維護(hù)標(biāo)準(zhǔn)兩百條擴(kuò)展論問(wèn)答效果差不多。
  這是學(xué)習(xí)流程,結(jié)合用戶畫(huà)像當(dāng)前提問(wèn)和用戶的歷史提問(wèn),把這三個(gè)作為我們判別的數(shù)據(jù)源,通過(guò)我們對(duì)問(wèn)題的處理,包括對(duì)概念的規(guī)劃處理,對(duì)問(wèn)題的分類,對(duì)信息的識(shí)別,最后拿出一個(gè)結(jié)構(gòu)化的用戶意圖,是用JASON表示的,意味著我們的系統(tǒng)可以開(kāi)放給所有人,只要用JSON進(jìn)行編程的人,我們可以把引擎的意圖開(kāi)放給所有咱們?cè)谧南到y(tǒng)。語(yǔ)義識(shí)別的例子,幫我訂一張明天從北京到上海的機(jī)票,最好不經(jīng)常晚點(diǎn)的。我們得出的結(jié)論,這個(gè)人是高大偉,男,36歲,商務(wù)人士,經(jīng)常拜訪客戶,經(jīng)常攜帶藏刀、佛像等禮品。這就是他歷史的畫(huà)像,這是我們的數(shù)據(jù)鏈。加上他的問(wèn)題,我們就輸出這樣的JSON格式,他要做機(jī)票預(yù)定從北京到上海,名字叫高大偉,36歲,商務(wù)認(rèn)識(shí),對(duì)航班準(zhǔn)確率要求高,他要攜帶禮品。我們會(huì)把完整的JSON數(shù)據(jù)發(fā)放出來(lái),可以結(jié)合數(shù)據(jù)源讓機(jī)器人做后臺(tái)的自動(dòng)分析架構(gòu)結(jié)合語(yǔ)義。
  同時(shí)我們考慮對(duì)話棧的技術(shù),像人一樣,人是有記憶的,機(jī)器人回答問(wèn)題的時(shí)候,最方便的回答是你帶著機(jī)器人和人回答,比如我說(shuō),幫我推薦個(gè)信用卡?這個(gè)問(wèn)題入棧,你問(wèn)什么幣種、什么職業(yè)。他又說(shuō),我想再問(wèn)一下保險(xiǎn),他把你的問(wèn)題打斷了,說(shuō)了一個(gè)其他的問(wèn)題,機(jī)器人還是可以自動(dòng)問(wèn)答,你要什么險(xiǎn)種、額度是什么,這個(gè)是話題的入棧,我把話題推到棧里面去。什么時(shí)候話題會(huì)出棧?一是話題中斷。二是話題徹底解決完了。三是話題異常終止或者完美解決。如果不想買,他就知道。接著回到信用卡,他說(shuō),請(qǐng)問(wèn)你什么職業(yè)?這是不是比較接近客服的自然響應(yīng)。我們把話束記憶也加入機(jī)器人的多輪會(huì)話里面去。通過(guò)這個(gè)也可以做所謂的引擎算法熱切換,第一種,傳統(tǒng)語(yǔ)義標(biāo)簽的方式,通過(guò)語(yǔ)義標(biāo)簽的方式去減少機(jī)器人在語(yǔ)義和句式變化上對(duì)人需求的維護(hù),減少這樣的需求。二是基于深度學(xué)習(xí)的方式,基于深度學(xué)習(xí)的匹配,對(duì)兩類內(nèi)容進(jìn)行匹配,一個(gè)是問(wèn)題到問(wèn)題,哪些問(wèn)題是標(biāo)準(zhǔn)問(wèn),哪些是擴(kuò)展問(wèn),問(wèn)題到問(wèn)題的自動(dòng)匹配。二個(gè)是問(wèn)題到答案,問(wèn)題到答案的生成很新,我們正在做這方面的努力,也正在跟招商銀行聯(lián)合做這方面的研究,我們?cè)趺磸膯?wèn)題里面生成答案,這樣我們既希望于最后能夠脫離所有的擴(kuò)展問(wèn)。
  我們看一個(gè)例子,傳統(tǒng)語(yǔ)義標(biāo)簽的匹配方式,這個(gè)匹配方式做了語(yǔ)義優(yōu)化。比我們以前看到的機(jī)器人好很多,大家可以看到幾年前的機(jī)器人效果比這個(gè)還差。比如我說(shuō)微信密碼不記得,他回答的方式是我回答不了,小滬功力不足。微信密碼丟了,微信密碼不記得,其實(shí)是一回事。滬是上海銀行實(shí)測(cè)的機(jī)器人,我們把語(yǔ)義標(biāo)簽去掉,換一個(gè)方式,熱切換深度語(yǔ)義,這時(shí)候召回的問(wèn)題,微信密碼不記得,他會(huì)回答如果忘了微信密碼,我可以推薦知識(shí)。最神奇的是說(shuō)到微信密碼丟的時(shí)候,還會(huì)推薦相關(guān)的其他類型的知識(shí)。這時(shí)候我們發(fā)現(xiàn)通過(guò)深度學(xué)習(xí)可以極大的提升機(jī)器人問(wèn)題的維護(hù)和回答的能力。
  場(chǎng)景應(yīng)用,語(yǔ)音質(zhì)檢,語(yǔ)義質(zhì)檢,通過(guò)聲音質(zhì)檢可能比較常見(jiàn),語(yǔ)義質(zhì)檢大家可能看到的比較少,但是可以通過(guò)文字內(nèi)容理解這個(gè)人的思維,判斷他回答問(wèn)題的合規(guī)性。潛客挖掘,貴金屬結(jié)算卡在基金理財(cái)上,分別挖掘出不同的潛在的營(yíng)銷客戶。這使呼叫中心從成本中心變成有可能盈利的利潤(rùn)中心。智能投訴管理的場(chǎng)景化應(yīng)用,我們把投訴分成三類76級(jí)別,把它的機(jī)構(gòu)來(lái)自于上級(jí)機(jī)構(gòu)的投訴還是有哪些投訴的升級(jí),把投訴分類進(jìn)行劃分。我們把整個(gè)客戶中心的投訴看得非常清楚,我通過(guò)一張表,我們叫三元組云圖,可以看到所有投訴里面最真實(shí)的投訴內(nèi)容是什么,而不只是關(guān)鍵字。這是我們有些項(xiàng)目投標(biāo)的時(shí)候正在做的,越來(lái)越多的銀行提智能IVR語(yǔ)音導(dǎo)航,我們不再使用關(guān)鍵字,以前的方法是關(guān)鍵字,你可以說(shuō)關(guān)鍵字,用戶很多時(shí)候不說(shuō)關(guān)鍵字,他直接希望智能客服來(lái)問(wèn)他,請(qǐng)問(wèn)有什么可以幫你?他直接說(shuō)我信用卡丟了怎么掛失,然后你直接跳到菜單里面。這是我們倡導(dǎo)的,我們現(xiàn)在也在投一些銀行的項(xiàng)目,我們也覺(jué)得越來(lái)越多的銀行用戶直接跟我們講,到底機(jī)器人能替掉人工工作多少的比例,我們?cè)谶@個(gè)方向上一直努力。
  我們希望實(shí)現(xiàn)虛擬座席,我們通過(guò)客戶的問(wèn)題轉(zhuǎn)接到虛擬座席,這個(gè)座席是給他普通座席和權(quán)限的,給他普通數(shù)據(jù)庫(kù)的操作權(quán)限和訪問(wèn)權(quán)限,以及知識(shí)庫(kù)的訪問(wèn)權(quán)限。首先它通過(guò)小滬機(jī)器人的引擎來(lái)做用戶的意圖理解和智能處理,實(shí)時(shí)去辨別知識(shí)類型和場(chǎng)景,同時(shí)也顯示在我們?nèi)说目头钠聊簧,人類客服可以通過(guò)關(guān)鍵字做相應(yīng)的跳轉(zhuǎn),進(jìn)知識(shí)庫(kù)和頁(yè)面。我們把虛擬座席做成人的助理,而且某些情況下對(duì)固定流程、煩瑣的流程、固定的問(wèn)答方式,虛擬座席可以完全輔助人類化解,而且他們之間可以一鍵進(jìn)行切換,機(jī)器人可以呼叫人,人也可以呼叫機(jī)器人,進(jìn)行場(chǎng)景切換。
  渠道是咱們講的全渠道,不用通過(guò)任何渠道,網(wǎng)絡(luò)、短信各種方式。我們最近研究一個(gè)有意思的渠道,通過(guò)VR的方式來(lái)實(shí)現(xiàn)一個(gè)機(jī)器人的渠道,這里面的場(chǎng)景我通過(guò)虛擬座席可以做什么,可以咨詢銀行的業(yè)務(wù),可以進(jìn)行意圖的識(shí)別,做多輪會(huì)話。我可以進(jìn)行營(yíng)銷的主動(dòng)推送,或者推地圖過(guò)去告訴你地點(diǎn)在哪里,我可以進(jìn)行各種寒喧、聊天,大家可以在線上找我們的小滬試試,昨天有合作伙伴測(cè)試效果不錯(cuò)。我覺(jué)得電影不好看,小滬說(shuō)我理解您很憤怒。說(shuō)了一些很有意思的話,這不是你的錯(cuò)什么的。他們寒喧的能力比較強(qiáng)。它也可以做一些超時(shí)的處理,比如時(shí)間過(guò)長(zhǎng)的時(shí)候,他可以知道提示電話要斷掉,也可以做無(wú)縫轉(zhuǎn)人工和人工和虛擬座席的互轉(zhuǎn),也可以做沒(méi)聽(tīng)清楚問(wèn)題的提示,也可以做一些幫助。包括用戶的個(gè)人畫(huà)像,我們的畫(huà)像以前都是在大數(shù)據(jù)平臺(tái)下打數(shù)據(jù)標(biāo)簽做出來(lái)的,這里面講的是用戶和實(shí)時(shí)繪畫(huà)過(guò)程中自然加工出來(lái)的,完全不一樣。我們做精準(zhǔn)營(yíng)銷的畫(huà)像,大部分來(lái)自歷史畫(huà)像,但是時(shí)間已經(jīng)過(guò)去了,不是現(xiàn)在的用戶行為。今天的用戶行為是正在講話的時(shí)候的畫(huà)像,價(jià)值是不一樣的。包括他的知識(shí)點(diǎn)建設(shè)。
  虛擬座席的知識(shí)學(xué)習(xí)怎么做的?你怎么進(jìn)一個(gè)人類知識(shí)告訴他?一是對(duì)現(xiàn)有學(xué)習(xí)知識(shí)學(xué)習(xí)、現(xiàn)有知識(shí)強(qiáng)化、新知識(shí)的發(fā)現(xiàn)。以前的機(jī)器人沒(méi)有彈出過(guò)界面,我們現(xiàn)在把這個(gè)知識(shí)點(diǎn)可以做到普通人就可以加工和維護(hù)的場(chǎng)景,不需要懂人工智能的專業(yè)知識(shí)。知識(shí)特征我們可以做運(yùn)維統(tǒng)計(jì)。系統(tǒng)的實(shí)施團(tuán)隊(duì),技術(shù)上有三個(gè)團(tuán)隊(duì)負(fù)責(zé),語(yǔ)義建模是張笑然領(lǐng)6個(gè)人的團(tuán)隊(duì),語(yǔ)音訓(xùn)練是劉雪蓮領(lǐng)10個(gè)木團(tuán)隊(duì),接口開(kāi)發(fā)是張青領(lǐng)20多人團(tuán)隊(duì)來(lái)做開(kāi)發(fā),這是技術(shù)支持和服務(wù)隊(duì)伍。整個(gè)實(shí)施周期如果并行起來(lái),在4-5個(gè)月可以把無(wú)人值守的客戶中心建起來(lái)。大家看到這里面有些售后,從業(yè)務(wù)調(diào)研開(kāi)始,然后到知識(shí)庫(kù)的建立,一直到語(yǔ)義理解的系統(tǒng)功能,到鏈條測(cè)試到整體上線,大概是4-5個(gè)月時(shí)間就可以建立整個(gè)系統(tǒng)。這是實(shí)時(shí)服務(wù)體系,我們做的7×24小時(shí)保障。
  案例,長(zhǎng)沙銀行的機(jī)器人在微信和Web客戶端進(jìn)行會(huì)話,這個(gè)機(jī)器人是我們前一個(gè)版本,沒(méi)有用深度學(xué)習(xí)的樣例,但是已經(jīng)用了語(yǔ)義標(biāo)簽的樣例,長(zhǎng)沙銀行整個(gè)維護(hù)的時(shí)間和維護(hù)周期非常短,整個(gè)實(shí)施周期控制在2個(gè)月左右的時(shí)間,整個(gè)機(jī)器人的知識(shí)建模已經(jīng)做好。招商銀行智能問(wèn)答做的測(cè)試,這個(gè)測(cè)試是把小招85萬(wàn)個(gè)匹配不到的問(wèn)題做了第二次答案,原來(lái)匹配不到的問(wèn)題,小招一鍵轉(zhuǎn)人工,這時(shí)候有大量人工工作量,后面又放一個(gè)機(jī)器人,發(fā)現(xiàn)85萬(wàn)個(gè)問(wèn)題,我們召回60萬(wàn)個(gè)問(wèn)題。棘輪是機(jī)器人無(wú)法回答的85萬(wàn)個(gè)問(wèn)題,通過(guò)智能匹配,有60萬(wàn)個(gè)問(wèn)題以90%+的準(zhǔn)確率找到了答案。
  我們通過(guò)二次匹配進(jìn)行高知性運(yùn)作,通過(guò)語(yǔ)義加工和深度學(xué)習(xí)的能力,去減少用戶的人工維護(hù)。智能語(yǔ)音導(dǎo)航也要對(duì)接其他平臺(tái),比如GeneSys、Avaya、華為、中興等等,這是我們做過(guò)的一些案例(見(jiàn)PPT)。廣發(fā)做了機(jī)器人的語(yǔ)音質(zhì)檢,大家看一下它的應(yīng)用,廣發(fā)銀行傳統(tǒng)的人工調(diào)取的方法是效率比較低,成本比較高,而且它也面臨很大的壓力,通過(guò)上線以后,制止三千個(gè)座席規(guī)模的客服在基于大數(shù)據(jù)的基礎(chǔ)上來(lái)實(shí)現(xiàn)自動(dòng)的語(yǔ)音質(zhì)檢。紅色體現(xiàn)出來(lái)客戶價(jià)值,我們的覆蓋率可以做到100%,對(duì)于業(yè)務(wù)熱詞可以自動(dòng)統(tǒng)計(jì),自動(dòng)推送培訓(xùn)的內(nèi)容,有95%的合規(guī)內(nèi)容被發(fā)現(xiàn),客服實(shí)時(shí)報(bào)檢是可以做一些分析。現(xiàn)在廣發(fā)也正在做一些關(guān)于語(yǔ)義質(zhì)檢和語(yǔ)義防欺詐的關(guān)聯(lián)分析。比如廣發(fā)辦信用卡的時(shí)候,有很多人寫(xiě)地址是瞎寫(xiě)的地址,這個(gè)地址有可能是信用卡的欺詐行為。用常規(guī)的方法很難理解哪個(gè)地址是正確的,哪個(gè)是錯(cuò)誤的,今天的威斯汀也有很多說(shuō)法,可以說(shuō)某路某號(hào),也可以說(shuō)威斯汀酒店,我們通過(guò)機(jī)器學(xué)習(xí)的方法來(lái)做地址歸一化的校驗(yàn),提出錯(cuò)誤的地址,做防欺詐。重慶的案例,我們想做無(wú)人值守的客服中心,光有人工智能不夠。我們應(yīng)該用人工智能的能力連接一切。重慶交委做的例子,我們把數(shù)據(jù)用專門(mén)的數(shù)據(jù)平臺(tái)連起來(lái),把業(yè)務(wù)平臺(tái)、開(kāi)發(fā)平臺(tái)、數(shù)據(jù)平臺(tái)、運(yùn)維平臺(tái)、公共平臺(tái)做起來(lái),整個(gè)做成應(yīng)用服務(wù)平臺(tái),這才是無(wú)人值守的客服中心。今天我們重點(diǎn)展開(kāi)語(yǔ)音和語(yǔ)義兩部分,后面只是給案例的方法給大家展示。
  這是我們實(shí)際做的一些原子服務(wù)和原子組合,這是我們現(xiàn)場(chǎng)做的采訪,做成業(yè)務(wù)圖譜。
  謝謝各位!
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)