您當(dāng)前的位置是:  首頁 > 新聞 > 文章精選 >
 首頁 > 新聞 > 文章精選 >

中興通訊杜新凱:深度語義理解助力CC智能化

2018-04-16 16:47:52   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  由CTI論壇(www.ironandevergreencollection.com)主辦的2018中國呼叫中心及企業(yè)通信大會(huì)(http://www.ironandevergreencollection.com/expo/2018/ccec2018spring/index.html)于4月12日-13日在北京遼寧大廈盛大開幕。本次會(huì)議以“數(shù)字時(shí)代的通信和協(xié)作變革”為主題。中興通訊聯(lián)絡(luò)中心AI首席科學(xué)家杜新凱應(yīng)邀出席此次會(huì)議并發(fā)表題為《深度語義理解助力CC智能化》的主題演講。聯(lián)絡(luò)中心的主要應(yīng)用場(chǎng)景,無論是智能客服,智能知識(shí)庫,還是智能外呼,都涉及對(duì)文本的處理和理解。一直以來文本的語義理解存在如下四個(gè)難題,即針對(duì)相同語義的不同表述方式的識(shí)別,普遍存在的不確定性,知識(shí)處理的復(fù)雜性,和輸入存在的大量錯(cuò)誤。新的深度語義理解技術(shù)可有效解決這些難題,從而助力聯(lián)絡(luò)中心實(shí)現(xiàn)智能化。

杜新凱 中興通訊聯(lián)絡(luò)中心AI首席科學(xué)家
▲演講PPT下載,pdf格式
  杜新凱:各位上午好,謝謝主辦方的邀請(qǐng),很高興有機(jī)會(huì)給大家做報(bào)告,剛才汪總從哲學(xué)和倫理學(xué)的角度講了人工智能和呼叫中心,我更多是從技術(shù)的角度來作一個(gè)分享。
  今天的報(bào)告主要分為四個(gè)部分,第一部分是呼叫中心面臨的挑戰(zhàn)和趨勢(shì),第二部分是自然語言處理的重要性,第三部分是深度語義理解核心技術(shù),第四部分是深度語義理解的應(yīng)用。
  首先來看呼叫中心面臨的挑戰(zhàn),我認(rèn)為呼叫中心的挑戰(zhàn)主要是關(guān)于人的三個(gè)矛盾,第一個(gè)矛盾是,我們知道呼叫中心的投入和規(guī)模每年都在持續(xù)的增長(zhǎng),這樣的話就需要招聘更多的人,但是我國的勞動(dòng)力人口已經(jīng)在逐年下降越來越少,這樣就構(gòu)成第一個(gè)矛盾;第二個(gè)矛盾是,我們希望呼叫中心的人工座席團(tuán)隊(duì)盡可能的保持穩(wěn)定,但是事實(shí)上呼叫中心的離職率相對(duì)于別的行業(yè)來說始終處于一個(gè)比較高的水平;第三個(gè)矛盾,根據(jù)統(tǒng)計(jì)顯示呼叫中心的人力成本占到了總成本的82%,我們呼叫中心預(yù)算的增長(zhǎng)的速度低于人力成本的增長(zhǎng)速度,這樣就構(gòu)成了第三個(gè)矛盾。
  這三個(gè)矛盾就使得智能化成為呼叫中心發(fā)展的一個(gè)必然趨勢(shì),這里面我們可以從兩個(gè)角度來看。第一個(gè)角度就是機(jī)器可以替代人,也就是說我們不需要招更多的話務(wù)員。比如說智能客服、智能IVR、智能營業(yè)廳、智能外呼的應(yīng)用。Garter有一個(gè)報(bào)告,2020年智能機(jī)器人的座席能夠滿足40%的客服市場(chǎng)的需求,中國到時(shí)候就會(huì)有一千萬的智能機(jī)器人的座席;第二個(gè)角度來講的話就是說機(jī)器也可以輔助人、協(xié)助人,比如智能坐席助手和智能知識(shí)庫,我們可以提高座席人員的工作效率,讓同樣一個(gè)坐席人員可以去做更多的工作、去有更多的產(chǎn)出。
  同時(shí)我們今天很高興的看到,就是說越來越多的用戶已經(jīng)開始適應(yīng)和習(xí)慣智能化的服務(wù)方式。國外報(bào)告是說在過去的2017年,已經(jīng)有超過15%的用戶有了跟智能機(jī)器人對(duì)話的經(jīng)歷,雖然說傳統(tǒng)的一些渠道,比如說電話、郵件的比例仍然遠(yuǎn)遠(yuǎn)高于對(duì)話機(jī)器人的比例,但是我們可以看到從趨勢(shì)上來講,就是智能服務(wù)的比例會(huì)占的越來越高。
  在呼叫中心這個(gè)領(lǐng)域里面,智能服務(wù)、智能技術(shù)起作用的一個(gè)主要著力點(diǎn)就是語言的處理。語言的形式可能有語音、有文本。對(duì)于語音來講,通過語音識(shí)別的技術(shù),我們可以把它轉(zhuǎn)換成文本,所以說歸根到底可能主要還是一個(gè)文本處理的問題。這里面主要用到的就是自然語言處理的技術(shù),也就是NLP的技術(shù)。
  我們可以看一看NLP在人工智能中的位置。人工智能可以劃分為三個(gè)層次,第一個(gè)就是計(jì)算智能,就是讓計(jì)算機(jī)具備能存會(huì)算的能力。第二個(gè)層次是感知智能,讓計(jì)算機(jī)能聽會(huì)說、能看會(huì)認(rèn),比如說語音識(shí)別、語音合成、人臉識(shí)別都屬于感知智能的范疇。第三個(gè)層次就是認(rèn)知智能,讓計(jì)算機(jī)具備能理解會(huì)思考的能力,NLP就是在研究如何讓機(jī)器人像人一樣去理解人類的語言,屬于認(rèn)知智能的范疇,著名的圖靈測(cè)試主要就是基于NLP的技術(shù)提出的。
  在NLP的處理里面其實(shí)是面臨四個(gè)非常大的挑戰(zhàn)和困難。第一個(gè)是表達(dá)方式是非常靈活的,第二個(gè)是我們?cè)谡Z言當(dāng)中其實(shí)是普遍存在很多的不確定性,第三個(gè)是語言知識(shí)處理本身非常復(fù)雜,第四個(gè)是輸入可能是存在不規(guī)范性。比如講一個(gè)智能回訪的場(chǎng)景,我們都知道機(jī)器人做回訪,或者我們?nèi)斯ぷ龌卦L,往往第一個(gè)問題是身份的核對(duì),比如“您好,請(qǐng)問你是張三先生嗎?”可能我們期望用戶說我是或者說我不是,這是非常簡(jiǎn)單非常容易處理的;但是我們分析實(shí)際的錄音數(shù)據(jù),針對(duì)用戶表明自己就是張三,從表述上我們可以分為四類,第一類就是我剛才講的最簡(jiǎn)單一個(gè)情況,第二類比如說用戶會(huì)說“有事趕緊說”,第三類他可能反問你,“你為什么午休時(shí)間給我打電話”,第四類,他甚至?xí)芙^你,“我現(xiàn)在不方便接電話”,但是后面這三類他都在變相的承認(rèn)自己是張三。我們就可以看到,其實(shí)對(duì)于一個(gè)簡(jiǎn)單的身份核對(duì),用戶就會(huì)有各種各樣非常靈活、非常多變的表達(dá)方式,要求我們能夠通過NLP的技術(shù)能夠去處理。
  某種意義上來講就是一個(gè)問題它有多難,它就會(huì)有多重要。關(guān)于自然語言處理,微軟創(chuàng)始人比爾蓋茨很早之前就說過,自然語言處理是人工智能皇冠上的明珠。最近微軟的沈向洋博士提出了一個(gè)說法“懂語言者得天下”,就是強(qiáng)調(diào)人工智能接下來的突破就是在自然語言的理解。
  我們看看NLP在實(shí)際中的應(yīng)用場(chǎng)景,可以劃分為三塊,第一塊就是通用領(lǐng)域,我們都知道搜索引擎、拼音輸入法,背后都是一些NLP的技術(shù)。第二塊是面對(duì)特定行業(yè)的應(yīng)用,比如說智能投顧、疾病診斷、還有教育、法律都有一些應(yīng)用場(chǎng)景,第三塊就是呼叫中心。
  呼叫中心相對(duì)特殊,這個(gè)特殊性我認(rèn)為主要是因?yàn)樗膬蓚(gè)特點(diǎn)決定,第一個(gè)就是說各行各業(yè)都有這方面的需求,市場(chǎng)空間非常大;第二個(gè)特點(diǎn)是針對(duì)具體的客戶具體的行業(yè)來講,其實(shí)解決的是特定封閉領(lǐng)域的問題,這樣的話使得技術(shù)難度相對(duì)來講比較低。
  接下來就是深度語義理解的核心技術(shù),對(duì)于NLP,從大的方面來看可以劃分為兩種技術(shù)路線,第一種是傳統(tǒng)的方法,基于符號(hào)的語義表示,在語義處理上是依賴于大量的規(guī)則還有淺層的分析,準(zhǔn)確率往往取決于你到底投入多少的人工,很難超過80%。第二種是深度語義理解的方法,基于分布式的語義表示,語義處理上是把傳統(tǒng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)去結(jié)合起來,另外在知識(shí)層面很好的利用知識(shí)圖譜作為支撐,準(zhǔn)確率可以做到95%以上。
  深度語義理解有兩個(gè)要素,一個(gè)是關(guān)鍵算法,有語義相似度計(jì)算、語義復(fù)述、多意圖識(shí)別、自學(xué)習(xí);第二個(gè)是知識(shí)圖譜,從知識(shí)圖譜技術(shù)上來看是五方面的問題,第一個(gè)是知識(shí)的體系和表示,第二個(gè)是知識(shí)的建模,第三個(gè)是知識(shí)的獲取,第四個(gè)是知識(shí)的集成,第五個(gè)是知識(shí)的存儲(chǔ)和服務(wù)。下面我分別仔細(xì)介紹。
  最終的話把算法和知識(shí)的所有技術(shù)整合起來,就構(gòu)成了我們的深度語義理解引擎,大概涉及到二十多種技術(shù)。
  最后介紹一下我們?cè)谏疃日Z義理解的具體的實(shí)踐和應(yīng)用。中興通訊的NGCC解決方案主要面向政企和運(yùn)營商市場(chǎng),我們的解決方案具備三方面的特點(diǎn),第一個(gè)就是智能化,第二個(gè)是純?cè)苹、第三個(gè)是整體化。我們?cè)谥袊桨、江蘇電信規(guī)模分別是15000座席和13400坐席,在建設(shè)銀行我們是兩地三中心12000坐席。這些案例都是呼叫中心少有的智能水平非常高、容量非常大,可靠性非常高的應(yīng)用案例,在這里面深度語義理解的技術(shù),應(yīng)用到了系統(tǒng)的各個(gè)部分,使得人工座席和機(jī)器可以密切的配合,有一個(gè)非常好的人機(jī)協(xié)作的效果。
  最后總結(jié)下,中興通訊的NGCC解決方案,我們將深度語義理解的技術(shù)應(yīng)用到了系統(tǒng)的各個(gè)部分,具體來講有智能客服、智能IVR、智能營業(yè)廳、智能知識(shí)庫和智能外呼,這些智能的方案跟對(duì)于呼叫中心傳統(tǒng)功能的完全支持,一起構(gòu)成我們完整化的解決方案,我們希望通過以深度語義理解為代表的智能化技術(shù),把智能化與服務(wù)場(chǎng)景、接入渠道,還有業(yè)務(wù)系統(tǒng)做一個(gè)無縫的融合,希望在業(yè)務(wù)場(chǎng)景里面能夠給用戶提供舒適、無感、有效、快速的智能服務(wù)。謝謝大家。
 
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題