您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

攜程度假智能客服機(jī)器人背后是這么玩的

2019-11-14 13:39:21   作者: 雷蕾/鞠劍勛   來源:攜程技術(shù)中心微信公眾號   評論:0  點擊:


  作者簡介
  雷蕾,攜程度假研發(fā)部資深算法工程師,負(fù)責(zé)智能客服算法工作。
  鞠劍勛,攜程度假研發(fā)部算法經(jīng)理,負(fù)責(zé)智能客服、知識圖譜、NLP算法等工作。
  隨著人工智能的發(fā)展,人機(jī)交互技術(shù)愈發(fā)成熟,應(yīng)用場景也越來越多。智能客服是人機(jī)交互在客服領(lǐng)域的一個應(yīng)用,服務(wù)于客人以及相關(guān)的客服人員。本文將介紹智能客服在旅游場景下的主要技術(shù)和應(yīng)用。
  當(dāng)前度假的智能客服主要用于C端(客戶端)面向客人,以及客服端輔助客服的兩個角色。
  面向客服端的是智能客服助手,用于對話窗口的側(cè)邊欄,提示客服人員當(dāng)前客人問題的答案,客服人員可視情況來采納;而面向C端的智能客服則是直接服務(wù)于客人,回答客人問題。
  智能客服又分為單輪問答的QABot和多輪對話的TaskBot,在攜程的旅游場景下,以多輪對話的TaskBot居多。一般多輪對話的智能客服系統(tǒng)會切分為以下幾個模塊:客人的問題(Query)進(jìn)來后首先經(jīng)過NLU模塊抽象化為客人的意圖(intent)以及關(guān)鍵信息槽位(slot),意圖及槽位傳給DM模塊后,經(jīng)過DST、DPL、NLG模塊返回答案。
  • NLU(Nature Language Understand自然語言理解),通過模型或規(guī)則的方式獲取客人的意圖和槽位;
  • DST(Dialog State Tracking對話狀態(tài)追蹤)存儲對話狀態(tài),包括每一輪對話的意圖以及已經(jīng)抽取到的槽位信息、歷史機(jī)器人的行為;
  • DPL(Dialogue Policy Learning對話策略選。,DPL根據(jù)DST傳輸?shù)膬?nèi)容決策機(jī)器人在該輪的行為;
  一、NLU
  NLU模塊基礎(chǔ)功能是獲取客人的問題的意圖及槽位信息,在業(yè)務(wù)比較復(fù)雜的場景,相對應(yīng)客人可能問的問題維度也會很復(fù)雜。如果答案涉及的條件很多的情況,往往單輪的QA無法很好的解決客人問題。因此在度假業(yè)務(wù)的場景下,多輪次的TaskBot會占大多數(shù)。
  1.1錯別字糾正
  原始語句中難免會出現(xiàn)錯字,錯字可能會改變最終輸出的答案。在識別意圖之前首先通過糾錯模塊對錯別字進(jìn)行糾正。
  兼容速度和準(zhǔn)確率考慮,糾正分為規(guī)則部分和模型部分,度假業(yè)務(wù)中涉及到的地點比較多,在規(guī)則部分就能夠覆蓋大部分錯別字的情況。模型部分首先會經(jīng)過一個CRF模型輸出字級別存在錯誤的可能性,生成候選集后,通過語言模型計算候選集句子的置信度,重排序得到最終糾正的結(jié)果。
  • 檢查錯誤模型,主要使用了五種特征向量連接后進(jìn)入Bi-LSTM-ATT-CRF模型,得到對每個字是否錯誤的判斷。
  • 語言模型計算候選集替換為該字的情況在語言模型內(nèi)的得分,文本轉(zhuǎn)為特征向量后經(jīng)兩層向前和后向前的Transformer,最后全連接計算softmax。
  1.2意圖識別
  意圖實質(zhì)上是對客人問題的抽象化,比如常見的客人問及“這個產(chǎn)品多少錢?”,可轉(zhuǎn)換為“詢問價格”意圖。而在直接服務(wù)客人的C端上,對回答答案準(zhǔn)確率有較高的要求,高質(zhì)量的服務(wù)背后首先是高準(zhǔn)確率,而且通常在設(shè)計意圖前期會存在意圖訓(xùn)練語料不足的問題,因此一個高準(zhǔn)確率并且弱監(jiān)督的意圖識別模型非常重要。
  意圖識別模型
  意圖識別模型整體采用上圖的類似matchingnetwork框架,每個意圖會有一個類別表示,新的query經(jīng)計算獲得其句向量,通過計算和每個類別的相似度得到該客人問題的意圖。
  當(dāng)前的意圖識別模型,相比于傳統(tǒng)的文本分類模型,準(zhǔn)確率更高,標(biāo)注量更少,同時更方便遷移到多意圖的情景。
  在訓(xùn)練階段,共有已知C個類別,每個類別N個樣本,語句經(jīng)特征向量經(jīng)過Bi-LSTM層后再通過Transformer-Attention把一句話映射為一條向量,最后經(jīng)膠囊網(wǎng)絡(luò)獲得每個類別的類別向量。每個訓(xùn)練語句得到句向量后,再通過Bilinear-Function-Sigmoid計算與的相似度得分,最后采用二分類的對數(shù)似然損失函數(shù)計算損失。
  模糊意圖的處理
  我們研究表明,客人在和機(jī)器人對話及與人對話的時候一些行為習(xí)慣是不同的。在面對機(jī)器人的時候,客人傾向于把機(jī)器人作為一個“搜索引擎”,常常輸入關(guān)鍵詞來獲得回答,但關(guān)鍵詞的信息不完整,通過模型或模板都無法返回切合的意圖。針對于此,我們采用了“聯(lián)想問”和“猜你想問”的功能來引導(dǎo)客人的提問方式。
  • 聯(lián)想問
  客人在聊天輸入欄輸入問題的同時,顯示相關(guān)的一些問題以供客人點選,由于是實時顯示,對速度的要求較高,這里我們使用的是檢索算法計算文本相似度。
  我們會為每一個意圖人工設(shè)置一些用戶常問問題,當(dāng)用戶輸入的時候,我們會用文本相似度的算法,算出和用戶輸入最接近的三個常問問題,提示給用戶供其選擇。
  • 猜你想問
  對于“猜你想問”功能,主要是處理問句過短的語義不明的情況。舉個例子,在簽證領(lǐng)域,客人會輸入“照片”,而和照片相關(guān)的意圖有“是否需要照片”、“照片要求”、“照片尺寸大小”等等能夠涉及到的十幾個意圖。在觸發(fā)“猜你想問”后,會返回4個最關(guān)聯(lián)的問題供客人點選。
  在使用“猜你想問”和“聯(lián)想問”的機(jī)制后,可以引導(dǎo)部分客人的用戶輸入習(xí)慣,提升單輪次下信息輸入的完整性及純凈度。
  1.3發(fā)現(xiàn)新意圖
  一個新業(yè)務(wù)線設(shè)計意圖的時候,不可能把所有會出現(xiàn)的意圖都理清楚,而是循序漸進(jìn),逐步增加。業(yè)務(wù)人員本身對業(yè)務(wù)的熟悉程度可提供新業(yè)務(wù)線的意圖大框架,在小細(xì)節(jié)上難免存在漏缺,或是因為實時政策的變化產(chǎn)生的新問題。
  比如說,在今年六月份大陸禁止發(fā)放臺灣自由行簽證,這段時間就新產(chǎn)生了很多類似于“已辦的臺灣簽證是否還可使用”、“是否還能辦臺灣G簽證”等這些新的客戶問題。
  層次聚類
  我們采用的是對原始問題聚類的方法,把相似句聚集在一起。經(jīng)過數(shù)據(jù)預(yù)處理后,生成句向量,第一層使用高斯混合得到一個初步的聚類結(jié)果,再通過規(guī)則判斷是否需要再進(jìn)行一次聚類,隨后在第二層使用OPTICS聚類。
  在用算法發(fā)現(xiàn)意圖后,并不會即刻投入使用,而是業(yè)務(wù)做重審確定,整體上新意圖的定位在于輔助業(yè)務(wù)對意圖體系的完善。
  1.4槽位抽取
  在TaskBot中,槽位信息抽取主要是服務(wù)于檢索答案。比如簽證一個常見問題“辦簽條件”,需要確定客人的辦簽國家、戶口所在地、居住地等信息后才能給出最終回答。
  有時客人的問題中直接會涉及相關(guān)槽位,目前槽位抽取采用的是規(guī)則+模型的方式。在實際應(yīng)用中,規(guī)則能夠覆蓋70%的情況,剩下的則由模型來負(fù)責(zé)。
  在度假業(yè)務(wù)里需抽取的槽位詞有一個明顯的層次關(guān)系,比如地點-送簽地、地點-辦簽國家、職業(yè)-在職、職業(yè)-自由職業(yè)等,在模型的設(shè)計上會先抽第一層,第二層才是對最終結(jié)果的二級識別,通過多任務(wù)的學(xué)習(xí),實際上每一層的任務(wù)是在對特征進(jìn)行自動抽取。
  大型的語言模型,比如說今年大熱的BERT,在很多NLP任務(wù)中大放光彩。在這個詞槽抽取任務(wù)中,語句中會先經(jīng)過BERT得到字向量后,第一層經(jīng)Bi-LSTM-CRF模型得到第一類的結(jié)果以及Bi-LSTM的編碼結(jié)果,會映射為對應(yīng)的類向量,經(jīng)、、連接后進(jìn)入第二層Bi-LSTM-CRF后得到最終的詞槽。在加入語言模型后,對于語料比較少以及地點比較多的情況提升會比較大,尤其是一些語料中沒出現(xiàn)過的地點,加入語言模型后也能識別出來。
  二、對話管理系統(tǒng)
  對話管理系統(tǒng)模塊主要負(fù)責(zé)對話狀態(tài)追蹤DST(每輪意圖、槽位的存儲)、對話策略選取DPL(反問或給出答案)、答案生成NLG。在這部分接收NLU識別的意圖和槽位結(jié)果,DST把對話狀態(tài)信息發(fā)送給DPL,DPL根據(jù)知識庫中的規(guī)則返回機(jī)器人在下一輪的決策(回答問題、反問或其它操作)。
  三、智能客服平臺
  在整體上,智能客服業(yè)務(wù)和技術(shù)的部分是解耦的。業(yè)務(wù)相關(guān)信息的設(shè)定和操作都是通過智能客服平臺,包括不同業(yè)務(wù)線的意圖和詞槽的設(shè)定、答案配置、數(shù)據(jù)審核、測試、標(biāo)注等。新建一條業(yè)務(wù)線的智能客服應(yīng)用,只需要在平臺上新建項目,輸入設(shè)定的意圖、對應(yīng)的語料、必要的槽位和對應(yīng)的答案。
  此外,平臺上的答案配置也很靈活,可以是固定回答,可以是知識圖譜的schema,可以是外部的接口,或是隨不同詞槽設(shè)定的回復(fù)等等。
  四、結(jié)語
  以上是度假人機(jī)交互的主要技術(shù)和成果,目前我們已經(jīng)完成了一個智能客服項目落地的閉環(huán),其中還有很多內(nèi)容可以持續(xù)完善,比如多輪的意圖識別、更多主動對話的探索等等。
  未來的智能客服機(jī)器人將往多模態(tài)和多語言方向發(fā)展,支持語音和圖像等模態(tài)的解析,支持英法日韓等多國的語言。智能客服還將提供主動服務(wù)模式、人機(jī)協(xié)同模式、群聊功能等多種模式。此外,采用大規(guī)模挖掘和生產(chǎn)的方式降低人工標(biāo)注成本也是未來的主要方向之一。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)