您當前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

百度大腦UNIT3.0詳解之語音語義一體化方案

2019-08-23 09:27:15   作者:   來源:CTI論壇   評論:0  點擊:


  在電話客服場景里,用戶和機器人交流的過程中,經(jīng)常會出現(xiàn)沉默、打斷機器人、噪聲等情況,機器人在應對這些異常情況的時候,需要語音和語義理解技術進行處理,才能實現(xiàn)用戶和機器人的流暢交談。而這些能力的獲取與應用,也是企業(yè)智能對話項目落地過程中需要解決的難題之一。
  為此,UNIT帶來了全新的語音語義一體化解決方案,幫助企業(yè)解決語音交互過程中的難題。
  【電話客服場景下語音語義一體化解決方案】
  語音語義一體化是針對電話客服對話場景的技術方案,可用于呼叫中心智能客服等業(yè)務。整個方案包含以下內(nèi)容:
 。1)降低集成開發(fā)成本
  提供語音識別、語義理解、對話流程控制、知識庫、語音合成的打通方案,全雙工對話能力,一體化的部署方案,省去開發(fā)者對各環(huán)節(jié)自行調(diào)用、拼裝的學習成本以及二次開發(fā)成本。
 。2)標準協(xié)議快速接入
  提供基于unimrcp框架開發(fā)的mrcpserver服務接入包,通過標準協(xié)議適配不同呼叫中心設備(主流的freeswitch、avaya、及基于mrcp標準協(xié)議自主研發(fā)的呼叫中心設備)。
 。3)場景定制服務提升效果
  方案中自帶基于百度大腦呼叫中心下的通用ASR、語義糾錯,打斷策略,TTS模型,也可以基于開發(fā)者的業(yè)務場景,提供模型定制訓練服務,定向提升業(yè)務準確率。
  (4)極少量開發(fā),輕松實現(xiàn)對話流程
  提供Taskflow配置管理能力,開發(fā)者可在梳理業(yè)務流程后,通過少量代碼快速配置對應的對話流程,后續(xù)可直接零代碼在UNIT平臺上進行拖拽式配置。
  【語音語義一體化方案解讀】
 。1)語音識別ASR
  采用領先的百度語音技術,實時將音頻流轉(zhuǎn)識別出文本,并自動識別斷句。
  (2)全雙工對話能力
  建立通用機制,組織多模塊協(xié)同工作,實現(xiàn)雙通道數(shù)據(jù)(文本、事件信號)實時分發(fā)及處理。
 。3)糾錯
  根據(jù)場景相關詞匯生成糾錯候選,利用GBDT模型對獲選打分排序,最后通過beamsearch解碼出最優(yōu)糾錯結(jié)果。
 。4)打斷
  采用分類模型實現(xiàn),判斷是否滿足打斷條件,并下發(fā)打斷信號,可支持用戶自定義語料的模型訓練。
 。5)靜默及反問
  在設定時間內(nèi)用戶未回復情況下,機器人可自動反問?芍С钟脩魧r間條件、機器人反問話術進行配置。
 。6)掛機、轉(zhuǎn)人工
  定義標準事件信號:掛機、轉(zhuǎn)人工。用戶可通過配置、或簡單二次開發(fā)完成判斷條件的設定。
 。7)對話理解
  基于UNIT強大的語義理解能力,從實時文本中,解析用戶意圖。
 。8)對話邏輯引擎
  以可編程的方式構(gòu)業(yè)務建對話邏輯。
  (9)語音合成TTS
  基于深度神經(jīng)網(wǎng)絡技術,提供高度擬人,流暢自然的語音合成服務,便于應用、設備開口說話,更具個性。
  【如何獲取語音語義一體化能力】
  開發(fā)者可以進入UNIT官網(wǎng)——解決方案——語音語義一體化方案頁面,了解技術詳情并體驗真實對話樣例。https://ai.baidu.com/unit/v2/static/voice
  1、方案了解
  2、真實對話樣例的體驗
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)