您當前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

捷通華聲出席中國-東盟(華為)人工智能交流會

--5G+AI:共建智能化產(chǎn)業(yè)互聯(lián)網(wǎng)

2019-09-12 09:15:24   作者:   來源:CTI論壇   評論:0  點擊:


  9月9日,以“共驅(qū)AI,賦能未來”為主題的第一屆中國—東盟人工智能峰會在南寧成功舉辦。捷通華聲作為人工智能技術(shù)產(chǎn)業(yè)化的開拓者和領(lǐng)先者,受邀出席中國-東盟(華為)人工智能及軟件開發(fā)技術(shù)交流會。
  捷通華聲副總經(jīng)理于智彬發(fā)表“5G+AI:共建智能化產(chǎn)業(yè)互聯(lián)網(wǎng)”主旨演講,以下為演講內(nèi)容:
  現(xiàn)在AI已成為家喻戶曉的名詞,大家都知道人工智能,就是模仿人的各種能力的技術(shù)。讓機器“能說會聽、能看會認,能思考、會判斷,能行動”是AI追求的目標,也是我們捷通華聲2000年建立時的初衷和愿望。
  在2010年前,人工智能已經(jīng)過幾起幾落。1950年,AT&T推出Audry,實現(xiàn)首個可以識別10個英文數(shù)字的系統(tǒng);1997年IBM推出VIAVOICE——首個語音識別產(chǎn)品。當時大家很興奮,大呼語音識別時代到來了,但當試用之后發(fā)現(xiàn)識別效果不好,又大失所望。此后,直至2010年前,因為計算力有限、數(shù)據(jù)量不足、算法演進緩慢等原因,導(dǎo)致語音識別、圖像識別等AI技術(shù)一直未能產(chǎn)業(yè)化。
  2000年成立之初,我們主要是做TTS和手寫識別技術(shù)。當時的TTS有些機械音,但它能代替人日日夜夜的辛苦重復(fù)工作。例如,全國各地高鐵站廣播、汽車站廣播、醫(yī)院叫號廣播等,都用了捷通華聲的TTS產(chǎn)品。手寫識別技術(shù)效果比較好,用在很多手機輸入法上,還賣給了日本的手寫板生產(chǎn)廠商,歐美的各種高端轎車車機。
  2008年,個人電腦開始大規(guī)模應(yīng)用,2010年,互聯(lián)網(wǎng)快速發(fā)展,隨之產(chǎn)生了大量的數(shù)據(jù)。此時,高性能計算、機器學(xué)習(xí)也發(fā)展到了新的水平,開始可以支撐語音識別、圖像識別等人工智能技術(shù)的發(fā)展了。
  第一次轉(zhuǎn)型:抓住機遇,發(fā)展全方位AI技術(shù)
  當發(fā)覺到這個機遇時,捷通華聲下定決心,果斷轉(zhuǎn)型,準備發(fā)展全方位AI技術(shù)。
  2011年,捷通華聲推出國內(nèi)外首個全方位AI開放平臺—靈云,致力于讓機器“能說會聽、能寫會看、能辨音會認人、能思考會判斷”。
  在發(fā)展AI技術(shù)的路上,很多前沿計算理論,需要與學(xué)術(shù)界共同研究。2012年,我們開始與清華大學(xué)聯(lián)合研發(fā)AI算法。我們應(yīng)用AI技術(shù),對接市場需求,開發(fā)產(chǎn)品,并用產(chǎn)業(yè)應(yīng)用中產(chǎn)生的數(shù)據(jù),去訓(xùn)練提升AI水平,形成產(chǎn)學(xué)研用的良性循環(huán)。
  隨著與清華大學(xué)AI技術(shù)聯(lián)合研究的深入,2013年,清華大學(xué)產(chǎn)業(yè)基金入資捷通華聲,成為捷通華聲第二大股東,并共同確立“靈云科技源自清華”的戰(zhàn)略合作。2014年,捷通華聲與清華大學(xué)共同創(chuàng)建清華靈云人工智能研究中心,中國科學(xué)院院士、清華大學(xué)人工智能研究院院長,張鈸院士擔(dān)任研究中心首席科學(xué)家。2015年,捷通華聲與清華大學(xué)海峽研究院在廈門共同創(chuàng)建清華靈云人工智能研究中心。通過與清華大學(xué)的科研合作,靈云AI技術(shù)學(xué)術(shù)研究保持全球領(lǐng)先,各項技術(shù)快速進步。
  靈云AI技術(shù),快速產(chǎn)業(yè)化應(yīng)用
  隨著AI技術(shù)的不斷提升,各種產(chǎn)業(yè)需求爆發(fā)式增加,AI技術(shù)開始快速產(chǎn)業(yè)化。
  最經(jīng)典的一個應(yīng)用場景,就是客服中心。銀行、保險、航空等大型企業(yè),有海量的客戶,需要建立大型客服中心來提供業(yè)務(wù)咨詢、業(yè)務(wù)辦理等服務(wù)。為了控制客服中心人力成本,減少客戶咨詢長時間排隊等情況,農(nóng)行、中信銀行、郵儲銀行、太平洋保險、國航、深航等,紛紛引進捷通華聲的智能客服。
  以中信銀行為例,在微信公號、和官網(wǎng)接入智能客服,可以為用戶提供借記卡、信用卡、養(yǎng)老金等全業(yè)務(wù)的智能咨詢、辦理服務(wù)。智能客服問答準確率超90%,從2014年上線至今,日均訪問量50萬+,人工坐席節(jié)省125人/年。
  此外,客服中心的電話服務(wù)熱線,承載著大量用戶咨詢,人工服務(wù)壓力和成本巨大,客戶打電話經(jīng)常打不進來、或長時間等待。
  北京國稅當時找到我們,看如何在不增加坐席人數(shù)的情況下,提供通暢的稅務(wù)咨詢服務(wù)。捷通華聲給稅務(wù)局開發(fā)了電話客服機器人、微信智能客服,和營業(yè)廳實體服務(wù)機器人。稅收政策、稅務(wù)登記、一證通、優(yōu)惠政策、營改增問題、三證合一等問題都可以向機器人咨詢,為納稅人提供永不占線、方便快捷的稅務(wù)咨詢服務(wù)。
  銀行、電信公司的服務(wù)熱線,剛打進去是IVR按鍵導(dǎo)航,層級深,選項多,很多人進去直接按0轉(zhuǎn)人工,導(dǎo)致人工服務(wù)壓力巨大,而85%的客戶咨詢,都是常見問題。我們給光大銀行95595熱線做的智能語音導(dǎo)航,客戶打電話進去后,常見的業(yè)務(wù)問題,機器人可以直接回答;需要轉(zhuǎn)人工的咨詢,機器人會反問補全,確認好業(yè)務(wù)種類后,精準轉(zhuǎn)接給對應(yīng)的坐席組。目前光大銀行智能語音導(dǎo)航,日接聽量20萬通,回答準確率91%,轉(zhuǎn)人工比例下降至20%,轉(zhuǎn)人工等待時長下降30%,轉(zhuǎn)人工坐席接起率提升至99.78%,取得了良好的業(yè)務(wù)效果。
  類似地,手機銀行APP,也有很多功能項,菜單層級深。為了方便用戶使用,招商銀行引進捷通華聲智能語音技術(shù),為招商銀行掌上生活A(yù)PP打造智能語音助手,查賬單、轉(zhuǎn)賬、買理財,說出來即可,還可以咨詢金融知識。這在提升用戶使用體驗和粘度的同時,大幅降低了中老年人等群體使用APP難度。
  除了承接用戶咨詢,客服中心還有大量的外呼工作。例如銀行的信用卡逾期催繳、貸款業(yè)務(wù)推廣等。2016年,我們做了國內(nèi)第一個智能語音外呼機器人產(chǎn)品,某大型股份制銀行信用卡催收智能外呼機器人:2016年上線,成都分公司率先使用機器人,催收回款率提高30%,排名全國第一。月均節(jié)約人力成本120萬,截止2018年12月底,累計節(jié)約人力成本4500萬,節(jié)省了巨大的人力成本。
  在近期給某知名互金公司上線的催收機器人,上線30天后,外呼回款率與純?nèi)斯ご呤招Ч恢,即機器人催收達到真人水平。
  隨著AI的深入應(yīng)用,客服中心想用AI技術(shù)來督促坐席提升服務(wù)質(zhì)量。某大型國企,引進捷通華聲智能語音分析系統(tǒng),將通話全量轉(zhuǎn)寫為文字并用規(guī)則進行自動打分,質(zhì)檢覆蓋率從3%提升至100%,全面督促坐席提升服務(wù)質(zhì)量,有效提升客戶服務(wù)滿意度。與此同時,對客服大數(shù)據(jù)進行挖掘與分析:業(yè)務(wù)熱點、業(yè)務(wù)發(fā)展趨勢,可視化展現(xiàn);通過重復(fù)來電分析、關(guān)聯(lián)分析、異常分析等,挖掘客戶投訴、多次來電原因。
  在質(zhì)檢客服的同時,靈云智能語音分析系統(tǒng)還可以輔助坐席的實時通話。2016年,捷通華聲為某大型保險公司做了國內(nèi)首款實時智能語音分析系統(tǒng)。近萬名坐席,通話實時語音轉(zhuǎn)寫,坐席側(cè)語音識別率超90%;如果坐席出現(xiàn)未按流程對話、保單免責(zé)條款未說明、詆毀同業(yè)、假冒促銷等情況,系統(tǒng)會實時發(fā)出違規(guī)提醒;系統(tǒng)也會實時分析客戶說話內(nèi)容,給予坐席產(chǎn)品類型建議、險種內(nèi)容、挽回話術(shù)、常見業(yè)務(wù)知識等話術(shù)輔助。
  系統(tǒng)上線后,有效規(guī)范了保險電銷服務(wù),降低了新人成單難度,提升了整體電銷成單率。
  除了客服中心,物聯(lián)網(wǎng)場景也對智能語音交互技術(shù)有巨大的需求,如大家熟知的智能音箱、兒童智能陪伴機器人等。我們給機頂盒廠商做智能語音助手,換頻道、搜電影,可以直接說出來,為用戶創(chuàng)造體驗更友好、更高效的人機交互方式。
  在提供方案產(chǎn)品的同時,我們給眾多合作伙伴、政企客戶提供基礎(chǔ)人工智能能力平臺,助力其打造智能化的業(yè)務(wù)應(yīng)用。靈云全智能能力平臺-AICP,提供語音識別、語音合成、聲紋識別、OCR、人臉識別、視頻分析、語義理解、機器翻譯、數(shù)據(jù)挖掘等全方位AI技術(shù)能力,是靈云AI技術(shù)賦能百業(yè)的關(guān)鍵。
  AI技術(shù)產(chǎn)業(yè)應(yīng)用,給企業(yè)減少了巨大的人力成本,實現(xiàn)了業(yè)務(wù)的跨越式升級。AI已成為推動產(chǎn)業(yè)智能化升級的關(guān)鍵動力。
  AI技術(shù)產(chǎn)業(yè)化的思考
  下面分享一些我們捷通華聲在AI技術(shù)產(chǎn)業(yè)化中的思考:
  第一,AI技術(shù)的發(fā)展,計算理論的演進,算法的升級是關(guān)鍵;體量大、分布合理、干凈的數(shù)據(jù)模型是基礎(chǔ);給客戶提供學(xué)習(xí)訓(xùn)練,例如NLU、ASR等的數(shù)據(jù)訓(xùn)練,能有效提升AI技術(shù)在產(chǎn)業(yè)內(nèi)的應(yīng)用效果。另外,AI技術(shù)的發(fā)展,離不開產(chǎn)業(yè)界的包容,即客戶對技術(shù)發(fā)展階段性水平的理解,這為AI公司的成長進步提供了土壤。
  第二,AI技術(shù)融合應(yīng)用趨勢已非常明顯。例如我們推出的車載輸入法,用戶可以用語音、手寫、鍵盤輸入,讓車載輸入更安全快捷;我們的靈云手機輸入法,支持語音、手寫、鍵盤輸入,中英、中維翻譯,OCR拍照輸入、跨屏輸入、語音速記等功能,滿足用戶多種場景的輸入需求。
  語音互譯軟件,除了綜合應(yīng)用語音識別、機器翻譯、語音合成、OCR技術(shù),各項技術(shù)還要求是支持多種語言的。銀行大廳服務(wù)機器人,要求功能更廣泛,智能語音交互,人臉識別、指紋識別驗證,OCR拍照錄入材料等,各項技術(shù)融合應(yīng)用,為用戶提供更便捷的服務(wù)。
  同樣的,我們在做的辦案智能化筆錄(中維雙語)場景,需要語音識別(普通話、維吾爾語)、機器翻譯(中翻維、維翻中)、語音合成(普通話、維吾爾語)、OCR拍照識別(中文、維吾爾文)融合應(yīng)用,才能提供完整的服務(wù)。
  AI技術(shù)融合應(yīng)用的背后,就是人工智能的本質(zhì)——模仿人的能力。從感知、認知、到行動,越多AI技術(shù)融合應(yīng)用,發(fā)揮威力越強大。
  第三,AI產(chǎn)品也趨于融合服務(wù)。例如,我們在客服中心推的靈云全智能客服解決方案(AICC),基于靈云全智能能力平臺(AICP),運用行業(yè)領(lǐng)先的語音識別、語音合成、語義理解以及大數(shù)據(jù)分析等AI技術(shù),為客服中心提供一站式的智能客服、智能語音導(dǎo)航、智能語音外呼、語音質(zhì)檢分析等智能解決方案。
  • 智能客戶服務(wù):智能客服、智能語音導(dǎo)航在微信、網(wǎng)頁、APP、電話等多種渠道,為用戶解答咨詢、辦理業(yè)務(wù)
  • 智能語音外呼:外呼機器人,快速完成海量電話的外呼,高效完成客戶回訪、金融催收、營銷推廣等工作
  • 智能語音分析:實現(xiàn)100%全覆蓋的智能語音質(zhì)檢,督促坐席提升服務(wù)質(zhì)量;對坐席通話進行實時話術(shù)輔助,助力提升電銷成單率;對客服大數(shù)據(jù)進行挖掘分析,助力業(yè)務(wù)決策。
  同樣,在公檢法辦案語音筆錄場景,通過共用基礎(chǔ)AI能力平臺,支撐多場景業(yè)務(wù)應(yīng)用:為詢問室提供訊問智錄系統(tǒng),實現(xiàn)雙人對話轉(zhuǎn)寫;為會場提供智會系統(tǒng),實現(xiàn)多人會議轉(zhuǎn)寫,和講話實時上屏;在辦公室,提供PC語音輸入法,用語音快速錄入文字信息;在外出執(zhí)勤現(xiàn)場,用便攜式訊問筆錄一體機,快速生成訊問筆錄,多項AI產(chǎn)品融合應(yīng)用。
  下一次轉(zhuǎn)型:AI云服務(wù)
  展望未來,下一次轉(zhuǎn)型是什么?5G、云計算快速發(fā)展,政企單位接受公有云服務(wù)的意愿度漸漸提升。下一次轉(zhuǎn)型,AI云服務(wù),將是巨大的機遇。
  之前做項目有很多難點。對供應(yīng)商來說,大量POC、交付項目,在全國各地大量部署,部署、對接調(diào)試時間長,人力、差旅成本巨大,散點運維,無法統(tǒng)一;對需求方來說,需要準備硬件環(huán)境(如ASR用的大內(nèi)存服務(wù)器,機器翻譯用的GPU),需要投入人力配合部署、調(diào)試,部署拖長了項目周期,也間接性增加了采購成本。
  2018年,靈云AI入駐華為云,為產(chǎn)業(yè)界提供AI技術(shù)能力與產(chǎn)品方案云服務(wù)。
  我們開始了一個轉(zhuǎn)變,從部署各種能力、系統(tǒng)產(chǎn)品,轉(zhuǎn)為向客戶提供AI能力與產(chǎn)品服務(wù)的快速調(diào)用,讓每一家企業(yè)都能快速接入人工智能。
  5G+云計算,天生助力AI云服務(wù)發(fā)展。5G傳輸,滿足音頻、圖像、視頻等傳輸量大,實時語音識別、OCR、視頻識別等要求低時延的要求;云計算,更能好的運行深度學(xué)習(xí)算法,滿足語音識別等模型庫巨大,圖像識別、機器翻譯等需要GPU計算的需求。
  例如,某大型保險公司項目,之前由于網(wǎng)絡(luò)傳輸速率、延時,不能滿足通話實時語音識別需求,超百臺服務(wù)器,進行異地多活部署。有了5G后,可以轉(zhuǎn)變?yōu)榧薪y(tǒng)一部署,這可以減少硬件計算資源空置,減少運維管理投入,降低整體建設(shè)成本。
  某警務(wù)外出辦案語音轉(zhuǎn)寫項目,以前都是需要大內(nèi)存筆記本電腦,或便攜式服務(wù)器部署ASR,成本高。換5G后,可以用5G調(diào)用公安云語音識別能力,普通筆記本聯(lián)網(wǎng)即可應(yīng)用。
  某政府大規(guī)模翻譯項目,5G,帶寬大、低延時,滿足辦公實時傳輸大量語音、圖像等數(shù)據(jù)需求;機器翻譯、圖像識別等需要的GPU計算資源,由云平臺統(tǒng)一提供,提高硬件資源利用率。相較多點部署GPU服務(wù)器,大幅降低成本。
  整體來說,用5G+云平臺方式提供AI服務(wù),具備諸多優(yōu)勢:客戶接入快、成本低,計算資源利用率高、運維統(tǒng)一,供應(yīng)商成本低,AI更易推廣。
  AI應(yīng)用+云計算+5G,將構(gòu)建一個更智能、更高速、算力更強大的智能化產(chǎn)業(yè)互聯(lián)網(wǎng),服務(wù)各行各業(yè)。
  感謝大家的聆聽,歡迎學(xué)習(xí)交流!
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)