您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

一分鐘搭建會話機(jī)器人,阿里是怎么做到的?

2020-03-26 09:48:59   作者:   來源:“阿里技術(shù)” 微信公眾號   評論:0  點擊:


  阿里妹導(dǎo)讀:2020年面對突如其來的新冠疫情,14億人心系家國共渡難關(guān)。阿里人更是“此時此刻,非我莫屬”,用技術(shù)的力量聚沙成塔,守護(hù)著千萬家。你可能在釘釘群里見過一個名字叫“防疫精靈”的小機(jī)器人,準(zhǔn)時準(zhǔn)點地為你播報著全國新冠肺炎的實時輿疫情數(shù)據(jù);有求必應(yīng)地為你解答關(guān)心的各類問題,例如防疫知識、線上問診、小區(qū)附近確診病例、發(fā)熱門診分布等等。更神奇的是,“防疫精靈”機(jī)器人最初從一個想法到上線釘釘,僅用了一個下午的時間,目前已累計至少服務(wù)了500萬個釘釘用戶。這看似“不可能”背后,是機(jī)器人工廠,這個強(qiáng)大的智能會話機(jī)器人孵化平臺,以其成熟的NLP算法能力及QA問答能力,將一切變成了可能。
  什么是機(jī)器人工廠?
  2016年開始,世界進(jìn)入“Chatbot時代”,科技行業(yè)巨頭也紛紛發(fā)布了各自在Chatbot領(lǐng)域的相關(guān)產(chǎn)品,例如蘋果Siri、微軟小冰、百度小度、阿里的天貓精靈等等。會話機(jī)器人的出現(xiàn)帶來的是用戶與計算機(jī)之間交互方式的變革,從以計算機(jī)為中心的一串有序的操作指令,發(fā)展到以用戶為中心的自然語言會話AI。
  機(jī)器人工廠就是在“會話AIFirst”浪潮中應(yīng)運(yùn)而生的Chatbot智能機(jī)器人孵化平臺。有了機(jī)器人工廠,任何人只需一分鐘就可以搭建一個專屬的會話機(jī)器人,不懂NLP技術(shù)、搞不定編程各種問題都不存在的!
  機(jī)器人工廠整體架構(gòu)圖如下所示,下面將圍繞產(chǎn)品場景和核心能力兩大塊做詳細(xì)介紹。
  用于哪些產(chǎn)品場景?
  機(jī)器人工廠的應(yīng)用場景主要分為答疑、運(yùn)營、運(yùn)維三大類。
  • AI+智能答疑
  答疑是三種場景中最常見的。用戶對商家的產(chǎn)品問詢、員工對企業(yè)的規(guī)章制度,總會有大量共性重復(fù)的問題需要解答,將這些共性的問題抽取出來整理成問答對沉淀在機(jī)器人工廠平臺上,答疑機(jī)器人就可以幫你解答大部分問題,既省時省力,就降低了人工成本。比如:機(jī)器人工廠為云棲大會提供了大會引導(dǎo)機(jī)器人。
  • AI+內(nèi)容場景
  運(yùn)營場景主要是通過機(jī)器人將消息準(zhǔn)確快速的統(tǒng)一觸達(dá)到所有用戶。比如,小明運(yùn)營著天南海北的100個商家群,只需機(jī)器人工廠一次配置消息內(nèi)容、發(fā)送時間,就可以準(zhǔn)時觸達(dá)100個商家群。輕松解決了人工操作100次的低效與時延。
  • AI+日常運(yùn)維
  運(yùn)維場景就更厲害了,機(jī)器人不僅會回答問題還能夠執(zhí)行命令。比如,你在阿里云上購買了一臺服務(wù)器,跑了一些任務(wù),可以讓機(jī)器人幫你查詢?nèi)蝿?wù)執(zhí)行的狀態(tài),發(fā)現(xiàn)異常,終止任務(wù)等等。“用戶提問—理解指令——調(diào)用服務(wù)(執(zhí)行指令)——返回答案”,是運(yùn)維場景的鏈路。
  還有更多新奇的玩法兒,比如結(jié)合語音文字互轉(zhuǎn)技術(shù),與阿里云通信、菜鳥驛站一起打造了智能外呼機(jī)器人。調(diào)查問卷、電話回訪、上門服務(wù)確認(rèn)是否在家等等場景都可以由機(jī)器人完成,機(jī)器人一天可以打出的電話可是多了好幾倍。
  有哪些核心能力?
  介紹了這么多,你應(yīng)該對機(jī)器人工廠可以做什么有了一些基本認(rèn)識。下面將為你介紹機(jī)器人工廠有哪些核心能力,到底怎樣玩轉(zhuǎn)起來。
  • 智能問答
  智能會話機(jī)器人的看家本領(lǐng)就是QA問答。意圖和實體是兩個最基本的概念。意圖由用戶輸入、動作、回應(yīng)三部分組成。其中用戶輸入定義了用戶問題;回應(yīng)定義了對應(yīng)的答案;動作非必選,定義了理解用戶意圖后需要去執(zhí)行一系列指令。實體作用于用戶輸入,將用戶輸入中的結(jié)構(gòu)化信息抽取出來,高效地解決了存在大量類似意圖匹配場景的問題。例如,“杭州2020-03-08的天氣怎么樣?”杭州可以抽取成一個枚舉實體,2020-03-08可以抽取成一個正則實體,動作可以定義為調(diào)用一個根據(jù)城市和時間去查詢天氣的服務(wù),最后回應(yīng)返回天氣信息。
  上述例子說明,QA問答首先要做到對用戶意圖的精準(zhǔn)理解。機(jī)器人工廠底層有一套完備的算法框架,傳統(tǒng)機(jī)器學(xué)習(xí)算法與基于深度神經(jīng)網(wǎng)絡(luò)的自然語言處理算法相結(jié)合,離線的特征提取模型訓(xùn)練與在線的實時預(yù)測相結(jié)合,純文本的FAQ意圖匹配與基于實體槽位的意圖匹配相結(jié)合,從而提高意圖匹配的準(zhǔn)確率。這里不做詳細(xì)展開,后續(xù)會有專題文章介紹。
  • 語料管理
  會話機(jī)器人的智能程度在一定意義上取決于它所理解的語料的豐富性。但絕大部分的知識都是以非結(jié)構(gòu)化的文本形式沉淀下來,而非會話機(jī)器人所能理解的一問一答的意圖形式。因此,新創(chuàng)建的會話機(jī)器人怎樣快速構(gòu)建語料具有智能問答的能力?機(jī)器人工廠提供了三種方式解決冷啟動問題,單個機(jī)器人應(yīng)用內(nèi),通過語料爬。ㄗ詣踊┡c批量導(dǎo)入(人工)和預(yù)置意圖(系統(tǒng)公共語料)豐富語料;在多個應(yīng)用之間實現(xiàn)語料共享(應(yīng)用拼裝)。
  • 語料爬取
  語料爬取是指自動地將用戶已有非結(jié)構(gòu)化的知識庫或文檔,通過機(jī)器閱讀和理解能力,抽取整理成會話機(jī)器人可以理解的問答對的形式。語料爬取不僅可以代替人工錄入快速豐富會話機(jī)器人的語料,而且極大的降低了知識庫對接機(jī)器人工廠的遷移成本。目前,機(jī)器人工廠平臺80%的語料都由語料爬取生成。此外,還支持人工的將excel或json格式的語料,批量導(dǎo)入自動生成意圖。
  • 預(yù)置意圖
  預(yù)置意圖是機(jī)器人工廠將用戶高頻、通用的場景下沉到平臺層面,使其可以賦能所有平臺上的機(jī)器人應(yīng)用,增強(qiáng)QA問答能力。例如,閑聊、查詢天氣、查詢值班等等。用戶只需在平臺上勾選啟用,即可使自己的機(jī)器人擁有回答這些問題的能力。
  • 語料共享
  語料共享是指不同會話機(jī)器人之間相互復(fù)用語料的能力。例如,所有銀泰百貨的會員手冊都一致,但不同的店打折促銷活動不同。機(jī)器人工廠支持將通用普適的語料創(chuàng)建一個機(jī)器人A,各自差異的語料分別創(chuàng)建各自的機(jī)器人,但大家都共享復(fù)用機(jī)器人A的語料。語料共享能夠提高語料的復(fù)用率,讓用戶更專注差異化的部分。
  • 在線編程
  上文提到過意圖是由“用戶輸入——動作——回應(yīng)”三部分組成,其中動作定義了理解用戶意圖后需要去執(zhí)行一系列指令。通常動作會通過HTTP請求的方式去調(diào)用用戶自定義的一個服務(wù)。但發(fā)現(xiàn)經(jīng)常會遇到以下問題:
  若用戶已有服務(wù)接口,會遇到服務(wù)格式不適配;機(jī)器人工廠的特殊處理邏輯與業(yè)務(wù)邏輯強(qiáng)耦合等問題。
  若用戶沒有服務(wù)接口,需要開發(fā)、部署、聯(lián)調(diào)、發(fā)布一系列流程,還會遇到機(jī)器、網(wǎng)絡(luò)、環(huán)境等問題,如果線上驗證失敗,上面步驟需要重新來過。
  新增一些具有時效性的臨時功能,都需要牽一發(fā)而動全身。
  為了解決上述問題,機(jī)器人工廠與阿里云計算平臺的在線開發(fā)平臺AppStudio合作開發(fā)出基于AppStudio的在線服務(wù)開發(fā)IDE,為用戶提供云上在線編程平臺,幫助你打通下游的服務(wù)實現(xiàn)數(shù)據(jù)查詢,指令執(zhí)行,知識庫檢索,內(nèi)容推薦等功能?梢詾槟闾峁
  • 靈活性:支持在線編程,自定義業(yè)務(wù)邏輯、安全性校驗等,與業(yè)務(wù)系統(tǒng)本身解耦;
  • 開放性:可以引入需要依賴的sdk,支持odps、hsf等服務(wù);
  • 簡便性:封裝了基本類和openApi便于開發(fā);
  • 即時性:不依賴任何發(fā)布系統(tǒng),隨改隨生效;
  • 共享性:支持協(xié)同編輯開發(fā),代碼共享;
  • 調(diào)試:支持在線debug、服務(wù)測試等功能;
  未來已來
  機(jī)器人工廠在阿里巴巴集團(tuán)內(nèi)經(jīng)過2年的發(fā)展與打磨,已經(jīng)孵化2w+機(jī)器人,服務(wù)44w+用戶。連續(xù)2年參加云棲大會讓我們感受到用戶對智能機(jī)器人的強(qiáng)烈訴求,2020年機(jī)器人工廠正式發(fā)布公有云版本。最后,獻(xiàn)上機(jī)器人工廠為飛天大數(shù)據(jù)開發(fā)平臺DataWorks打造的一鍵答疑機(jī)器人的Demo。
 
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)