您當(dāng)前的位置是:  首頁 > 資訊 > 國(guó)內(nèi) >
 首頁 > 資訊 > 國(guó)內(nèi) >

華為云語音語義創(chuàng)新Lab獲DigSci科學(xué)數(shù)據(jù)挖掘大賽冠軍

2019-10-21 15:58:49   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  近日,華為云在論文匹配檢索領(lǐng)域取得進(jìn)展,基于自然語言處理領(lǐng)域的領(lǐng)先技術(shù)積累,華為云語音語義創(chuàng)新Lab在DigSci科學(xué)數(shù)據(jù)挖掘大賽上奪冠,精準(zhǔn)率超過第二名5個(gè)百分點(diǎn)。
  DigSci科學(xué)數(shù)據(jù)挖掘大賽比賽是清華AMiner、智源實(shí)驗(yàn)室、微軟聯(lián)合舉辦的學(xué)術(shù)論文搜索匹配大賽,屬于語義匹配檢索領(lǐng)域,旨在從學(xué)術(shù)材料中挖掘知識(shí)。比賽提供一個(gè)約含20萬篇論文的論文庫,同時(shí)提供對(duì)論文的文字描述,描述來自論文中對(duì)同類研究的介紹,參賽選手需要為描述段落匹配三篇最相關(guān)的論文。本次比賽吸引了來自包括清華、北大、浙大、復(fù)旦等全國(guó)著名高校和企業(yè)組成的100多支專業(yè)隊(duì)伍參加。
  挑戰(zhàn)知識(shí)挖掘技術(shù)高點(diǎn)
  學(xué)術(shù)論文是人類最前沿的知識(shí)載體,通過自然語言處理技術(shù),自動(dòng)識(shí)別一段文本描述最相關(guān)的論文,可以在學(xué)術(shù)搜索、科研知識(shí)圖譜、科研自動(dòng)問答系統(tǒng)、科研自動(dòng)摘要等領(lǐng)域落地。本次比賽的難點(diǎn)在于給定描述段落匹配的一篇論文(正樣本),在沒有負(fù)樣本的情況下要求參賽者給出一個(gè)描述段落最匹配的三篇論文。參賽者需要從大規(guī)模論文庫中匹配最相關(guān)的論文,涉及到語義表示、語義檢索等技術(shù)難點(diǎn)。如何縮小搜索范圍以及如何確?s小的搜索范圍包含了與描述匹配的論文成為比賽的關(guān)鍵技術(shù)。
  華為云聯(lián)合武漢大學(xué)、重慶郵電大學(xué),憑借華為云語音語義創(chuàng)新Lab在自然語言處理領(lǐng)域深厚的技術(shù)積累,采用了候選訓(xùn)練集自動(dòng)生成、自動(dòng)特征抽取和選擇、深度學(xué)習(xí)文本匹配算法、模型融合集成等技術(shù)。華為云自然語言處理專家提出的候選訓(xùn)練集自動(dòng)生成技術(shù)對(duì)模型取得優(yōu)異結(jié)果起到了關(guān)鍵作用。該技術(shù)針對(duì)一個(gè)描述段落,自動(dòng)從大規(guī)模論文庫中生成一個(gè)候選訓(xùn)練集合,并通過語義表示和語義匹配確保候選集中包含了待匹配論文。同時(shí)采樣負(fù)樣本,構(gòu)建出均衡的正負(fù)樣本集合用于訓(xùn)練有監(jiān)督的深度語義匹配模型。
  
  華為云獲DigSci科學(xué)數(shù)據(jù)挖掘大賽冠軍
  推出知識(shí)計(jì)算即服務(wù)(KaaS)框架
  在已有的自然語言理解、對(duì)話機(jī)器人、語音交互等語音語義類服務(wù)基礎(chǔ)上,華為云語音語義創(chuàng)新Lab持續(xù)創(chuàng)新,于2019年推出了知識(shí)計(jì)算即服務(wù)(KaaS)框架,助力政企客戶破解大型企業(yè)和政府機(jī)構(gòu)的智能化知識(shí)挖掘和管理難題,實(shí)現(xiàn)知識(shí)化轉(zhuǎn)型。該框架基于在自然語言處理、知識(shí)圖譜、深度學(xué)習(xí)、圖計(jì)算等領(lǐng)域的技術(shù)積累和實(shí)踐,以知識(shí)計(jì)算云服務(wù)形式提供全棧知識(shí)計(jì)算流水線平臺(tái),能夠針對(duì)不同行業(yè)多源異構(gòu)數(shù)據(jù)進(jìn)行分析和處理,通過流水線平臺(tái)幫助客戶構(gòu)建知識(shí)獲取、知識(shí)建模、知識(shí)管理和知識(shí)應(yīng)用的全套知識(shí)管理體系。
  在2019年華為全聯(lián)接大會(huì)上,中石油攜手華為聯(lián)合發(fā)布了勘探開發(fā)人工智能平臺(tái),基于知識(shí)計(jì)算即服務(wù)框架,華為云助力中石油進(jìn)行勘探開發(fā)知識(shí)體系的構(gòu)建、計(jì)算和應(yīng)用,為油氣勘探開發(fā)科研、生產(chǎn)管理提供智能化分析手段,實(shí)現(xiàn)油氣行業(yè)的知識(shí)化轉(zhuǎn)型。
  憑借創(chuàng)新性和技術(shù)先進(jìn)性,“華為云知識(shí)計(jì)算云服務(wù)”獲得了行業(yè)權(quán)威獎(jiǎng)項(xiàng)“2019數(shù)博會(huì)領(lǐng)先科技成果獎(jiǎng)”。在不久前全國(guó)知識(shí)圖譜及語義計(jì)算大會(huì)(CCKS 2019)上,華為云還獲得了中文知識(shí)圖譜問答大賽“創(chuàng)新技術(shù)獎(jiǎng)”。
  目前,華為云語音語義相關(guān)服務(wù)已經(jīng)成功應(yīng)用于政務(wù)、金融、油氣、醫(yī)療、汽車、物流、保險(xiǎn)、電商、稅務(wù)、媒體等具有語音識(shí)別、語言理解、知識(shí)管理等需求的業(yè)務(wù)領(lǐng)域。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)