您當(dāng)前的位置是:  首頁 > 新聞 > 國內(nèi) >
 首頁 > 新聞 > 國內(nèi) >

科大訊飛機(jī)器閱讀理解技術(shù)再次登頂SQuAD挑戰(zhàn)賽

2018-01-25 10:15:53   作者:   來源:CTI論壇   評論:0  點(diǎn)擊:


  繼2017年7月刷新世界紀(jì)錄后,近日,科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室(HFL)再次在由斯坦福大學(xué)發(fā)起的機(jī)器閱讀理解領(lǐng)域權(quán)威評測SQuAD(Stanford Question Answering Dataset)中登頂。此次,訊飛與哈工大聯(lián)合實(shí)驗(yàn)室提交的系統(tǒng)不僅在EM指標(biāo)(精準(zhǔn)匹配率)超過人類平均水平,并成為首個(gè)F1指標(biāo)(模糊匹配率)上超過89%的系統(tǒng)。 
SQuAD挑戰(zhàn)賽最新成績榜單
  2017年7月,科大訊飛憑借交互式層疊注意力模型(Interactive AoA Reader)獲得該賽事的榜首,并在同年10月進(jìn)一步優(yōu)化該模型后再次刷新紀(jì)錄。此次訊飛與哈工大聯(lián)合實(shí)驗(yàn)室提交的融合式層疊注意力系統(tǒng)(Hybrid Attention-over-Attention Reader)融合了近期學(xué)術(shù)界提出的諸多前沿技術(shù),如基于上下文的文本表示、自適應(yīng)轉(zhuǎn)隨機(jī)梯度下降的優(yōu)化方法等,同時(shí)又研發(fā)出一些全新技術(shù),不僅在SQuAD挑戰(zhàn)賽中取得亮眼成績,在其他自然語音處理任務(wù)上也獲得了顯著性能提升。
科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室參賽提交系統(tǒng)一覽
  機(jī)器閱讀理解技術(shù)目前已經(jīng)成為多家知名企業(yè)、高校等研究機(jī)構(gòu)關(guān)注的對象,技術(shù)上的突破將帶來自然語言理解的長足進(jìn)步。在與其他研究機(jī)構(gòu)和高校一同探索技術(shù)發(fā)展的同時(shí),科大訊飛也在積極推動(dòng)該項(xiàng)技術(shù)在對話、問答系統(tǒng)中的落地應(yīng)用,其中一個(gè)重要場景就是與智能車載系統(tǒng)的對話交互的結(jié)合,逐步實(shí)現(xiàn)汽車領(lǐng)域的精準(zhǔn)問答。通過讓機(jī)器閱讀汽車說明書及相關(guān)的介紹材料,使機(jī)器深度理解并掌握對該車型的相關(guān)知識;在用戶提出相關(guān)問題時(shí),不僅能夠快速反饋給用戶相關(guān)章節(jié),并且還能夠利用閱讀理解技術(shù)進(jìn)一步挖掘并反饋更精準(zhǔn)的答案,從而減少用戶的閱讀量,提高信息獲取的速度。
科大訊飛執(zhí)行總裁胡郁在2017發(fā)布會上介紹智能車載系統(tǒng)中閱讀技術(shù)的應(yīng)用
  科大訊飛不僅在SQuAD挑戰(zhàn)賽持續(xù)發(fā)力,也關(guān)注并積極推動(dòng)中文信息處理的研究發(fā)展。2017年,科大訊飛攜手中國中文信息學(xué)會計(jì)算語言學(xué)專業(yè)委員會(CIPS-CL)承辦了第一屆“訊飛杯”中文機(jī)器閱讀理解評測(CMRC2017),發(fā)布了相關(guān)中文閱讀理解數(shù)據(jù)集。今年,科大訊飛將繼續(xù)與中國中文信息學(xué)會計(jì)算語言學(xué)專委會共同舉辦第二屆“訊飛杯”中文機(jī)器閱讀理解評測(CMRC2018),進(jìn)一步促進(jìn)中文機(jī)器閱讀理解研究。
  擁有廣闊應(yīng)用場景的機(jī)器閱讀理解技術(shù)領(lǐng)域,未來將有怎樣的發(fā)展?
  科大訊飛高級副總裁、AI研究院院長、認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室主任胡國平表示,科大訊飛非常高興看到更多研究人員加入到機(jī)器閱讀理解技術(shù)的研究中來。前不久微軟亞洲研究院、阿里巴巴分別在EM指標(biāo)上超過人類平均水平,并且有許多中國團(tuán)隊(duì)在榜單中名列前茅,我們對中國研究機(jī)構(gòu)在這個(gè)領(lǐng)域所取得的好成績表示祝賀。但同時(shí),我們必須清楚地認(rèn)識到,雖然目前的系統(tǒng)在SQuAD挑戰(zhàn)賽中超過了人類平均水平,但這并不能代表機(jī)器在機(jī)器閱讀理解任務(wù)上“完全”打敗了人類。
  他表示,真正的閱讀理解過程遠(yuǎn)比我們想象的要復(fù)雜,以目前的技術(shù)水平還很難做到深層的推理和歸納。鑒于此,目前科大訊飛還在積極探索其他類型的閱讀理解,例如基于知識、常識的閱讀理解以及基于綜合線索的閱讀理解,并取得了一定的成績。相信在不久的將來,科大訊飛將在機(jī)器閱讀領(lǐng)域?yàn)榇蠹艺故靖嗟目赡堋?/div>
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點(diǎn)判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題