專訪王東:凝聚清華力量 推動(dòng)中國(guó)人工智能產(chǎn)業(yè)崛起

2015-08-28 16:00:08   作者:CTI論壇 楊小梅   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  21年前,通過一條64K的國(guó)際專線,中國(guó)全功能接入國(guó)際互聯(lián)網(wǎng),中國(guó)互聯(lián)網(wǎng)時(shí)代從此開啟。近年來,云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的廣泛應(yīng)用,把人類社會(huì)帶入大數(shù)據(jù)時(shí)代,而來自全球的海量數(shù)據(jù)為人工智能的發(fā)展提供了良好的條件,以深度學(xué)習(xí)為代表的算法發(fā)展,也使得機(jī)器有能力處理如此龐大的數(shù)據(jù)。人工智能技術(shù)實(shí)現(xiàn)跨越式進(jìn)步,智能語(yǔ)音交互、智能語(yǔ)義理解、生物特征技術(shù)被廣泛應(yīng)用。一個(gè)更加自然,更人性化的人機(jī)交互體系將成為未來發(fā)展的主流,人工智能時(shí)代開啟發(fā)展新篇章。

  人工智能是對(duì)人的意識(shí)、思維的信息過程的模擬。人工智能技術(shù)發(fā)展的前景是無限的,反映了人類探索自然同時(shí)也是探索自我的過程,在探索的漫漫長(zhǎng)路上會(huì)遇到很多困難,所以越是對(duì)人工智能應(yīng)該抱有客觀的態(tài)度,對(duì)產(chǎn)業(yè)和技術(shù)的發(fā)展越有好處。人工智能作為當(dāng)下最炙手可熱的熱門領(lǐng)域之一,應(yīng)該少一點(diǎn)浮躁,多幾分穩(wěn)健。

  人工智能創(chuàng)新發(fā)展需要以堅(jiān)實(shí)的理論研究、強(qiáng)大的技術(shù)能力以及雄厚的產(chǎn)業(yè)基礎(chǔ)作為支撐,作為國(guó)內(nèi)最早從事人工智能技術(shù)研究的大學(xué),清華大學(xué)在人工智能領(lǐng)域聚集了最多的高端科技人才力量,清華大學(xué)不僅始終堅(jiān)持基礎(chǔ)理論研究、同時(shí)展開應(yīng)用理論研究和應(yīng)用技術(shù)開發(fā)。秉承“自強(qiáng)不息,厚德載物”的校訓(xùn),清華人的穩(wěn)重和務(wù)實(shí)對(duì)人工智能產(chǎn)業(yè)是非常有幫助的,有了清華力量,中國(guó)的人工智能產(chǎn)業(yè)才能穩(wěn)定堅(jiān)固地向前發(fā)展。

清華大學(xué)語(yǔ)音技術(shù)專家、清華靈云人工智能研究中心首席科學(xué)家王東老師

(圖為:清華大學(xué)語(yǔ)音技術(shù)專家、清華靈云人工智能研究中心首席科學(xué)家王東老師)

  日前,CTI論壇記者獨(dú)家專訪了清華大學(xué)語(yǔ)音技術(shù)專家、清華靈云人工智能研究中心首席科學(xué)家王東老師,王東老師具有清華人的典型特點(diǎn):為人穩(wěn)重、低調(diào)、務(wù)實(shí),學(xué)識(shí)豐富。王東老師表示:“服務(wù)國(guó)民經(jīng)濟(jì)主戰(zhàn)場(chǎng),服務(wù)國(guó)家創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略,這是清華的報(bào)國(guó)之路。清華和捷通華聲合作,可以將清華在人工智能領(lǐng)域的最新科研成果快速轉(zhuǎn)化為產(chǎn)業(yè)力量,服務(wù)國(guó)民經(jīng)濟(jì),同時(shí)為高科技企業(yè)提供持續(xù)發(fā)展的動(dòng)力。到目前為止,捷通華聲與清華的合作誕生了靈云平臺(tái)的一系列重要能力,包括語(yǔ)音識(shí)別、說話人識(shí)別、自然語(yǔ)言問答、機(jī)器翻譯、人臉識(shí)別、指紋識(shí)別等已經(jīng)形成產(chǎn)業(yè)化力量。因此”靈云科技、源自清華“絕不只是一個(gè)口號(hào),而是眾所周知的事實(shí)。”

  CTI論壇記者:人工智能是在未來二十年大行其道的科技,也是有史以來最難的科學(xué)之一。請(qǐng)介紹清華大學(xué)在人工智能領(lǐng)域的研究?jī)?yōu)勢(shì)。

  王東:清華大學(xué)在人工智能領(lǐng)域具有長(zhǎng)期技術(shù)積累與研究歷史。1958年6月清華成立自動(dòng)控制系,即計(jì)算機(jī)系的前身,包括計(jì)算機(jī)和自動(dòng)控制兩個(gè)方向,從事自動(dòng)控制理論方面的研究。自控系后分成計(jì)算機(jī)和自動(dòng)化兩個(gè)系,這兩個(gè)系早年從事關(guān)于人工智能技術(shù)的研究。1987年7月,智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室開始籌建,1990年2月通過國(guó)家驗(yàn)收,并正式對(duì)外開放運(yùn)行。從2004年開始,實(shí)驗(yàn)室參與籌建清華信息科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室。清華語(yǔ)音語(yǔ)言中心即是這個(gè)實(shí)驗(yàn)室的一部分。

  當(dāng)前,清華的人工智能技術(shù)在自動(dòng)化、計(jì)算機(jī)、電子、信息技術(shù)研究院、軟件學(xué)院等院系都有深入研究,研究?jī)?nèi)容覆蓋智能控制、模式識(shí)別,自然語(yǔ)言處理、數(shù)據(jù)挖掘等眾多方向。個(gè)人感覺清華大學(xué)在人工智能領(lǐng)域的研究?jī)?yōu)勢(shì)主要包括(1)積累豐厚,人才眾多(2)理工結(jié)合,重視實(shí)踐 (3)點(diǎn)面結(jié)合,學(xué)科齊全。

  CTI論壇記者:請(qǐng)介紹捷通華聲與清華大學(xué)在人工智能領(lǐng)域的深入合作及靈云平臺(tái)的發(fā)展情況。如何更深入地理解“靈云科技、源自清華”?

  王東:捷通華聲公司與清華大學(xué)有長(zhǎng)期合作傳統(tǒng)。公司幾位創(chuàng)始人本身即清華畢業(yè)生,其早期的語(yǔ)音合成、OCR、手寫識(shí)別技術(shù)即與清華有很深的淵源。

  2013年以來,捷通和清華若干院系展開全面合作,在語(yǔ)音信號(hào)處理、自然語(yǔ)言處理、圖象處理等多個(gè)領(lǐng)域與清華教師建立合作項(xiàng)目,取得豐碩成果,這些成果是今在靈云智能平臺(tái)的基礎(chǔ)。一方面,靈云平臺(tái)為清華技術(shù)提供了用武之地,另一方面,清華技術(shù)也為靈云平臺(tái)提供了堅(jiān)實(shí)有力的支撐。

  2014年,捷通華聲與北京清華工業(yè)研究院成立“靈云人工智能研究中心”,將前期合作項(xiàng)目進(jìn)行整合,集中力量發(fā)展人工智能技術(shù)并推進(jìn)產(chǎn)業(yè)化應(yīng)用。

  到目前為止,捷通華聲與清華的合作誕生了靈云平臺(tái)的一系列重要能力,包括語(yǔ)音識(shí)別、說話人識(shí)別、自然語(yǔ)言問答、機(jī)器翻譯、人臉識(shí)別、指紋識(shí)別等已經(jīng)形成產(chǎn)業(yè)化力量。這些技術(shù)單靠捷通華聲一個(gè)公司是無論如何無法完成的,因此“靈云科技、源自清華”絕不只是一個(gè)口號(hào),而是眾所周知的事實(shí)。

\

  CTI論壇記者:清華大學(xué)在語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別等智能語(yǔ)音領(lǐng)域可以說擁有國(guó)內(nèi)很強(qiáng)的研究力量,但在最近幾年,很少聽到清華大學(xué)在語(yǔ)音研究領(lǐng)域中的所取得的成果,尤其是在產(chǎn)業(yè)界,相比國(guó)內(nèi)其他研究機(jī)構(gòu),清華大學(xué)的影響力似乎有些小。請(qǐng)您介紹一下,清華大學(xué)在智能語(yǔ)音領(lǐng)域的研究水平、研究方向和如何增強(qiáng)清華大學(xué)在智能語(yǔ)音產(chǎn)業(yè)中的影響力。

  王東:清華大學(xué)在智能語(yǔ)音領(lǐng)域里的實(shí)力一直以來都是相當(dāng)強(qiáng)大的,擁有一大批優(yōu)秀的實(shí)驗(yàn)室和專家學(xué)者,培養(yǎng)出大量?jī)?yōu)秀學(xué)生,產(chǎn)生了很多優(yōu)秀的科研成果。然而,也確實(shí)存在一定問題,比如學(xué)生數(shù)量不足,信息共享不充分,導(dǎo)致集群優(yōu)勢(shì)不明顯。清華大學(xué)校風(fēng)也更加注重務(wù)實(shí),確實(shí)在產(chǎn)業(yè)界,過去很難聽到清華的聲音,當(dāng)然這里面也有多方面原因,比如學(xué)生選擇方向比較豐富,留在語(yǔ)音處理行業(yè)的人較少,創(chuàng)業(yè)氛圍有待加強(qiáng)等。增強(qiáng)清華大學(xué)在智能語(yǔ)音產(chǎn)業(yè)中的影響力恐怕還是需要培養(yǎng)更多這一領(lǐng)域的專業(yè)人才。目前這一局面正在得到改變,尤其在與捷通華聲合作,共同發(fā)展靈云平臺(tái)以來,“靈云科技 源自清華”逐漸為產(chǎn)業(yè)界所理解和支持,同時(shí)也擴(kuò)大了清華大學(xué)語(yǔ)音技術(shù)在產(chǎn)業(yè)界中的影響力。

\

  CTI論壇記者:請(qǐng)介紹清華大學(xué),包括清華信息技術(shù)研究院在語(yǔ)音語(yǔ)義識(shí)別、深度學(xué)習(xí)、建模及應(yīng)用的傳統(tǒng)技術(shù)和最新研究進(jìn)展。

  王東:清華大學(xué)在語(yǔ)音識(shí)別、自然語(yǔ)言理解等方面取得一系列重要進(jìn)展,這有發(fā)表在IEEE TASLP, AAAI, ICASSP, ACL等一系列國(guó)際頂級(jí)期刊會(huì)議上的論文為證。如和捷通華聲直接合作的馬少平老師、孫茂松老師、李涓子老師等都是這些領(lǐng)域里聲名赫赫的專家。就我所在的信息技術(shù)研究院語(yǔ)音語(yǔ)言技術(shù)中心而言,我們最近的研究包括深度遞歸神經(jīng)網(wǎng)絡(luò)在語(yǔ)音建模方面的優(yōu)化,利用遞歸網(wǎng)絡(luò)進(jìn)行語(yǔ)義計(jì)算等,這些已經(jīng)或者很快會(huì)應(yīng)用到靈云平臺(tái)中,形成新一代語(yǔ)音識(shí)別和自然語(yǔ)言理解引擎的基礎(chǔ)。

  CTI論壇記者:每個(gè)成功的客服機(jī)器人背后,都有個(gè)靠譜的人工智能。靈云客服機(jī)器人的“能說會(huì)聽,能寫會(huì)看、能思考會(huì)判斷”源自于國(guó)內(nèi)首個(gè)全方位人工智能開放平臺(tái)-靈云平臺(tái)強(qiáng)大的全方位人工智能技術(shù)能力,請(qǐng)問其核心技術(shù)有哪些?

  王東:靈云平臺(tái)當(dāng)前的技術(shù)能力包括語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別、人臉識(shí)別、指紋識(shí)別、自然語(yǔ)言理解、機(jī)器翻譯等,幾乎每種技術(shù)都可以用到靈云客服機(jī)器人中。

  CTI論壇記者:機(jī)器人和“智能機(jī)器人”的區(qū)別是什么?請(qǐng)介紹智能機(jī)器人的發(fā)展和歷程。新一代智能機(jī)器人所需要解決的新技術(shù)有哪些?

  王東:機(jī)器人通常是指可自動(dòng)完成某一動(dòng)作的人形機(jī)械裝置,更廣泛意義上的機(jī)器人則形態(tài)各異,如古代傳說魯班造的機(jī)械鳥和諸葛亮造的用以運(yùn)糧的木牛流馬等。當(dāng)然現(xiàn)代機(jī)器人主要是指電器時(shí)代的自動(dòng)行為機(jī)器,如機(jī)械臂,深海探測(cè)器等。

  智能機(jī)器人則是有頭腦的機(jī)器人,主要是依靠現(xiàn)代計(jì)算機(jī)技術(shù)實(shí)現(xiàn)能聽會(huì)說,能寫會(huì)看、會(huì)思會(huì)想的擬人化機(jī)器人,代表的如谷歌的自動(dòng)駕駛汽車,日本的服務(wù)機(jī)器人等。新一代智能機(jī)器人已經(jīng)在很多特定場(chǎng)合大顯身手,但在智能化方面還有待提高,特別是對(duì)抗境噪聲、應(yīng)對(duì)突發(fā)事件、自主推理、自主學(xué)習(xí)等方面還有很多問題需要研究。

  CTI論壇記者:新一代智能機(jī)器人如何解決自然語(yǔ)言的理解?如何解決從QA的模板變成語(yǔ)義的表達(dá)式?如何解決傳統(tǒng)的模式識(shí)別,轉(zhuǎn)變?yōu)榈纳疃壬窠?jīng)網(wǎng)絡(luò)技術(shù),具有機(jī)器學(xué)習(xí)的能力,和人一樣進(jìn)行能夠進(jìn)行自學(xué)習(xí)和思考?

  王東:新一代機(jī)器人可能需要依賴大數(shù)據(jù)技術(shù)和深度學(xué)習(xí)技術(shù)來解決自然語(yǔ)言理解中的多樣性問題,這一問題也直接關(guān)系到QA任務(wù)中對(duì)人為設(shè)計(jì)模板的依賴。

  簡(jiǎn)單地說,傳統(tǒng)QA需要人為設(shè)計(jì)一些問法模板來處理自然語(yǔ)言的多樣性,這一方法繁瑣而且很難覆蓋全面。自動(dòng)模板抽取可以部分解決問題,但大量的模板會(huì)對(duì)系統(tǒng)運(yùn)行效率產(chǎn)生壓力。深度學(xué)習(xí)成為主流研究方法之后,研究者們意識(shí)到這種語(yǔ)言上的多樣性可以用神度神經(jīng)網(wǎng)絡(luò)來解決,利用大量數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練,機(jī)器可以學(xué)得哪些詞比較重要,哪些詞順序可以顛倒等信息,這些信息對(duì)所有任務(wù)都是通用的,因此可以移植到各個(gè)領(lǐng)域上來。同時(shí),神經(jīng)網(wǎng)絡(luò)可以隨著數(shù)據(jù)量的增加自動(dòng)學(xué)習(xí)新詞和新的說法,實(shí)現(xiàn)自主學(xué)習(xí)。自主思考到目前為止還處在研究階段,目前也許我們只能依靠大量數(shù)據(jù)實(shí)現(xiàn)“類思考”。

  CTI論壇記者:機(jī)器人和人一樣,也是分職業(yè)、分行業(yè),對(duì)于新一代的智能機(jī)器人而言,如何解決渠道入口、業(yè)務(wù)服務(wù)、大數(shù)據(jù)分析等一體化的解決方案,實(shí)現(xiàn)對(duì)于整個(gè)數(shù)字和新媒體渠道方面的管理?

  王東:這一問題主要涉及應(yīng)用場(chǎng)景的通用性和特異性,也是智能機(jī)器人在實(shí)際應(yīng)用中需要解決的問題,特別重要的是如何將人類已有的格式化知識(shí)和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)相結(jié)合,實(shí)現(xiàn)知識(shí)和數(shù)據(jù)的雙重驅(qū)動(dòng)。這方面研究領(lǐng)域已經(jīng)有一些重要的成果出現(xiàn),但還需要更多探索。

  CTI論壇記者:伴隨人工智能產(chǎn)業(yè)的崛起,捷通華聲和清華大學(xué)已建立起穩(wěn)固的戰(zhàn)略合作關(guān)系,在合作基礎(chǔ)上,2014年又共同創(chuàng)建了清華靈云人工智能研究中心,捷通華聲和清華大學(xué)人工智能研究力量,包括在智能語(yǔ)音、智能圖像、智能語(yǔ)義理解等領(lǐng)域合作,取得了豐碩的成果,請(qǐng)分享并展望未來的發(fā)展前景。

  王東:靈云人工智能中心助推清華大學(xué)產(chǎn)學(xué)研一體化,能夠把清華大學(xué)最新的人工智能科研成果轉(zhuǎn)換成產(chǎn)品或生產(chǎn)力以此實(shí)現(xiàn)實(shí)用化,同時(shí)把市場(chǎng)的信息通過研究中心傳遞給各個(gè)研究部門,了解市場(chǎng)和產(chǎn)業(yè)發(fā)展的動(dòng)態(tài),起到窗口和橋梁的作用。窗口是對(duì)外展示清華人工智能的科技實(shí)力,橋梁則是架起產(chǎn)學(xué)研一體化進(jìn)行轉(zhuǎn)換的橋梁。

  個(gè)人覺得研究機(jī)構(gòu)和企業(yè)需求結(jié)合是個(gè)非常重要的創(chuàng)新模式,清華靈云人工智能研究中心的創(chuàng)立在這一方面做了有益的探索。通過和企業(yè)合作,研究更加有的放矢,同時(shí)可以快速將研究成果形成生產(chǎn)力,為研究機(jī)構(gòu)提供更多資金支持,而企業(yè)則在這一過程中得到持續(xù)發(fā)展的源動(dòng)力。未來我們可能會(huì)在分工合作方面更加精細(xì)化,使清華力量和捷通華聲力量得到充分互補(bǔ),形成更強(qiáng)大的合力。

  結(jié)語(yǔ):現(xiàn)階段,人工智能正進(jìn)入新一輪創(chuàng)新發(fā)展高峰,有望引領(lǐng)信息通信產(chǎn)業(yè)的革命性突破。人工智能技術(shù)的應(yīng)用對(duì)中國(guó)是產(chǎn)業(yè)機(jī)遇,值得驕傲的是,在為數(shù)不多的領(lǐng)域里,中國(guó)在人工智能的技術(shù)研究上并不落后于世界。作為新興產(chǎn)業(yè)升級(jí)換代的關(guān)鍵技術(shù),人工智能的發(fā)展對(duì)中國(guó)的產(chǎn)業(yè)升級(jí)至關(guān)重要,無論“+智能”還是“智能+”都將促使各個(gè)產(chǎn)業(yè)或產(chǎn)品形態(tài)發(fā)生“智”的變化。

  秉持“清華大學(xué)人工智能必須在中國(guó)的人工智能產(chǎn)業(yè)中有所作為”的理想,凝聚清華力量,清華和捷通華聲結(jié)盟,共同實(shí)現(xiàn)“靈云科技 源自清華 服務(wù)全球”的發(fā)展戰(zhàn)略,共同開創(chuàng)中國(guó)人工智能領(lǐng)域的全新局面,更希望人工智能產(chǎn)業(yè)能夠幫助中國(guó)在世界級(jí)的產(chǎn)業(yè)化升級(jí)中不為人后,面對(duì)產(chǎn)業(yè)機(jī)遇清華與靈云當(dāng)仁不讓!

  被采訪人簡(jiǎn)介:王東,清華大學(xué)學(xué)士、碩士,英國(guó)愛丁堡大學(xué)博士,歷任Oracle 中國(guó)軟件工程師,IBM中國(guó)高級(jí)軟件工程師,英國(guó)愛丁堡大學(xué)Marie Curie 研究員,法國(guó)EURECOM博士后研究員,美國(guó)Nuance公司高級(jí)研究科學(xué)家,現(xiàn)任清華大學(xué)語(yǔ)音語(yǔ)言中心助理教授,中心副主任。曾獲歐盟瑪麗-居里青年研究學(xué)者獎(jiǎng)(2006-2009)。

  王東博士的主要研究方向包括機(jī)器學(xué)習(xí),信號(hào)處理,語(yǔ)音識(shí)別,自然語(yǔ)言理解,信息提取等,在信號(hào)稀疏性分析,深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)等機(jī)器學(xué)習(xí)方面取得顯著成績(jī),在IEEE trans。 on Signal processing 等國(guó)際一流期刊和會(huì)議發(fā)表多篇論文,其中SCI期刊論文10余篇,EI/ISTP論文50余篇,是IEEE transactions on Audio,Speech and Language, NeuraComputin,ICASSP、Interspeech、SLT等國(guó)際語(yǔ)音信號(hào)處理領(lǐng)域主要期刊和會(huì)議的審稿人。王東博士是全國(guó)人機(jī)語(yǔ)音通訊會(huì)議常設(shè)機(jī)構(gòu)委員、秘書長(zhǎng),是亞太信號(hào)信息處理聯(lián)盟(APASIPA)語(yǔ)音專委會(huì)委員、秘書,是國(guó)際標(biāo)準(zhǔn)與語(yǔ)音數(shù)據(jù)資源委員會(huì)(COCOSDA)大陸區(qū)代表之一。

  王東博士是歐盟ALIAS項(xiàng)目主要研究科學(xué)家,法國(guó)ACAV項(xiàng)目主要研究科學(xué)家,法國(guó)外交部M4SVR項(xiàng)目負(fù)責(zé)人,主要研究科學(xué)家。目前主持一項(xiàng)國(guó)家自然科學(xué)基金項(xiàng)目,一項(xiàng)國(guó)家教育部博士點(diǎn)基金項(xiàng)目。

  聲明:CTI論壇(CTiforum)版權(quán)作品,未經(jīng)CTiforum書面授權(quán),嚴(yán)禁轉(zhuǎn)載,違者將被追究法律責(zé)任。

分享到: 收藏

專題