首頁>>廠商>>語音識(shí)別與合成>>得意音通

鄭方:產(chǎn)學(xué)研合作肩負(fù)標(biāo)準(zhǔn)與產(chǎn)業(yè)重任

鄭方 2006/02/24

  比爾·蓋茨在1999年出版的《未來時(shí)速》一書中曾經(jīng)預(yù)測(cè),人類計(jì)算的未來是讓計(jì)算機(jī)能夠看、聽、學(xué),能用自然語言與人類進(jìn)行交流。他的話正逐步成為現(xiàn)實(shí)。

擺在眼前的問題

  我們經(jīng)常會(huì)遇到這樣一些問題:QQ一下、短信一下,單純的文字交流已經(jīng)不能滿足需求,于是視頻聊天、攝像手機(jī)開始流行;面對(duì)著每天上G、上T字節(jié)的信息,如何快速搜索有用的信息?google一下、百度一下,幾萬甚至幾十萬條信息,通常能瀏覽的大概不到100條,于是人們希望精細(xì)查找;2008年奧運(yùn)會(huì)即將到來,學(xué)英語的浪潮正在席卷,然而更多的語種就需要機(jī)器翻譯……

  這些關(guān)乎中文語言理解技術(shù)應(yīng)用的需求日趨高漲。

  除了有關(guān)語言理解內(nèi)容方面的應(yīng)用之外,在2005年國際中文語言資源聯(lián)盟年會(huì)上,清華大學(xué)信息技術(shù)研究院副院長、CCC理事長、北京得意音通技術(shù)有限責(zé)任公司董事長鄭方教授還提到關(guān)于內(nèi)容安全的問題。首先,內(nèi)容在傳播過程中,我們?cè)趺幢WC有用的信息不被沒有授權(quán)的人獲取;其次,一些有害的信息,甚至一些危險(xiǎn)的信息,我們?cè)趺茨軌蜻^濾掉。這是一個(gè)非常大的問題,F(xiàn)在,在網(wǎng)上傳播的一些信息讓用戶很煩,包括垃圾郵件。而我們用簡單的方法過濾出這些信息往往達(dá)不到一個(gè)有效的效果,有的時(shí)候把一些有用的email、有用的網(wǎng)頁都擋在門外,實(shí)際上這樣的結(jié)果是我們非常不希望的。為什么會(huì)這樣呢?是因?yàn)槲覀儧]有真正理解這個(gè)email,也沒有真正理解這個(gè)網(wǎng)頁它所要表達(dá)的內(nèi)容,到底是反對(duì)某個(gè)事情,還是支持某個(gè)事情。如果我們通過語義的理解,知道這點(diǎn),那就可以做到有的放矢,有用的、有利的、安全的我就讓它過;相反就把它阻止在外面。以上講到的是怎么去防止的問題;哪些人可以對(duì)這個(gè)信息進(jìn)行存取,哪些人不能,這涉及生物認(rèn)證技術(shù)。聲紋技術(shù)可以做到進(jìn)行“真實(shí)自我和真實(shí)意思”的判斷。眾所周知,生物特征是不能被借走和偷走的,它展示的是“真實(shí)自我”,而利用語言中所包含的韻律等信息,就可以對(duì)“真實(shí)意思”做出判斷。

  這些就是目前中文信息處理產(chǎn)業(yè)要解決的一些問題。這些問題來自產(chǎn)業(yè)界的一些需求,也來自國家戰(zhàn)略的一些需要,而這些需求的滿足,正是中文信息產(chǎn)業(yè)的機(jī)遇所在。

觸手可及的商機(jī)

  鄭方教授在主題演講《發(fā)揮產(chǎn)學(xué)研通道優(yōu)勢(shì),開展自主創(chuàng)新活動(dòng),推動(dòng)中文信息產(chǎn)業(yè)發(fā)展》中充分論證了中文信息處理產(chǎn)業(yè)發(fā)展的商機(jī)。7億電話用戶的規(guī)模,2178億條的短信量和58.8%的增長率……這些數(shù)據(jù)的背后是龐大的市場(chǎng)機(jī)遇。

  鄭方以兩個(gè)行業(yè)為例向與會(huì)者介紹了技術(shù)的增長趨勢(shì)。國際生物集團(tuán)提供了一個(gè)未來生物識(shí)別市場(chǎng)的預(yù)測(cè),2005年達(dá)到21億美元,2007年將達(dá)到40億美元。在這里面,各種不同的生物特征,分別占據(jù)不同的比例。其中,2003年聲紋識(shí)別應(yīng)用占了4.1%的比例,這個(gè)比例不是很大,但是2004年就上升到了6%。IBG集團(tuán)曾經(jīng)預(yù)測(cè),到2007年,聲紋識(shí)別應(yīng)用可以占到10%,可見數(shù)據(jù)增長速度還是比較快的。

  再從商業(yè)模式的方面來看。在1980年到1995年之間,主要是門禁系統(tǒng)和PC的登錄方面應(yīng)用比較多;從1995年到2005年,在信息系統(tǒng)的身份認(rèn)證方面比例增加,增長速度也比較快;但從2005年開始,網(wǎng)絡(luò)用戶身份的驗(yàn)證,就逐漸占據(jù)主要的、顯著的地位了。眾所周知,網(wǎng)絡(luò)用戶之間可以對(duì)話,可以就各種問題進(jìn)行討論,但是,彼此之間卻不知道對(duì)方是誰。因此,“用聲音去判別身份”成為互聯(lián)網(wǎng)用戶驗(yàn)證的手段,同時(shí)為中文語音的發(fā)展帶來很大的空間。

  語言理解也是一樣。搜索引擎的企業(yè)數(shù)量和市場(chǎng)規(guī)?焖僭鲩L,到2006年,市場(chǎng)規(guī)?蛇_(dá)到24億元,增長速度很快。其中,面向行業(yè)的垂直搜索目前正在逐步引起業(yè)界的重視,相比而言,垂直搜索也更容易與中文語言處理技術(shù)互相促進(jìn),共同發(fā)展。因?yàn)榇怪彼阉鳎梢园阎形恼Z言理解技術(shù)限定到特定領(lǐng)域,有針對(duì)性地去理解用戶的需求。

  產(chǎn)業(yè)發(fā)展的商機(jī)已經(jīng)勢(shì)不可擋,從國家戰(zhàn)略來看,中文信息處理產(chǎn)業(yè)也是符合國家中長期規(guī)劃提出的科技發(fā)展的指導(dǎo)方針“自主創(chuàng)新、重點(diǎn)跨越、支撐發(fā)展和引領(lǐng)未來”。正是在這樣天時(shí)、地利、人和的條件之下,中文信息產(chǎn)業(yè)作為“中國信息產(chǎn)業(yè)中為數(shù)不多的、跨國企業(yè)未能壟斷、而民族企業(yè)的技術(shù)水平與國際先進(jìn)水平相當(dāng)?shù)念I(lǐng)域之一”,發(fā)展適逢其時(shí)。

產(chǎn)、學(xué)、研通道建設(shè)

  盡管產(chǎn)業(yè)機(jī)遇當(dāng)前,但是問題不容忽視。鄭方教授指出,在一些科研活動(dòng)和市場(chǎng)活動(dòng)中我們發(fā)現(xiàn),中文信息處理面臨著自主創(chuàng)新成果和產(chǎn)業(yè)開發(fā)之間的嚴(yán)重脫節(jié)。一方面,一些科研成果缺少產(chǎn)業(yè)化的考慮,好多教授、專家在大學(xué)、研究所做的一些成果追求的是高、精、深,追求的是學(xué)術(shù)水平,但是往往脫離產(chǎn)業(yè)需求;另一個(gè)方面,企業(yè)缺乏創(chuàng)新能力。更重要的是,科研機(jī)構(gòu)與企業(yè)之間缺乏溝通的渠道與機(jī)制。“國家在中長期規(guī)劃里面講的‘以企業(yè)為主體的自主創(chuàng)新’,這不應(yīng)該僅僅停留在口號(hào)上,我們必須有一種機(jī)制有一種渠道來做保證。很顯然,產(chǎn)、學(xué)、研的通道就是最好的一個(gè)實(shí)現(xiàn)途徑!编嵎秸f。

  國際中文語言資源聯(lián)盟的成立,就是為科研機(jī)構(gòu)和企業(yè)之間提供一個(gè)無縫的交流和合作的平臺(tái)。作為聯(lián)盟理事長,鄭方始終強(qiáng)調(diào)產(chǎn)學(xué)研通道建設(shè)對(duì)于中文信息處理產(chǎn)業(yè)發(fā)展的重要性。通過聯(lián)盟內(nèi)成員的合作,目前,聯(lián)盟成員共同承擔(dān)公安與邊防領(lǐng)域的課題,應(yīng)用于司法鑒定、技術(shù)偵查、2008年新版護(hù)照等重要領(lǐng)域;聯(lián)盟成員合作推出了多款聲紋認(rèn)證加密鎖;聯(lián)盟成員通力合作推出了國際首創(chuàng)的中文互動(dòng)短信服務(wù)、無線智能歌曲搜索業(yè)務(wù)、航班信息查詢,為手機(jī)用戶和互聯(lián)網(wǎng)用戶提供功能強(qiáng)大的智能信息服務(wù),開創(chuàng)了智能互聯(lián)網(wǎng)的新領(lǐng)域,這些產(chǎn)品都是已經(jīng)在中國移動(dòng)正式使用的。

  聯(lián)盟從2004年3月成立,到2005年,數(shù)據(jù)庫規(guī)模翻了一番。雖然從絕對(duì)數(shù)字上看不是很多,但語音和語言數(shù)據(jù)庫的創(chuàng)建是非常花時(shí)間,也非常花財(cái)力、物力的,因此,實(shí)現(xiàn)數(shù)據(jù)庫數(shù)量翻一番是得到很多聯(lián)盟成員支持的結(jié)果,也是得到海淀區(qū)支持的結(jié)果。另外,目前還有3個(gè)仍在開發(fā)的巨型說話人識(shí)別數(shù)據(jù)庫,這些數(shù)據(jù)庫都是萬人規(guī)模的。

  “未來我們要以促進(jìn)標(biāo)準(zhǔn)和產(chǎn)業(yè)的發(fā)展作為己任,首先是中文語音交互標(biāo)準(zhǔn)工作組。聯(lián)盟成員負(fù)責(zé)或參與起草的有三個(gè)標(biāo)準(zhǔn):語音識(shí)別(參與起草)、數(shù)據(jù)庫及標(biāo)注(負(fù)責(zé)起草)、聲紋識(shí)別(負(fù)責(zé)起草)。我們對(duì)標(biāo)準(zhǔn)的起草工作非常重視。另一方面,就是通過舉辦技術(shù)與應(yīng)用培訓(xùn)、與國內(nèi)及國際性的專業(yè)協(xié)會(huì)進(jìn)行產(chǎn)業(yè)聯(lián)盟等多方面的接觸與交流;通過發(fā)布聯(lián)盟網(wǎng)站,提供了聯(lián)盟成員之間交流合作、資源共享、形象宣傳、成果推廣等,促進(jìn)產(chǎn)業(yè)的發(fā)展!编嵎秸f。新的機(jī)遇等待著聯(lián)盟中產(chǎn)學(xué)研商各方的共同努力和推進(jìn)。

得意音通公司供稿 原文刊登在科學(xué)網(wǎng)



相關(guān)鏈接:
得意珠三角綜合智能信息增值平臺(tái)項(xiàng)目中標(biāo) 2009-08-20
北京軟件產(chǎn)品質(zhì)量檢測(cè)檢驗(yàn)中心對(duì)《海量語音文件的目標(biāo)說話人篩選系統(tǒng)》進(jìn)行測(cè)試 2009-06-25
廣東政府和清華大學(xué)舉行了全面開展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23
得意聲紋識(shí)別VPR4.0_b20080808新版本發(fā)布 2008-08-27

相關(guān)頻道:           文摘   技術(shù)_語音識(shí)別_文摘