首頁 > 新聞 > 國內(nèi) >

智能語音怎樣不再“熱一陣、死一陣”的輪回?

2014-07-15 15:11:28   作者:   來源:人民郵電報(bào)   評論:0  點(diǎn)擊:


  2014年7月15日消息,基于語音技術(shù)的人工智能聊天機(jī)器人“小冰”火了!在微博平臺上,“小冰”與無數(shù)“大V”聊天,并創(chuàng)下了72小時(shí)內(nèi)1.3億人次的對話量。截至7月11日,“小冰”的微博粉絲數(shù)已超過77萬。曾有專家表示,智能語音五年火一次,經(jīng)歷著“熱一陣、死一陣”的輪回,此番技術(shù)浪潮能否打破這個(gè)魔咒還需企業(yè)自己選擇,是打造無所不能的“變形金剛”,還是心無旁騖力爭在小范圍做精做細(xì),不同的方向會帶來不同的命運(yùn)。

  國際巨頭搶灘市場

  在開發(fā)者的構(gòu)想中,蘋果的Siri應(yīng)該是一個(gè)“任務(wù)引擎”,可以預(yù)測到用戶需要什么,并在用戶提出要求之前就打點(diǎn)好一切。但是它的使用率不夠理想,一項(xiàng)調(diào)查顯示,Siri推出兩年后,2330名iPhone用戶中僅有15.2%使用過Siri。

  GoogleNow是谷歌在I/O開發(fā)者大會上隨安卓4.1系統(tǒng)同時(shí)推出的一款重量級應(yīng)用。GoogleNow優(yōu)于Siri的一個(gè)先天優(yōu)勢在于與谷歌搜索功能的結(jié)合,用戶搜索的關(guān)鍵詞被記錄下來,GoogleNow智能化讀取關(guān)鍵詞后,為用戶提供相關(guān)的語音服務(wù)。此外,該應(yīng)用的語音識別功能也得以加強(qiáng),加上谷歌強(qiáng)大的“知識圖”,語音搜索結(jié)果非常準(zhǔn)確?上У氖,GoogleNow只是作為Google Search的一個(gè)插件,僅將自然語義的語音搜索做到了應(yīng)用里。

  微軟宣布將在下一代移動操作系統(tǒng)中加入智能語音系統(tǒng),取名Cortana(“小娜”)。這個(gè)號稱“全球首個(gè)真正的個(gè)人數(shù)字助理”擁有強(qiáng)大的學(xué)習(xí)和上下文聯(lián)想功能。“小娜”還能兼容第三方應(yīng)用程序,極大地豐富了使用體驗(yàn)?梢“小娜”的方向是朝著人工智能和移動端在布局。

  IBM的聊天語音助手“Cognea”目前已經(jīng)有4萬多用戶,這些用戶能在Cognea所提供的免費(fèi)語音助手定制平臺上獲得專屬于自己的“語音機(jī)器人”。IBM目前正在努力將其開發(fā)的最新系統(tǒng)Watson打造成現(xiàn)實(shí)版的人機(jī)智能對話類電腦系統(tǒng),以期擊垮“Siri姐”和“小娜妹”。

  國內(nèi)IT企業(yè)“不等閑”

  目前,我國語音技術(shù)廠商基本分為三類:第一類是傳統(tǒng)語音技術(shù)廠商,一般從科研院所基礎(chǔ)研究脫胎,包括像科大訊飛(中國科技大學(xué))、捷通華聲(清華大學(xué)、中科院聲學(xué)所、北京大學(xué))等,其中訊飛語點(diǎn)是由科大訊飛推出的類Siri中文語音助手,目前已經(jīng)推出Android、iOS版,并成功進(jìn)入AppStore,和Siri展開正面競爭。

  第二類是互聯(lián)網(wǎng)廠商,包括百度、騰訊等,他們?yōu)榻o其廣大的互聯(lián)網(wǎng)用戶提供更好的增值服務(wù),普遍采用戰(zhàn)略合作或者收購等方式,掌握智能語音技術(shù),推廣語音服務(wù)。其中,百度語音助手是一款支持語音指令、語音搜索、語音對話功能的智能語音服務(wù)軟件。

  第三類是創(chuàng)業(yè)企業(yè),像云知聲、思必馳等,他們專注于某些行業(yè)領(lǐng)域,比如汽車、家電、教育、社交網(wǎng)絡(luò)來推廣自己的語音技術(shù)和產(chǎn)品。小i機(jī)器人公司一直以來長期專注于智能機(jī)器人技術(shù)的研發(fā)及產(chǎn)業(yè)應(yīng)用。目前服務(wù)的用戶超過2億,每年有上百億次的對話互動。小i機(jī)器人廣泛應(yīng)用于互聯(lián)網(wǎng)、運(yùn)營商、金融、航空、汽車、電子政務(wù)等領(lǐng)域。

  在糾結(jié)中發(fā)展

  望洋興嘆:海量知識vs技術(shù)局限

  在“語音識別”方面,目前智能語音軟件的表現(xiàn)都不俗,但“語義分析”則不同,它需要軟件開發(fā)者掌握大量語言數(shù)據(jù)。互聯(lián)網(wǎng)中已經(jīng)積累了大量的用戶產(chǎn)生的知識,主要存在于以下這幾類網(wǎng)站中:一是問答類網(wǎng)站,如百度知道;二是維基百科;三是書籍電影等開放評價(jià)網(wǎng)站,如豆瓣;四是美食評價(jià)網(wǎng)站,如大眾點(diǎn)評;五是商品評價(jià)信息,如淘寶網(wǎng)。由于智能語音應(yīng)用尚未有能力整合這些互聯(lián)網(wǎng)的大量信息,無法提供全面的數(shù)據(jù)支持。此外,由于中文方言繁多,對口音甚至方言的識別,需要大量語料積累,非經(jīng)濟(jì)實(shí)力和用戶基礎(chǔ)雄厚不能做到。
 

分享到: 收藏

專題