發(fā)表評(píng)論分享按鈕

語義識(shí)別難住中國Siri 商用前景仍不明朗

2012/04/06

  4月5日消息,“Siri是催化劑,但是能否修成正果尚需時(shí)日! 小i機(jī)器人董事長(zhǎng)袁斌對(duì)TechWeb表示。

  自從去年10月,借助發(fā)布iPhone 4S之勢(shì)推出Siri語音問答系統(tǒng)以來,全世界都掀起了一場(chǎng)語音技術(shù)熱潮,這些長(zhǎng)期被邊緣化的公司瞬間成為了市場(chǎng)關(guān)注的焦點(diǎn)。前有Ciriis和Airi,后有科大訊飛的“語點(diǎn)”。


圖:Siri最難的技術(shù)不是語音,而是語義識(shí)別

  被資本市場(chǎng)高度熱捧的是市場(chǎng)是機(jī)會(huì)還是陷阱?目前下定論顯然有點(diǎn)早。

  過去的一個(gè)月,TechWeb走訪了國內(nèi)眾多從事語音技術(shù)的公司,發(fā)現(xiàn)這些Siri的跟隨者們都面臨的共同問題是,聽得懂你在說什么,卻不理解你在說什么。至少目前來看,語音市場(chǎng)距離大規(guī)模商用依然有不小的距離。

  這個(gè)問題的出現(xiàn)并不意外,因?yàn)榧幢闶翘O果的Siri同樣困擾于此。近日,Siri在國外遭到了多起訴訟,原因是Siri無法準(zhǔn)確理解用戶的問題,蘋果涉嫌夸大宣傳。由此可見,如果Siri尚且不夠完美,那么中國的Siri必定還有更多的路要走。

  “最后的禮物”不完美

  2011年10月,蘋果iPhone 4S發(fā)布,雖然iPhone 4S無甚亮點(diǎn),但其配備的語音控制助手Siri一經(jīng)發(fā)布便艷驚全球。被稱為喬布斯送給這個(gè)世界“最后的禮物”。

  這是蘋果唯一一款打上Beta標(biāo)簽的產(chǎn)品,但卻承載了巨大的期望。蘋果可以借此機(jī)會(huì)創(chuàng)建一個(gè)人工智能程序的生態(tài)系統(tǒng),將Siri做成平臺(tái),讓Siri與其他程序結(jié)合,Siri本身將成為入口。其結(jié)果是谷歌的搜索形式將被顛覆,用戶可以通過更自然的交互方式直接獲得答案!都~約時(shí)報(bào)》撰文稱:Siri代表著蘋果的商業(yè)未來,也預(yù)示著未來“搜索”的形態(tài)。

  雖然蘋果有長(zhǎng)遠(yuǎn)的規(guī)劃,但Siri的發(fā)布還是略顯倉促,實(shí)現(xiàn)這些美好愿景尚需時(shí)日。Siri所具有的發(fā)電子郵件、播放音樂、安排會(huì)議等諸多功能用戶使用頻率并不高。最新的一項(xiàng)調(diào)查顯示,30%的用戶從未使用Siri來發(fā)送電子郵件,32%的用戶分別表示自己從未使用Siri播放音樂。對(duì)Siri表示非常滿意的用戶只有55%。

  本月早些時(shí)候,紐約iPhone 4S用戶弗蘭克·法齊奧(Frank M. Fazio)在加州聯(lián)邦法院提起訴訟,指控蘋果發(fā)布的廣告中對(duì)Siri功能的描述存在“誤導(dǎo)性和欺騙性信息”。另一位iPhone 4S用戶大衛(wèi)·瓊斯(David Jones)在美國加州庫珀蒂諾對(duì)蘋果提起訴訟,指控蘋果錯(cuò)誤地描述了Siri功能。“Siri要么無法理解原告所提出的問題,要么在經(jīng)過長(zhǎng)時(shí)間等待后提供了錯(cuò)誤的答案!

  語義識(shí)別之難

  為什么Siri會(huì)有這些不完美?國內(nèi)從事了十年智能網(wǎng)絡(luò)機(jī)器人研究的小i機(jī)器人董事長(zhǎng)袁斌解釋稱,Siri最難的技術(shù)不是語音,而是語義識(shí)別。

  我們現(xiàn)在看到的Siri實(shí)際上由兩部分組成,一部分是語音識(shí)別,一部分是語義識(shí)別。當(dāng)用戶對(duì)Siri講一句話時(shí),語音識(shí)別分析出這句話說的是什么,語義識(shí)別分析出這句話是什么意思。語音和語義兩部分技術(shù)在Siri中所占的比例分別是20%和80%。也就是說,要正確理解用戶的意思并作出反應(yīng),語義識(shí)別實(shí)際上更為關(guān)鍵。

  脫胎于美國國防部技術(shù)的Siri真正擅長(zhǎng)的是語義識(shí)別。語音識(shí)別部分,Siri選擇跟語音識(shí)別引擎Nuance合作。Siri現(xiàn)在的任務(wù)是不斷加強(qiáng)其語義識(shí)別能力,建立更加龐大的數(shù)據(jù)庫。據(jù)說蘋果已經(jīng)在印度招大量工程師進(jìn)行數(shù)據(jù)庫的梳理。

  語義識(shí)別的另外一個(gè)挑戰(zhàn)是,內(nèi)容越多,對(duì)智能識(shí)別的挑戰(zhàn)越大,需要的算法更強(qiáng)。

  從事了多年語音技術(shù)研究的李開復(fù)也表達(dá)過類似的觀點(diǎn),他說:“人們一旦開使用語音跟你交流了,就會(huì)把你當(dāng)做一個(gè)人,這個(gè)帶來的超級(jí)高的期望值會(huì)給語音帶來很大的挑戰(zhàn)!

  Siri不適合創(chuàng)業(yè)公司

  Siri的火爆讓不少國內(nèi)的創(chuàng)業(yè)者非常興奮,因?yàn)樗碇粋(gè)可以探索的新方向。但是不少業(yè)內(nèi)人士對(duì)此表示懷疑態(tài)度。

  李開復(fù)曾在微博中稱:“‘中國Siri’創(chuàng)業(yè)計(jì)劃不太適合中國創(chuàng)業(yè)公司,需要解決的問題很多也很棘手,主要是新的智能語音控制技術(shù)如何引導(dǎo)用戶行為,再是克服海量數(shù)據(jù)學(xué)習(xí)門檻和應(yīng)用整合困難等!

  國內(nèi)現(xiàn)在已有的類Siri應(yīng)用,Ciriis和Airi,尚且都停留在娛樂層面。而前段時(shí)間科大訊飛高調(diào)發(fā)布的“訊飛語點(diǎn)”也并未有實(shí)質(zhì)性突破,如果一句話中間增加停頓,它便無法正確理解。

  袁斌認(rèn)為,要做中國的Siri,第一需要語料庫,第二需要人工智能的算法。訊飛擁有前者的優(yōu)勢(shì),但后者仍需積累摸索!靶枰L(zhǎng)期的、系統(tǒng)的平臺(tái)去處理每天進(jìn)來的海量的知識(shí),經(jīng)過長(zhǎng)期的集聚,形成工程化的產(chǎn)品,最后才能對(duì)每天進(jìn)來的知識(shí)進(jìn)行去重、篩選,同時(shí)能夠?qū)W習(xí)新的知識(shí)點(diǎn)!

  在這一點(diǎn)上,袁斌的小i機(jī)器人有值得借鑒的經(jīng)驗(yàn)。

  小i機(jī)器人是一款網(wǎng)絡(luò)機(jī)器人,主要應(yīng)用于運(yùn)營(yíng)商、銀行等的網(wǎng)絡(luò)客服系統(tǒng)。小i機(jī)器人從2001年開始開發(fā),最終以IM聊天機(jī)器人的形式推出,經(jīng)歷了個(gè)人用戶激增、產(chǎn)品線眾多、用戶滿意度下降、公司負(fù)擔(dān)過重等一系列問題,最終艱難轉(zhuǎn)型。而這些問題與今天的Siri以及類Siri應(yīng)用面臨的問題非常相似。

  袁斌認(rèn)為,無論誰做語音控制技術(shù)或者智能識(shí)別技術(shù),這些問題都無法繞開。解決了,則柳暗花明,解決不了,只有死路一條。

TechWeb



相關(guān)閱讀:
紐約時(shí)報(bào):iPhone催生“愚蠢游戲”興起 2012-04-06
Siri打電話與發(fā)短信功能流行 其它功能遭冷遇 2012-03-27
Siri發(fā)展趨勢(shì)預(yù)測(cè):主動(dòng)發(fā)現(xiàn)用戶感興趣內(nèi)容 2012-03-26
蘋果招募電話軟件工程師疑推自有移動(dòng)語音服務(wù) 2012-03-26
Siri登陸日本 用戶評(píng)價(jià)不佳 2012-03-14

熱點(diǎn)專題:  語音合成TTS 語音識(shí)別ASR    移動(dòng)互聯(lián)網(wǎng)
分類信息:  移動(dòng)互聯(lián)網(wǎng)_與_語音應(yīng)用  移動(dòng)互聯(lián)網(wǎng)_與_移動(dòng)  移動(dòng)互聯(lián)網(wǎng)_與_移動(dòng)