評論:語音識別適合網(wǎng)絡應用

Bill Pechey 2006/10/24

  微軟的語音識別技術以及對揚聲器獨立的語音識別軟件的出現(xiàn),讓我們開始關注語音識別技術的發(fā)展和應用。

  IT行業(yè)有時候看起來就好像是城市中的公交車,可能很多年都沒有變,但是突然出現(xiàn)了大量的改變。最近,Nuance公布了它最新版的語音識別軟件Dragon Naturally Speaking 9,而微軟也在經(jīng)歷過一次慘痛的失敗后,在SpeechTEK大會上重新推出了他令人印象深刻的語音技術產(chǎn)品。

  我曾經(jīng)用過這兩個語音識別軟件的前一個版本,客觀地說,如果使用高質(zhì)量的麥克風,它們都有很好的表現(xiàn)。雖然我還沒有用過Dragon 9,但是據(jù)用過的人說,它比以前的版本有了很大的進步。除了精確度有所提高外,它也是第一個具有獨立揚聲器模式的語音識別軟件。如果這一功能真的有效,那么將為語音識別技術打開一個廣闊的應用空間。

  我一直認為對著電腦說話是應該被避免的,不過微軟看上去好像并不認同,從他在Windows Vista中加入語音識別技術就可以看出。而且我認為當Windows Vista大面積發(fā)行后,微軟將更加公開推動語音識別技術,但愿這不會導致像在公車上大聲講電話這種不文明行為的泛濫。

  目前各界對于語音識別技術的研究熱情令我有些驚訝,很多大型企業(yè)都有這方面的專業(yè)研究團隊,各大院校的有關研究也很多。如果不是要對著電腦說話,如此大規(guī)模的研究又是為了什么?也許答案是網(wǎng)絡應用。

  歐洲電信標準協(xié)會(Etsi)有一個叫做Aurora的項目,即開發(fā)一套在移動網(wǎng)絡上的分布式語音識別應用標準。該標準規(guī)定,部分語音識別引擎工作在移動終端設備上,并將語音傳輸給識別中心。我對這種應用的接受程度比前面所說的要大,畢竟對著手機說話要比對著筆記本說話容易被人接受。

  Etsi表示,語音識別的其中一項應用是用戶在路上對著電話講述會議內(nèi)容,然后將這些內(nèi)容通過郵件發(fā)送給自己,以便在回到辦公室或回到住所之后再對會議內(nèi)容進行進一步編輯。這聽上去挺不錯的,用戶不會再去考慮其它一些網(wǎng)絡服務商所提供的類似收費服務了。

  正如目前流行的SpinVox 服務所展示的,用戶在收到語音信箱的留言后,不是聽到錄音,而是看到留言的文字內(nèi)容。一個中央語音識別系統(tǒng)可以讓企業(yè)網(wǎng)絡也具有類似的功能,由于微軟的Office Communications Server 2007 內(nèi)置了語音識別技術,因此也許這會是企業(yè)的一個不錯的選擇。

  比爾。蓋茨說,語音識別技術將成為未來十年的一個主流技術,這一點我也認可,但是這種技術在網(wǎng)絡應用中的規(guī)模也許比在獨立PC應用上的規(guī)模更大。無論如何,企業(yè)現(xiàn)在也應該開始考慮一下,語音識別技術到底是不是會對自己的系統(tǒng)效率有提高作用。

CNET科技資訊網(wǎng)(www.cnetnews.com.cn)



相關鏈接:
Dynamics的“靈活”戰(zhàn)略 2009-09-28
微軟國內(nèi)首推Push mail 酷派3G產(chǎn)品率先支持 2009-09-28
鮑爾默:我們搞砸了Windows Mobile 7 2009-09-25
微軟全球基礎服務部門副總裁離職加盟思科 2009-09-24
微軟推最新手機操作系統(tǒng)WindowsMobile6.5 2009-09-04

相關頻道:           文摘   技術_語音識別_文摘