首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識(shí)別(ASR)  語音識(shí)別產(chǎn)品

 

聲龍語音識(shí)別系統(tǒng)使用手記

姚兵 2001/11/29

  美國聲龍(Dragon Systems)公司是一家專門從事語音識(shí)別技術(shù)研究和開發(fā)的公司,已經(jīng)開發(fā)出多款語音識(shí)別軟件。它最新推出了漢語普通話版的語音識(shí)別軟件——聲龍龍年版(Dragon Speech,以下簡稱聲龍)。此軟件采用了多種最新識(shí)別技術(shù),利用新型的語音識(shí)別模式,大大提高了語音識(shí)別率。

優(yōu)秀的語音識(shí)別率

  本刊評(píng)測(cè)實(shí)驗(yàn)室根據(jù)不同用戶的需要,主要針對(duì)語音識(shí)別率對(duì)聲龍語音識(shí)別軟件進(jìn)行了測(cè)試。我們把測(cè)試的文章分為三類: 新聞?lì)、技術(shù)類和文學(xué)類。每篇文章約500字。測(cè)試中,本實(shí)驗(yàn)室使用了兩臺(tái)不同速度的計(jì)算機(jī),一臺(tái)機(jī)器的配置為Intel Celeron 500MHz CPU、128MB內(nèi)存、6.4GB硬盤,另一臺(tái)配置為 AMD K7-550 CPU、128MB內(nèi)存、15GB硬盤。軟件環(huán)境為Windows 2000中文專業(yè)版。每一組測(cè)試前都重新安裝聲龍語音識(shí)別軟件(測(cè)試結(jié)果見附表)。通過測(cè)試我們發(fā)現(xiàn),聲龍對(duì)于新聞?lì)愇恼碌恼Z音識(shí)別率最高,其次是文學(xué)類,專業(yè)文章由于其中含有大量專業(yè)術(shù)語和英文單詞,識(shí)別率相對(duì)較低。

  然后,我們又利用聲龍?zhí)赜械脑~匯生成器,讓聲龍自行辨別文章中的詞匯并自動(dòng)添加到自建詞庫中,并針對(duì)其中的一些英文單詞或縮寫對(duì)聲龍進(jìn)行語音識(shí)別訓(xùn)練,之后我們?cè)俅武浫胪黄獙I(yè)文章。結(jié)果非常令人滿意,從附表可以看出識(shí)別率有了明顯提高。最后,我們又錄入了另一篇相同領(lǐng)域的專業(yè)文章中的一段(512字)。首次錄入的錯(cuò)別字有46個(gè),識(shí)別正確率為91%。與第一篇文章相比,識(shí)別率有了明顯提高。

方便快捷地錄入

  聲龍的錄入速度也是較高的,我們?cè)跍y(cè)試時(shí)得到的平均識(shí)別速度為112字/min。我們有理由相信,經(jīng)過訓(xùn)練,聲龍的識(shí)別速度還會(huì)提高。另外,計(jì)算機(jī)的配置高低也對(duì)識(shí)別速度有一定影響。我們分別用一臺(tái)配置了Intel Celeron 500MHz CPU、128MB內(nèi)存的計(jì)算機(jī)和一臺(tái)配置了AMD K7-550 CPU、128MB內(nèi)存的計(jì)算機(jī)進(jìn)行了比較測(cè)試。使用后者每分鐘識(shí)別的字符數(shù)要比使用前者多10~20個(gè)。

  通過本刊評(píng)測(cè)實(shí)驗(yàn)室的測(cè)試,聲龍語音識(shí)別軟件可以與大部分Windows程序兼容,尤其在Microsoft Word中“聲龍”加入了自己的工具菜單,啟動(dòng)非常方便。而且,聲龍軟件與Windows 2000的兼容性也非常好。除了語音輸入外,聲龍還可以讓用戶利用語音對(duì)計(jì)算機(jī)進(jìn)行一些操作,如“打開文檔”“啟動(dòng)程序”等,使用戶能夠最大限度地脫離鍵盤和鼠標(biāo)。

  聲龍還有一種功能被稱為“便攜聲龍”。用戶可以將事先用錄音機(jī)或采訪機(jī)錄制好的聲音通過聲卡輸入到計(jì)算機(jī),聲龍同樣可以對(duì)輸入的語音進(jìn)行識(shí)別,這一功能對(duì)于記者或其他經(jīng)常出差在外的人員會(huì)有很大幫助。

語音錄入時(shí)的注意事項(xiàng)

  我們通過幾個(gè)星期的測(cè)試發(fā)現(xiàn),聲龍語音識(shí)別軟件經(jīng)過語音訓(xùn)練之后,識(shí)別率也會(huì)大大提高,同時(shí),我們也總結(jié)出了一些語音錄入時(shí)的竅門,養(yǎng)成良好的朗讀習(xí)慣,在輸入語音時(shí)就會(huì)收到事半功倍的效果:

1.麥克風(fēng)的位置要適當(dāng),嘴部不要正對(duì)麥克風(fēng);

2.對(duì)計(jì)算機(jī)勻速講話,聲音不要過高或過低;

3.及時(shí)改正識(shí)別錯(cuò)誤;

4.將常用的生詞添加到聲龍?jiān)~庫中;

5.利用詞匯生成器添加詞匯;

6.注意訓(xùn)練聲龍識(shí)別有問題的詞;

7.多次執(zhí)行通用訓(xùn)練。

  我們?cè)谡Z音錄入注意了以上幾點(diǎn)后,聲龍的識(shí)別率有了很大提高。

小結(jié)

  通過兩個(gè)星期的使用和訓(xùn)練,聲龍語音識(shí)別軟件越來越“聽話”了!胺稿e(cuò)誤”的時(shí)候也越來越少。文章輸入的速度大大加快,只要?jiǎng)觿?dòng)嘴,想寫的文字就躍然“紙”上。聲龍語音識(shí)別軟件不僅對(duì)鍵盤錄入有困難的朋友來說是一個(gè)的好幫手,對(duì)于我們這些經(jīng)常玩鍵盤的人也有很大的吸引力,它可以讓我們以更輕松快捷的方式輸入文字。聲龍真正讓我們大家享受到了“君子動(dòng)口不動(dòng)手”的樂趣。

微電腦世界 2001/11/29



相關(guān)鏈接:
呼叫錄音分析取得新突破 2001-11-23
應(yīng)用無限的語音技術(shù) 2001-11-15
ViaVoice語音上網(wǎng)新概念 2001-11-14
語音識(shí)別重在應(yīng)用 2001-11-14
IBM ViaVoice Telephony——完善的中文電話語音技術(shù) 2001-11-14