首頁(yè)>>廠商>>軟件開(kāi)發(fā)商>>microsoft

聲控你的系統(tǒng) Vista語(yǔ)音識(shí)別全體驗(yàn)

2007/03/22

  Vista是微軟首個(gè)內(nèi)置了語(yǔ)音識(shí)別功能的操作系統(tǒng)。通過(guò)這個(gè)特性,你可以完成一些任務(wù),例如打開(kāi)或關(guān)閉程序,保存或刪除文件,通過(guò)聽(tīng)寫輸入文檔并編輯文本等等。下面就一起來(lái)分享一下在Vista中使用語(yǔ)音識(shí)別的體驗(yàn),并講解一下可用的選項(xiàng)。

  隨著科技的發(fā)展,許多的計(jì)算機(jī)用戶都?jí)粝肽軌驋仐壦麄兊逆I盤,遠(yuǎn)離他們的鼠標(biāo),只用聲音就能夠控制他們的計(jì)算機(jī)。一些能夠通過(guò)聲音指示命令或聽(tīng)寫文本的程序已經(jīng)存在了很多年,也證實(shí)了它們對(duì)于那些身體上不能使用其它輸入方法的人來(lái)說(shuō),是特別有用的,但這樣的程序卻始終沒(méi)有得到真正地廣泛普及。

  Windows Vista是微軟第一個(gè)內(nèi)置了語(yǔ)音識(shí)別功能的操作系統(tǒng)。在以前,語(yǔ)音識(shí)別是作為微軟Office XP或Office 2003的一部分,或是通過(guò)像Dragon NaturallySpeaking這樣的第三方軟件進(jìn)行添加。微軟的Voice Command將語(yǔ)音識(shí)別功能添加到了Windows移動(dòng)操作系統(tǒng)中。但無(wú)論如何,在這些情況下,你都需要購(gòu)買并安裝額外的軟件。

圖1 你可以在控制面板中對(duì)語(yǔ)音識(shí)別進(jìn)行設(shè)置

  在Vista中,你就不需要再購(gòu)買其它的東西來(lái)對(duì)你的計(jì)算機(jī)說(shuō)話。但它在默認(rèn)情況下是沒(méi)有啟用的,但它一直都呆在你的控制面板中,時(shí)刻嚴(yán)陣以待。

  如圖2所示,你也可以在“所有程序|附件|輕松訪問(wèn)”菜單下找到語(yǔ)音識(shí)別特性。圖2 在“輕松訪問(wèn)”菜單中,你也能看到“語(yǔ)音識(shí)別”

它是如何工作的呢?在此,有兩種情況能夠使用語(yǔ)音識(shí)別技術(shù):

  1. 用來(lái)控制軟件:打開(kāi)和關(guān)閉程序,以及在它們之間進(jìn)行切換;保存和刪除文件等等。

  2. 聽(tīng)寫文本,逐字譯入文檔以及對(duì)文本進(jìn)行編輯。

  開(kāi)發(fā)者可以使用Vista語(yǔ)音的API來(lái)對(duì)任何應(yīng)用程序添加語(yǔ)音識(shí)別功能。然而,Vista的語(yǔ)音識(shí)別目前還不能支持所有語(yǔ)言,它只能夠支持英語(yǔ)(美式和英式)、德語(yǔ)、法語(yǔ)、西班牙語(yǔ)、日語(yǔ)和中文(簡(jiǎn)體與繁體)。

對(duì)語(yǔ)音識(shí)別進(jìn)行設(shè)置和配置

  在你開(kāi)始使用語(yǔ)音識(shí)別之前,你需要完成以下步驟:

  1. 打開(kāi)語(yǔ)音識(shí)別。

  2. 安裝好你的麥克風(fēng)。

  3. 完成指導(dǎo)學(xué)習(xí)(這并非必須,但推薦這么做)。

  4. 訓(xùn)練識(shí)別引擎,使它能理解你的聲音(這也并非必須,但我們還是推薦這么做)。

   當(dāng)你雙擊控制面板中的“語(yǔ)音識(shí)別”,或在“輕松訪問(wèn)”菜單中選擇“語(yǔ)音識(shí)別”時(shí),“語(yǔ)音識(shí)別選項(xiàng)”對(duì)話框就會(huì)出現(xiàn),如圖3所示。

圖3 第一步要做的就是對(duì)你的語(yǔ)音識(shí)別進(jìn)行配置

  當(dāng)你點(diǎn)擊了“啟動(dòng)語(yǔ)音識(shí)別”時(shí),語(yǔ)音控制臺(tái)就會(huì)出現(xiàn)在屏幕的頂部,如圖4所示。


圖4 語(yǔ)音識(shí)別啟動(dòng)時(shí)出現(xiàn)的語(yǔ)音識(shí)別控制臺(tái)

  如果你將語(yǔ)音識(shí)別設(shè)置為當(dāng)Windows啟動(dòng)時(shí)啟動(dòng),那么每當(dāng)你開(kāi)啟你的電腦,這個(gè)控制臺(tái)就會(huì)出現(xiàn)在屏幕上方。同時(shí),一個(gè)“語(yǔ)音”圖標(biāo)(趁著藍(lán)色圓形背景的一個(gè)白色的麥克風(fēng))就會(huì)當(dāng)語(yǔ)音識(shí)別啟動(dòng)時(shí)出現(xiàn)在系統(tǒng)托盤處。

  你可以通過(guò)右鍵點(diǎn)擊這個(gè)麥克風(fēng)圖標(biāo)來(lái)選擇語(yǔ)音選項(xiàng),無(wú)論是在控制臺(tái)上的還是系統(tǒng)托盤中的圖標(biāo)。接著就會(huì)顯示如圖5所示的相關(guān)菜單。

圖5 在相關(guān)菜單中你有很多可選項(xiàng)目

在菜單中,你可以做如下選擇:

  開(kāi):計(jì)算機(jī)會(huì)聆聽(tīng)你所說(shuō)的一切,并嘗試執(zhí)行它能夠識(shí)別的命令。
  休眠:計(jì)算機(jī)會(huì)聆聽(tīng),但除非你說(shuō)“開(kāi)始聆聽(tīng)”,否則它不會(huì)做出任何反應(yīng)。
  關(guān):計(jì)算機(jī)將不會(huì)聆聽(tīng)你所說(shuō)的任何東西。
  打開(kāi)語(yǔ)音參考卡:這是一個(gè)便利的簡(jiǎn)單說(shuō)明,關(guān)于一些常用的命令以及如何操作的信息。
  開(kāi)始語(yǔ)音教程:這是一個(gè)互動(dòng)的簡(jiǎn)單視頻教程,它會(huì)通過(guò)實(shí)際操作教你如何使用語(yǔ)音識(shí)別。
  幫助:這將會(huì)打開(kāi)幫助文件,告訴你關(guān)于設(shè)置以及使用語(yǔ)音識(shí)別的信息。
  選項(xiàng):在此,你可以選擇是否需要語(yǔ)音識(shí)別播放聲訊反饋、啟動(dòng)時(shí)運(yùn)行、朗讀更正對(duì)話框中的文本、以及在所有位置啟用聽(tīng)寫。
  配置:在此,你可以設(shè)置你的麥克風(fēng)、提高語(yǔ)音識(shí)別,或是打開(kāi)語(yǔ)音控制面板。
  打開(kāi)語(yǔ)音詞典:你可以添加新的詞到你的詞典中,特別是可以添加一些名字之類引擎難以識(shí)別的詞,或是阻止某些詞會(huì)被聽(tīng)寫出來(lái)(例如一些你不會(huì)聽(tīng)寫到的詞)。
  聽(tīng)寫主題:在此僅有一個(gè)“敘述性”選項(xiàng)。
  你還可以訪問(wèn)“Windows語(yǔ)音識(shí)別網(wǎng)站”。
  關(guān)于Windows語(yǔ)音識(shí)別:這也就是熟悉的Windows“關(guān)于”對(duì)話框,它能夠告訴你版本號(hào)以及許可授予名。
  打開(kāi)語(yǔ)音識(shí)別。
  退出:關(guān)閉語(yǔ)音識(shí)別,控制臺(tái)會(huì)從屏幕上消失,而語(yǔ)音圖標(biāo)也會(huì)從系統(tǒng)托盤中消失。

設(shè)置麥克風(fēng)

  你可以在語(yǔ)音識(shí)別選項(xiàng)對(duì)話框或是語(yǔ)音關(guān)聯(lián)菜單中設(shè)置你的麥克風(fēng)。麥克風(fēng)設(shè)置程序首先會(huì)要求你確認(rèn)麥克風(fēng)的類型(頭戴式、桌面式或其它)。程序推薦你使用的是頭戴式麥克風(fēng),而我能夠證明,麥克風(fēng)類型的不同會(huì)造成語(yǔ)音識(shí)別使用過(guò)程中很大的差異。

  第一次我嘗試使用Vista的語(yǔ)音識(shí)別時(shí),我使用的是桌面式的麥克風(fēng),在Camtasia中錄制PowerPoint的演示的聲音中的一些任務(wù)中,它能夠很好地完成。然而,當(dāng)我在 Vista中進(jìn)行聽(tīng)寫時(shí),所得到的結(jié)果是非?尚Φ;我?guī)缀醪荒苈?tīng)寫出沒(méi)有一處錯(cuò)誤的完整的一個(gè)句子,無(wú)論我如何清晰、認(rèn)真地發(fā)音。當(dāng)我換成花費(fèi)了比桌面式麥克風(fēng)更昂貴的頭戴式麥克風(fēng)時(shí),準(zhǔn)確性就得到了改進(jìn),每五六個(gè)句子中只會(huì)發(fā)生一次錯(cuò)誤,而不是之前的每個(gè)句子中的幾個(gè)錯(cuò)誤。

  在你選擇好麥克風(fēng)類型之后,設(shè)置過(guò)程的下一頁(yè)會(huì)告訴你如何放置麥克風(fēng)的位置能獲得最好的效果。接下來(lái),你會(huì)被要求對(duì)著麥克風(fēng)大聲閱讀一個(gè)短句,如圖6所示。

圖6 你必須對(duì)著麥克風(fēng)說(shuō)話,這樣Windows才能夠自動(dòng)適應(yīng)你的音量

  現(xiàn)在,麥克風(fēng)就設(shè)置完畢等待使用了。然而,這并不意味著語(yǔ)音引擎就已經(jīng)為你的聲音做好了充分準(zhǔn)備。如果你像新聞播報(bào)員那樣發(fā)音標(biāo)準(zhǔn),沒(méi)有口音,又總是咬字清晰的話,你也許可以在不做訓(xùn)練的情況下使用語(yǔ)音識(shí)別。如果你有一些口音,或是并不能說(shuō)完全標(biāo)準(zhǔn)的普通話,那么如果你想要獲得更好的使用效果,你需要通過(guò)一個(gè)訓(xùn)練的過(guò)程。

  訓(xùn)練過(guò)程就是閱讀屏幕上一系列的文本選段,如圖7所示。

圖7 訓(xùn)練語(yǔ)音引擎以適應(yīng)你的發(fā)音方式能提高語(yǔ)音識(shí)別的準(zhǔn)確度

使用聲音命令

  現(xiàn)在,你就可以使用你的聲音命令來(lái)讓你的計(jì)算機(jī)完成一些任務(wù)。語(yǔ)音引擎統(tǒng)稱在識(shí)別命令上要比聽(tīng)寫來(lái)得準(zhǔn)確,因?yàn)樗鼉H需要聽(tīng)取有限的幾個(gè)命令。

  首先,確認(rèn)你的語(yǔ)音控制臺(tái)的語(yǔ)音狀態(tài)是“正在聽(tīng)”。如果不是,那么你就可以說(shuō)“開(kāi)始聆聽(tīng)”,或右鍵點(diǎn)擊麥克風(fēng)圖標(biāo)并選擇“開(kāi):聆聽(tīng)我說(shuō)的所有話語(yǔ)”。

  聲音命令的設(shè)計(jì)基本上都是盡可能地讓你能夠憑直覺(jué)地發(fā)出指令。例如,要打開(kāi)一個(gè)開(kāi)始菜單中的程序:

  說(shuō)“點(diǎn)擊開(kāi)始”

  說(shuō)“點(diǎn)擊所有程序”

  說(shuō)“Office Word 2007”(或是在“程序”菜單中任何其它你想要打開(kāi)的程序名稱)

  簡(jiǎn)單的命令是很容易使用的。但在一些程序中進(jìn)行一些操作時(shí)則會(huì)更具一些挑戰(zhàn),但你還是能夠做到的。

  如果你想要點(diǎn)擊一個(gè)按鈕或是連接,而它的名字是你不知道的,例如Office中,左上角的Office標(biāo)志按鈕,那么這時(shí)你該怎么做呢?在此有一個(gè)巧妙的方法:只需要說(shuō)“顯示編號(hào)”,在當(dāng)前活動(dòng)窗口中所有能夠互動(dòng)的元素就會(huì)被數(shù)字所覆蓋,如圖8所示。

圖8 “顯示編號(hào)”能夠幫助你點(diǎn)擊不知道名字的按鈕或鏈接

  現(xiàn)在,你所需要做的就是說(shuō)出你想要點(diǎn)擊的按鈕的編號(hào)。之后,一個(gè)“確定”就會(huì)出現(xiàn)在對(duì)應(yīng)的元素上。說(shuō)“確定”,你就點(diǎn)擊了這個(gè)按鈕。

獲得幫助

  如果你不明白一些事要如何操作,你可以通過(guò)說(shuō)“我能說(shuō)什么”來(lái)使用幫助。在使用“我能說(shuō)什么”命令之后,Windows的幫助和支持就會(huì)彈出,你可以在里面尋找你所需要的幫助信息。

圖9 你可以通過(guò)說(shuō)“我能說(shuō)什么”打開(kāi)幫助獲得相關(guān)信息

聽(tīng)寫文本

  你可以在任何可以使用語(yǔ)音的應(yīng)用程序中通過(guò)聽(tīng)寫輸入文本。你不會(huì)像過(guò)去那樣,只能在微軟的Office應(yīng)用程序中才能夠使用。例如,你可以在記事本或是寫字板中聽(tīng)寫文本。

  在默認(rèn)情況下,我無(wú)法在Open Office和其它非微軟的程序中聽(tīng)寫文本,但我可以通過(guò)語(yǔ)音關(guān)聯(lián)菜單中的“選項(xiàng)|在所有位置啟用聽(tīng)寫”,這樣就能夠在那些不是自動(dòng)接受聽(tīng)寫的程序中聽(tīng)寫輸入文本,這樣我就能夠在Open Office中進(jìn)行聽(tīng)寫輸入了。然而,它工作起來(lái)的效果就不如在微軟的程序中所使用的效果。它不能在我說(shuō)的時(shí)候馬上輸入文本,它會(huì)彈出一些可選的提示讓我選擇。使用語(yǔ)音API,開(kāi)發(fā)者能夠讓他們的應(yīng)用程序可以使用語(yǔ)音,而更多的可能在將來(lái)就能夠使用。

小貼士:

  當(dāng)你在聽(tīng)寫的時(shí)候,Vista會(huì)將你所說(shuō)的所有東西輸入文檔。這也許會(huì)造成一些不便,如果當(dāng)你在編輯文檔時(shí),有一會(huì)兒可能聽(tīng)下來(lái)去與同事談話,之后你可能會(huì)發(fā)現(xiàn)你的談話內(nèi)容也輸入了文檔。當(dāng)你希望有些話語(yǔ)不被轉(zhuǎn)譯到文檔中時(shí),你可以先說(shuō)“停止聆聽(tīng)”,再開(kāi)始說(shuō)其它內(nèi)容。

  Vista在轉(zhuǎn)譯你的聽(tīng)寫時(shí)很可能會(huì)產(chǎn)生錯(cuò)誤。而只得慶幸的是它們能夠很容易地得到糾正。例如,如果你說(shuō)“我現(xiàn)在能說(shuō)任何”,而Vista輸入的是“我不能說(shuō)任何”,這時(shí)你可以說(shuō)“更正不能”,接著你就會(huì)看到一個(gè)清單,里面列有可替換的詞,如圖10所示。

圖10 你只需要在列表中選擇替換詞語(yǔ)進(jìn)行錯(cuò)誤更正

  如果你要更正的錯(cuò)誤不再列表中,只需要再次說(shuō)出詞語(yǔ),就會(huì)有新的列表出現(xiàn)在其中供你選擇。當(dāng)你想輸入英文時(shí),它可能會(huì)不能識(shí)別,你可以說(shuō)“拼寫”來(lái)將英文單詞拼寫出來(lái)。

圖11 你可以通過(guò)“拼寫”輸入英文單詞

高級(jí)配置設(shè)置

  你可以通過(guò)點(diǎn)擊語(yǔ)音識(shí)別選項(xiàng)對(duì)話框左邊窗格中的“高級(jí)語(yǔ)音選項(xiàng)”鏈接來(lái)訪問(wèn)一些高級(jí)的配置設(shè)置,如圖12所示。

圖12 你可以在此設(shè)置高級(jí)配置選項(xiàng)并進(jìn)行用戶設(shè)置

  在此,你可以創(chuàng)建并進(jìn)行用戶設(shè)置。這當(dāng)你的計(jì)算機(jī)不止一人使用時(shí)就顯得特別有用。你可以選擇是否在啟動(dòng)時(shí)就運(yùn)行語(yǔ)音識(shí)別,以及是否允許計(jì)算機(jī)檢查文檔和郵件,以提高語(yǔ)音識(shí)別的準(zhǔn)確性。

  此外,你還可以選擇在標(biāo)點(diǎn)符號(hào)后插入的空格數(shù),并調(diào)節(jié)麥克風(fēng)的等級(jí)。

語(yǔ)音識(shí)別的局限性

  在對(duì)語(yǔ)音識(shí)別進(jìn)行了一個(gè)半小時(shí)的訓(xùn)練后,我感受到了Vista準(zhǔn)確的語(yǔ)音識(shí)別所帶來(lái)的輕松使用的感受。之前我也試用過(guò)一些聽(tīng)寫程序,但都沒(méi)有發(fā)現(xiàn)它們具有足夠的實(shí)用性,我使用鍵盤輸入總是要比聽(tīng)寫出正確的文本要快的多。但現(xiàn)在我的感受就是,如果我失去了雙手,還是有辦法能夠讓我的工作繼續(xù)得以完成。對(duì)于我來(lái)說(shuō),語(yǔ)音識(shí)別結(jié)合鍵盤輸入就能達(dá)到完美的工作效果。

  然而,我是在一臺(tái)具有Core Duo processor和2GB內(nèi)存的計(jì)算機(jī)上使用Vista,我不敢保證如果在性能稍遜一些的計(jì)算機(jī)上使用時(shí)它能有多迅速。我一直使用的也是最上乘的麥克風(fēng)。之前我提到過(guò),在我的體驗(yàn)中,使用桌面式的麥克風(fēng)是不能很好地完成工作的。使用你自己的聲音進(jìn)行一些訓(xùn)練也能夠帶來(lái)不同的效果。

  顯然,語(yǔ)音識(shí)別是不能在嘈雜的環(huán)境下很好地工作的,比如你身在一個(gè)與其他人公用的辦公室中,而其他人在你工作的時(shí)候打電話。另外,當(dāng)你在聽(tīng)音樂(lè)或廣播時(shí),它也無(wú)法良好地工作。

安全問(wèn)題

  在你決定一直都對(duì)著你的計(jì)算機(jī)說(shuō)話的時(shí)候,請(qǐng)意識(shí)到使用語(yǔ)音識(shí)別會(huì)存在一個(gè)安全問(wèn)題。攻擊者可能將一個(gè)聲音文件植入,當(dāng)你瀏覽網(wǎng)頁(yè)時(shí)能夠自動(dòng)播放,或使用電子郵件將聲音文件發(fā)送給你,當(dāng)你雙擊時(shí)它就會(huì)自動(dòng)播放。如果所播放的聲音文件傳入你的麥克風(fēng),而它又是Vista的語(yǔ)音引擎能夠識(shí)別的命令,那么語(yǔ)音識(shí)別就會(huì)將它運(yùn)行,計(jì)算機(jī)就會(huì)執(zhí)行這個(gè)命令。

  但這并不需要引起太大的恐慌。因?yàn)樵赩ista中要以管理員身份執(zhí)行大多數(shù)命令的時(shí)候,你都需要回應(yīng)用戶帳戶控制的提示,而這是不能通過(guò)聲音來(lái)做到的。但是,攻擊者還是有可能使用這種方法刪除你計(jì)算機(jī)上的文件。

  當(dāng)語(yǔ)音識(shí)別處在休眠模式下時(shí),它僅會(huì)對(duì)“開(kāi)始聆聽(tīng)”命令做出反應(yīng),但攻擊者很容易就能將這個(gè)詞組當(dāng)成一個(gè)聲音文件。因此,當(dāng)你不使用它時(shí),你應(yīng)該習(xí)慣地將語(yǔ)音識(shí)別完全關(guān)閉,而不是僅讓它處在休眠模式,并且不要設(shè)置它在Windows啟動(dòng)時(shí)隨之運(yùn)行。

www.17tech.com



相關(guān)鏈接:
微軟國(guó)內(nèi)首推Push mail 酷派3G產(chǎn)品率先支持 2009-09-28
鮑爾默:我們搞砸了Windows Mobile 7 2009-09-25
微軟全球基礎(chǔ)服務(wù)部門副總裁離職加盟思科 2009-09-24
微軟推最新手機(jī)操作系統(tǒng)WindowsMobile6.5 2009-09-04
微軟Windows Mobile 6.5系統(tǒng)手機(jī)10月上市 2009-09-02

分類信息: