首頁>>廠商>>語音識別與合成>>科大訊飛

解放雙手!科大訊飛推出輕量級智能語音識別系統(tǒng)

2008/07/23

  隨著手機、MP3/MP4、導(dǎo)航儀等嵌入式設(shè)備體積越來越小,鍵盤手動操作變得越來越不方便,特別是走路、駕車時更是無法完成,應(yīng)用智能語音識別系統(tǒng),上述問題就可迎刃而解?拼笥嶏w最新推出的輕量級智能語音識別系統(tǒng)Aitalk2.0,能夠方便的應(yīng)用在嵌入式設(shè)備上,讓用戶解放雙手,通過語音命令操作設(shè)備、檢索信息。

  Aitalk2.0是一個非特定人命令詞語音識別引擎,可為第三方提供開發(fā)接口,提供語音識別功能。針對嵌入式系統(tǒng)資源受限的特點,Aitalk2.0對搜索算法作了針對性改進,在資源占用、可移植性等方面取得了突破性進展,在提高識別速度的同時,保持了良好的識別率。語音識別功能利用系統(tǒng)本身的運算、存儲資源,以軟件模塊方式實現(xiàn),客戶在此基礎(chǔ)上開發(fā)各種具體的應(yīng)用,不增加額外的硬件成本。同時,該系統(tǒng)還針對主要應(yīng)用領(lǐng)域作了更細(xì)致的優(yōu)化,使應(yīng)用效果進一步提高,如手機上語音撥號、語音操控、語音查找,導(dǎo)航儀語音設(shè)置目的地,電子詞典、MP3的語音搜索等功能。

  全面完善的功能特性   Aitalk2.0 支持中文、英文單詞、英文句子的識別;同時,也支持中英文混合詞條或者句子的識別。如,歌曲名“yesterday once more”、“my heart will go on”,人名“Tony黃”、“張David”等,Aitalk2.0 均能準(zhǔn)確處理和識別出此類詞條。    Aitalk2.0的識別詞條可以以文本形式動態(tài)添加。如手機中的聯(lián)系人名、MP3播放器中的歌曲名稱等,都可以添加到引擎的識別集中,識別引擎可對加入到識別集中的所有詞條進行識別,無需用戶進行錄音訓(xùn)練。

  針對用戶實際的使用場景,如聯(lián)系人名的增刪,歌曲的更新等操作,Aitalk2.0 支持識別詞條的動態(tài)更新,只需要應(yīng)用程序?qū)⒏潞蟮淖R別詞條加入或替換識別集合即可進行識別。 ?   Aitalk2.0 可準(zhǔn)確處理和識別出含有數(shù)字及符號的識別詞條。

  類似的歌曲名稱,如“2002年的第一場雪”(讀作“二零零二年的第一場雪”),戀曲1990(讀作“戀曲一九九零”),以及“20%”、“3/4”等都可以被引擎接受并識別。    Aitalk2.0 的識別靈敏度可以進行設(shè)置,滿足不同場景下的需求。

  靈敏度設(shè)置較高級別,則識別引擎的識別標(biāo)準(zhǔn)較寬松,適合在安靜的環(huán)境下使用;

  靈敏度設(shè)置為一般,適用于辦公環(huán)境。

  靈敏度設(shè)置較低級別,引擎的識別標(biāo)準(zhǔn)較嚴(yán)格,適合在嘈雜的環(huán)境中使用。    Aitalk2.0采用先進的語音端點檢測算法,能在復(fù)雜的應(yīng)用環(huán)境中,準(zhǔn)確地檢測出語音信號的開始及結(jié)束,在檢測到語音信號結(jié)束后自動給出識別結(jié)果。    用戶在使用語音識別功能時,往往需要在規(guī)定的時間內(nèi)進行語音輸入。傳統(tǒng)的識別引擎需要用戶在開發(fā)時針對不同的應(yīng)用場景設(shè)定允許識別的時間,Aitalk2.0 內(nèi)置了識別的時間控制,內(nèi)置的時間控制能夠很好的適應(yīng)用戶的使用習(xí)慣,且能有效的減少第三方的開發(fā)工作量。另外,用戶還可以自定義識別時間的長短。

CTI論壇編輯



相關(guān)鏈接:
訊飛暢言語音教具系統(tǒng)榮獲“創(chuàng)新軟件產(chǎn)品” 2009-09-08
科大訊飛嵌入式語音新產(chǎn)品發(fā)布會在深圳舉行 2009-09-07
“會說話”的顯示屏提升居民小區(qū)信息服務(wù)水平 2009-09-07
訊飛語音助力太平人壽客服中心 2009-08-28
訊飛語音助力CDMA手機競爭終端市場 2009-08-14

分類信息:  移動增值_與_語音應(yīng)用  移動增值_與_交通  移動增值_與_移動  移動增值_與_交通
           移動_與_交通