首頁>>廠商>>語音識別與合成>>科大訊飛

多語種語音合成助力數(shù)字奧運(yùn)

2003/12/01

  為進(jìn)一步提高語音合成的自然度、人性化等指標(biāo),科大訊飛在國家“863”計劃支持下,承擔(dān)了面向奧運(yùn)的多語言信息服務(wù)系統(tǒng)中的重要課題——“面向奧運(yùn)的多語種語音合成研究”項目,這一項目的承擔(dān)將使語音合成技術(shù)更適用于奧運(yùn)環(huán)境的應(yīng)用。該項目大部分研發(fā)任務(wù)已經(jīng)完成,目前已經(jīng)處于項目的最后攻堅階段,該項目的主要研發(fā)重點(diǎn)分為以下幾個方面:

  1.對于語音合成引擎的應(yīng)用程序接口和輸入輸出以及中間數(shù)據(jù)格式上,將提供一種跨平臺的服務(wù)提供機(jī)制和具有良好擴(kuò)展性的中間數(shù)據(jù)描述語言規(guī)范,使得遵循此規(guī)范的客戶應(yīng)用可以有效地在不同平臺上使用語音合成服務(wù)。

  2.科大訊飛利用自己在多語種語音合成研究領(lǐng)域的優(yōu)勢,繼續(xù)推進(jìn)具有高穩(wěn)定、高性能、高質(zhì)量的多語種和混合語種合成引擎,使得語音合成服務(wù)可以滿足中(含粵語)、英、日等不同語種的應(yīng)用要求,另外針對奧運(yùn)應(yīng)用進(jìn)行了優(yōu)化,使在某些奧運(yùn)應(yīng)用領(lǐng)域可以達(dá)到完全和人語音相媲美的語音合成效果。

  3.科大訊飛在嵌入式環(huán)境下的語音合成技術(shù)取得突破,在小存儲空間和計算資源需求下,可以實現(xiàn)比較高質(zhì)量的合成語音。另外采用的分布式語音合成技術(shù)有機(jī)消除了語音合成中由于資源存儲的限制而產(chǎn)生的對語音效果的影響。這就為語音合成的實際應(yīng)用環(huán)境提供了多種可選的模式,使得在不同應(yīng)用模式下都可以得到比較理想的語音合成服務(wù)。

  4.對于語音應(yīng)用平臺,智能服務(wù)接入技術(shù)、可擴(kuò)展的標(biāo)準(zhǔn)數(shù)據(jù)交互技術(shù)的應(yīng)用可以使用戶專注于服務(wù)的結(jié)果上而不是如何去獲取服務(wù)。另外大規(guī)模集群服務(wù)技術(shù)的采用,使超大規(guī)模應(yīng)用和吞吐量的語音應(yīng)用成為可能,有效解決了企業(yè)或電信級應(yīng)用中由于多路并發(fā)以及大數(shù)據(jù)量交換產(chǎn)生的問題。

  在語音合成的下一步研究中,除了上述目標(biāo)外,語音合成中的人性化研究是個重點(diǎn)研發(fā)目標(biāo)。目前的語音合成系統(tǒng)雖然可以得到比較高自然度的合成語音,但是生成語音的風(fēng)格比較單一。下一步的工作重點(diǎn)在于:在強(qiáng)大自然語言處理能力的指導(dǎo)下,能夠根據(jù)當(dāng)前文本的特點(diǎn),使用與之相適合的風(fēng)格以及語氣語調(diào)來完成文本到語音的轉(zhuǎn)換。

  另外,文本分析器可以按照當(dāng)前文本的內(nèi)容,給出文章中的重點(diǎn)段落、句子以及其它文本片斷,即信息的焦點(diǎn)。這樣,用戶在使用語音合成服務(wù)時,不但能享受到高品質(zhì)的合成語音服務(wù),而且可以更容易地使用這種服務(wù)來獲取所需的信息。另外聲音特征的轉(zhuǎn)換也是研究重點(diǎn)之一,用戶可以用自己需要或是喜愛的聲音特征作為目標(biāo),根據(jù)這種聲音特征提供少量的聲音樣本,就可以使用語音合成服務(wù)中的相關(guān)智能工具,通過自適應(yīng)的訓(xùn)練,使得合成的語音可以基本無損傷地轉(zhuǎn)變?yōu)橛脩羲谕哪繕?biāo)語音。


多語種語音合成示意圖

科大訊飛供稿 原文刊登于塞迪網(wǎng)



相關(guān)鏈接:
訊飛暢言語音教具系統(tǒng)榮獲“創(chuàng)新軟件產(chǎn)品” 2009-09-08
科大訊飛嵌入式語音新產(chǎn)品發(fā)布會在深圳舉行 2009-09-07
“會說話”的顯示屏提升居民小區(qū)信息服務(wù)水平 2009-09-07
訊飛語音助力太平人壽客服中心 2009-08-28
訊飛語音助力CDMA手機(jī)競爭終端市場 2009-08-14

分類信息:  語音合成TTS_與_語音識別ASR     熱點(diǎn)專題_2008北京奧運(yùn)會_文摘   新聞頻道   技術(shù)_語音合成_新聞   技術(shù)_語音識別_新聞