首頁>>>技術(shù)>>>語音應用>>>語音合成(TTS)  語音合成產(chǎn)品

 

語音合成技術(shù): 啟動“第三種引擎”

2002/04/02

  對于中英文混合的語音合成問題,傳統(tǒng)的解決方案是采用中文和英文兩種合成引擎。合成時先將中英文文本進行分離,然后在不同的引擎下分別進行合成,最后將合成數(shù)據(jù)匯集輸出。這種合成方法存在著中英文不同音、銜接部分跳躍大等弊端。另外,如果在傳統(tǒng)的單一語種(如中文、英文等)語音合成方法的基礎上開發(fā)不同語種的語音合成系統(tǒng),可行性不大。

  為了解決這個問題,科大訊飛公司將中英文混雜的文本作為“第三種語言”進行專門研究,并建立了一套綜合考慮中英文混合情況的文本分析體系和韻律規(guī)則模型。根據(jù)這個開發(fā)思路,訊飛InterPhonic C&E Rev 1.0語音平臺系統(tǒng)應運而生,成為了語音合成技術(shù)的“第三種引擎”。

系統(tǒng)的五項技術(shù)創(chuàng)新

 。1) 多語種文本分析體系

  該平臺可同時對純中文、純英文或是中英文混合的文本進行相應的處理。該分析體系具有完備的文本分析知識庫,并在人名識別規(guī)則、多音字處理規(guī)則、特殊符號處理規(guī)則的積累等方面具有優(yōu)勢。

 。2) 先進的語言學層次結(jié)構(gòu)體系

  該系統(tǒng)將國內(nèi)最新的漢語連續(xù)語流標注體系CToBI進行工程化應用,可以準確地對連續(xù)語流中不同層次的語言現(xiàn)象進行描述;同時采用先進的漢語語音韻律描述體系,提高了系統(tǒng)的整體語音效果。

 。3) 基于數(shù)據(jù)統(tǒng)計和人工智能的韻律模型構(gòu)架

  該系統(tǒng)基于先進的大語種庫語音合成方法,進行了超大規(guī)模的自然語流數(shù)據(jù)庫的制作,并以此作為數(shù)據(jù)統(tǒng)計和機器學習的訓練數(shù)據(jù),建立了較為完善的基頻、時長、能量、停頓模型。

 。4) 具備改進型PSOLA算法的韻律調(diào)整功能

  采用最先進的PSOLA語音算法工具,使得系統(tǒng)在語速調(diào)整和運行穩(wěn)定性等方面有更優(yōu)秀的表現(xiàn)。

 。5)高自然度、高流暢度的語音合成效果

  據(jù)權(quán)威機構(gòu)評測,該系統(tǒng)針對新聞等不同文體的文本合成,均可達到4.3分(5分制)的自然度,能夠適應多語種文本的語音合成場合。

系統(tǒng)的多行業(yè)應用

 。1)電信業(yè)

  除了能夠完成電信業(yè)原有的114查號系統(tǒng)、話費查詢、話費催繳、代繳以及電信法規(guī)、業(yè)務咨詢等基本業(yè)務,還可以使電信運營商能夠搭建各種電話信息應用平臺,提供諸如預訂業(yè)務、大眾呼叫等多項增值服務。

 。2)證券業(yè)

  可以通過清晰自然的語音實現(xiàn)個人信息(包括資金、股份、委托情況、成交情況等)、股市行情(包括股票行情、指數(shù)、指標等)以及股評與業(yè)績報告的實時查詢,將證券業(yè)務拓展到通信網(wǎng)上。

 。3)銀行業(yè)

  可使銀行業(yè)客服中心實現(xiàn)賬戶資料查詢、歷史記錄查詢、利率匯率實時查詢等多項動態(tài)查詢業(yè)務,同時可以幫助電話銀行擴展自動服務的業(yè)務種類。

  (4)保險業(yè)

  能夠提供公司的公共信息、客戶保單信息、業(yè)務員認證信息的動態(tài)查詢服務,改變了目前保險業(yè)客服中心可操作性差的弱點。

 。5)電力行業(yè)

  可以向用戶提供業(yè)務受理進程查詢、電費額明細查詢、電費催繳、故障通知及其他各類信息咨詢,并可在此基礎上,利用已有的資源開展外包業(yè)務。

  (6)郵政行業(yè)

  可以幫助郵政客戶服務中心以一個統(tǒng)一的服務平臺面向用戶,融合包括郵政金融、郵政特快、報刊發(fā)行、集郵等在內(nèi)的各項郵政服務,為用戶提供咨詢、查詢、受理以及投訴等多項業(yè)務。

  此外,采用語音合成技術(shù)可以改變原有聲訊平臺服務種類單一的弱點,開展諸如考試查分、廣播電視節(jié)目的動態(tài)查詢、節(jié)目的實時點播與點評、電話學位防偽查詢系統(tǒng)、電話產(chǎn)品防偽等業(yè)務。(科大訊飛公司供稿)

計算機世界報 2002/04/02



相關鏈接:
構(gòu)建更加人性化的交談式語音應用 2002-03-11
回歸到“通天塔”之前 2002-03-11
語音合成——燦爛的前景 巨大的商機 2002-01-30
語音合成技術(shù)及國內(nèi)外發(fā)展現(xiàn)狀 2002-01-30
Evoice有聲電子郵件系統(tǒng) 2002-01-30

分類信息:     技術(shù)_語音合成_文摘