首頁>>廠商>>語音識別與合成>>科大訊飛

訊飛語音技術(shù)在交通自動語音播報系統(tǒng)中的應用

2006/07/14

  隨著信息社會的快速發(fā)展,人們對于信息獲取及時性、方便性的要求也越來越高。公共交通的信息服務系統(tǒng)適應這一發(fā)展趨勢,不斷應用新技術(shù)拓展服務范圍、提升服務質(zhì)量、提高工作效率。實時更新數(shù)據(jù)、效果清晰流暢、應用方便高效也成為機場、車站、碼頭等公共交通場所對建設(shè)新一代自動語音播報系統(tǒng)的最重要要求。

  科大訊飛作為語音技術(shù)的領(lǐng)導者,一直積極推動智能語音技術(shù)在交通自動語音播報領(lǐng)域的應用。基于領(lǐng)先技術(shù)、成熟的產(chǎn)品和對應用的不斷深入探索,從2001年開始,科大訊飛的語音技術(shù)在機場,車站、碼頭等交通自動語音播報系統(tǒng)中應用,至今,已經(jīng)樹立了包括武漢天河機場、合肥駱崗機場、鄭州火車站、福建晉江、泉州等的幾十個成功應用案例,為來自五湖四海的乘客提供了高質(zhì)量、高效率的自動語音服務。

  機場、車站、碼頭等公共交通場所每天進出的班次多,信息更新頻繁,單純依靠人工廣播為旅客提供信息服務的方式面臨的壓力越來越大,若由于人工報讀出現(xiàn)誤差、引起錯誤容易產(chǎn)生秩序混亂,不利于交通管理。應用科大訊飛語音合成技術(shù)的自動語音播報系統(tǒng)就能夠自動將預先編排的文字內(nèi)容自動轉(zhuǎn)換成語音在站廳內(nèi)播放出來,很好地解決了當前服務方式的局限性。

  科大訊飛的語音合成(Text To Speech)技術(shù)能夠自動將任意文字轉(zhuǎn)換為清晰、流暢、自然的語音,是一種能夠在任何時間、任何地點向任何人提供語音信息服務的高效便捷手段,非常符合信息時代海量數(shù)據(jù)、動態(tài)更新和個性化查詢的需求。訊飛語音技術(shù)始終引領(lǐng)業(yè)界的發(fā)展,2006年7月,新一代語音合成技術(shù)產(chǎn)品-InterPhonic 5.0正式發(fā)布,語音技術(shù)的發(fā)展再次邁上了一個新臺階。InterPhonic 5.0的合成效果已超過普通人的說話水平,與專業(yè)播音員的效果更趨接近,在普通話,英語,廣東話等多語種進一步突破,數(shù)字、數(shù)值判斷準確、發(fā)音清晰飽滿,地名、站名等詞組短句合成流暢、自然。靈活開放的系統(tǒng)架構(gòu),穩(wěn)定性和可用性經(jīng)受了眾多大規(guī)模實際應用的檢驗,能夠確保7×24小時不間斷的高質(zhì)量自動化語音服務。

  InterPhonic 5.0首創(chuàng)的兩項專利技術(shù)“提示音智能匹配”與“合成模版”幾乎是為交通自動語音播報系統(tǒng)度身定做,能夠顯著提升語音效果。在站廳廣播中,很多內(nèi)容的播報句式是固定的,只是當中一部分內(nèi)容發(fā)生變化,  例如:
  1. 乘坐 3u8601 次航班前往 澳門 的旅客請注意。

  2. 乘坐 3u8602 次航班前往 包頭 的旅客請注意。
  在這兩個例句中,整個句式是一樣的,只是航班號和目的地不同。在InterPhonic 5.0中,允許用戶提取句式的固定部分,組成合成模板,模板的固定內(nèi)容由人工錄音保障效果,而對于動態(tài)變化部分,如字符、數(shù)字、數(shù)值、短語、姓名等,則采用語音合成,系統(tǒng)能夠自動實現(xiàn)預錄語音與合成語音的無縫銜接,最終達到整體效果與人工播報相當?shù)哪繕恕?br />
  在交通自動語音播報系統(tǒng)中應用語音技術(shù),我們?nèi)匀唤ㄗh用戶對于常用的相對固定的內(nèi)容采用人工錄音的方式來生成語音,如由專業(yè)播音員錄音,效果自然,并且能體現(xiàn)更多的情感風格,給用戶以親切感受。語音合成的效果雖然清晰、準確,但是在語情感和語氣表現(xiàn)等方面與專業(yè)錄音員畢竟還有一定差距。運用“提示音智能匹配”功能,在進行語音合成過程中,將首先自動匹配由人工錄制的語音,既保持了固定不變內(nèi)容的播報效果,又能實現(xiàn)實時更新的動態(tài)合成,并且自動進行預錄語音與合成語音的融合,使得銜接過渡自然流暢,提供最佳效果體驗。

  科大訊飛每一代新產(chǎn)品的推出均代表了語音技術(shù)發(fā)展新的里程碑,而技術(shù)產(chǎn)品的發(fā)展又源自于在應用實踐中的不斷積累和完善?拼笥嶏w始終關(guān)注技術(shù)發(fā)展與市場應用的最佳結(jié)合,以領(lǐng)先的語音技術(shù)為提升自動語音服務提供源源不斷的動力。同時,科大訊飛一直致力于推動行業(yè)標準的制定與完善,是中文語音交互技術(shù)標準工作組的組長單位。2005年底,科大訊飛牽頭制定的中文語音合成系統(tǒng)通用技術(shù)規(guī)范通過審定成為國家標準,將對中文語音技術(shù)產(chǎn)業(yè)的健康、快速發(fā)展起到積極的作用。

  成功案例一:鄭州火車站自動電話問訊系統(tǒng)的語音合成應用

  鄭州火車站的自動電話問訊熱線系統(tǒng)建設(shè)“8356666”是一項為廣大旅客提供實實在在便利的舉措。在該電話問訊系統(tǒng)中,應用科大訊飛語音合成技術(shù),將實時查詢的列車、票務、行包等信息轉(zhuǎn)換成語音,通過電話提供用戶,實現(xiàn)了人工受理咨詢服務與24小時自動服務相結(jié)合的新型服務方式。該電話問訊系統(tǒng)投入使用以來,受到旅客們的廣泛好評。

  應用訊飛語音技術(shù)的鄭州火車站電話問訊系統(tǒng),不僅規(guī)模比原有系統(tǒng)擴大一倍,而且服務內(nèi)容更加豐富,提供實時更新的信息,真正實現(xiàn)了對旅客的個性化服務。下圖所列即該自動電話問訊熱線主要功能:

  進入系統(tǒng)后可以進行定購火車票、查詢列車信息、查詢列車正晚點、行包到達查詢等操作。所有供查詢信息都由系統(tǒng)實時從數(shù)據(jù)庫中調(diào)用,由訊飛語音合成系統(tǒng)轉(zhuǎn)換成語音播放,不僅保證了信息的實時性,同時業(yè)務更加靈活,語音效果更好,系統(tǒng)的管理和維護也比以前便捷多了。

  成功案例2:武漢天河機場自動語音廣播系統(tǒng)

  武漢天河國際機場為4E級機場,是華中地區(qū)的航空運輸?shù)臉屑~。良好的發(fā)展機遇、特有的區(qū)位優(yōu)勢、齊全的機場功能使天河機場成為航空客貨集散中心。給乘客帶來更加優(yōu)質(zhì)高效的的服務是天河國際機場的目標。

  每天的起降的航班很多,如果單靠人工廣播工作量很大,而且不容易管理,往往會由于廣播的時間出現(xiàn)誤差、人員播音的錯誤引起機場秩序的混亂。而采用了語音合成技術(shù)的廣播系統(tǒng)能夠自動把需要廣播的文本內(nèi)容自動轉(zhuǎn)換成自然流暢的語音,很好地解決了上述的問題。

  天河機場自動語音廣播系統(tǒng)的功能是在機場實現(xiàn)廣播的自動化和控制的集中統(tǒng)一化。系統(tǒng)實現(xiàn)了對航班信息廣播的自動化,它將天河國際機場根據(jù)需要劃分出4個廣播分區(qū),這些廣播分區(qū)廣播不同的通知信息。

  廣播內(nèi)容一般有固定的格式,因此自動語音播報系統(tǒng)的工作人員用戶界面輸入采用填充和選擇的形式。操作人員選擇句型格式以后,只需把其中的變動內(nèi)容(如乘客姓名等)輸入系統(tǒng),或者直接從航班信息系統(tǒng)中選擇相應的信息,設(shè)定時間以后,系統(tǒng)到時即會自動廣播。并且可以根據(jù)現(xiàn)場的時機情況設(shè)置播放次數(shù)和每次重復廣播的時間間隔。也可以實現(xiàn)輸入提交以后馬上播放。

  由于實際操作本系統(tǒng)的操作人員使用4臺分布在不同位置的電腦,每臺電腦上看到的是一個客戶端的用戶界面。操作人員在自己的用戶界面上進行播報內(nèi)容的文字輸入、設(shè)置、編排等工作,操作人員可以編輯、修改、刪除已設(shè)定但還沒有播放的廣播內(nèi)容。

  無需了解和操作語音合成系統(tǒng)。用戶界面友好、使用簡單,操作人員只要有初步的電腦操作能力就可以勝任。

  考慮到機場有時需要廣播一些臨時內(nèi)容,需要人工播音。在這種情況下,可以預先錄制廣播內(nèi)容,存放在電腦中,并且在系統(tǒng)中預先設(shè)定播放時間。如果需要進行現(xiàn)場人工廣播,可以隨時停止自動播放功能,插入人工廣播。

  自動語音廣播系統(tǒng)對每條通知都采用用中英文雙語廣播,運用了訊飛的語音合成技術(shù),針對用戶的具體情況,可以進一步對一些新加入的特定語料內(nèi)容進行優(yōu)化,通用語音合成產(chǎn)品緊密結(jié)合定制化的資源,始終保證高質(zhì)量的語音合成效果,且簡單易用,穩(wěn)定可靠,得到機場工作人員的好評和信賴。

科大訊飛公司供稿 CTI論壇編輯



相關(guān)鏈接:
訊飛暢言語音教具系統(tǒng)榮獲“創(chuàng)新軟件產(chǎn)品” 2009-09-08
科大訊飛嵌入式語音新產(chǎn)品發(fā)布會在深圳舉行 2009-09-07
“會說話”的顯示屏提升居民小區(qū)信息服務水平 2009-09-07
訊飛語音助力太平人壽客服中心 2009-08-28
訊飛語音助力CDMA手機競爭終端市場 2009-08-14

相關(guān)頻道:  交通_與_語音合成TTS  交通_與_語音識別ASR  語音合成TTS_與_語音識別ASR