您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

捷通華聲靈云語音合成:極致運行速度,高品質(zhì)合成效果

2021-02-26 09:36:36   作者:   來源:CTI論壇   評論:0  點擊:


天氣播報
機場播報
新聞播報
客服
粵語
  語音合成技術(shù)在不知不覺中已融入人們的生活。
  捷通華聲從2001年在國內(nèi)率先推出面向市場的語音合成技術(shù)以來,至今已深耕語音市場20年,廣泛服務(wù)金融、電信、能源、交通、教育、司法、公安、醫(yī)療、互聯(lián)網(wǎng)等多個領(lǐng)域,包括北京奧運會、上海世博會、北京大興國際機場、全國大部分高鐵等等。
  極致運行速度高品質(zhì)合成效果
  最新靈云語音合成技術(shù)引用“全并行架構(gòu)聲學(xué)模型”將運行速度提升10倍,實時率顯著提升,這意味著在人機交互中,語音合成技術(shù)幾乎不會形成用戶等待時間。
  通過采用一體化的智能文本分析算法,結(jié)合統(tǒng)計和規(guī)則等處理手段,靈云語音合成技術(shù)對文本處理前端擁有較強的分詞、多音字、韻律環(huán)境預(yù)測能力,以及自動識別和處理日期時間、數(shù)值金額、電話號碼等文本的能力。此外,還支持每個發(fā)音人私有一個韻律預(yù)測模型文件,進一步提升韻律預(yù)測效果。
  得益于聲學(xué)核心的深度學(xué)習(xí)化與高音質(zhì)聲碼器,語音合成效果干凈飽滿又飽含細(xì)節(jié)、個人特色還原到位,聲線細(xì)膩、情感豐富、語速真實、媲比真聲。靈云語音合成技術(shù)擁有多個音庫,包括普通話、英語、維語等20多個語種,男聲、女聲、童聲、甜美可愛、成熟穩(wěn)重、熱情洋溢等多種風(fēng)格。
  多種語音合成接入方式個人定制觸手可及
  • 公有云調(diào)用
  捷通華聲在2011年推出國內(nèi)外首款全方位人工智能開放平臺——靈云開放平臺(AIcloud)。
  靈云開放平臺通過提供公有云服務(wù)器API和SDK等接口服務(wù),讓開發(fā)者能夠免費享受到最新的語音合成技術(shù)。
  此外,靈云開放平臺為開發(fā)者提供語音識別、語義理解、聲紋識別、語音喚醒、光學(xué)字符識別、人臉識別、手寫識別、機器翻譯、鍵盤輸入等多種技術(shù)能力SDK。開發(fā)者可以簡單、快速地接入所需的能力,并自由靈活組合,定制開發(fā)自己的產(chǎn)品。
  • 私有云部署
  捷通華聲提供可私有云部署的語音合成能力平臺。比如在銀行客服中心,通過與客戶IVR系統(tǒng)對接,提供穩(wěn)定高效的語音合成服務(wù),實現(xiàn)用機器人來服務(wù)海量用戶,滿足用戶安全性、私有化、高并發(fā)等特性需求。
  • 開放云服務(wù)
  對于不懂開發(fā)的普通用戶,捷通華聲提供開放的語音合成云服務(wù)(speech.aicloud.com),可以讓用戶直接在網(wǎng)頁上生成和下載文本對應(yīng)的音頻文件。
  目前,靈云語音云服務(wù)全部免費,這不僅方便個人用戶豐富短視頻內(nèi)容,還可以免去錄音成本,提升創(chuàng)作效率。有效地降低了使用語音合成產(chǎn)品的門檻,讓每個人都可以輕而易舉地享受語音合成帶來的便利。

【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)