您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

語音合成IC與語音IC的兩三事

2020-05-27 09:15:46   作者:   來源:CTI論壇   評論:0  點(diǎn)擊:


  目前市面上的可發(fā)聲IC分為兩大類:語音合成芯片(TTS芯片)與語音芯片。在實(shí)際開發(fā)語音產(chǎn)品中,很多研發(fā)人員在這兩類芯片的認(rèn)知上會出現(xiàn)概念上的混淆,常常將文字轉(zhuǎn)語音芯片誤認(rèn)為語音芯片,加之一些制作銷售語音芯片的公司,為了更好的銷售,以突出語音芯片的價格優(yōu)勢,也對外宣稱其語音IC是語音合成芯片,有意識地誤導(dǎo)開發(fā)人員,其實(shí)這兩種芯片是有本質(zhì)區(qū)別的。
  語音合成IC,又稱文本轉(zhuǎn)語音芯片(Textto Speech,簡稱TTS,市面常見SYN6658中文語音合成芯片和模塊),能將任意文字信息實(shí)時轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音朗讀出來,相當(dāng)于給機(jī)器裝上了人工嘴巴。語音合成芯片通過UART接口或SPI接口通訊方式,接收待合成的文本數(shù)據(jù),實(shí)現(xiàn)文本到語音(或TTS語音)的轉(zhuǎn)換。其特性是:支持任意中文文本的合成,對常見的數(shù)值、電話號碼、時間日期、度量衡符號等格式的文本具有文本智能分析處理功能;只需要上位機(jī)通過串行通信對其發(fā)送一段文本信息,再將文本信息轉(zhuǎn)化為語音信號即可實(shí)現(xiàn)實(shí)時文字轉(zhuǎn)語音的播報。
  語音IC,顧名思義就是可以存儲控制播放語音的IC;是指將語音信號通過采樣轉(zhuǎn)化為數(shù)字,存儲在IC的ROM中,再通過電路將ROM中的數(shù)字還原成語音信號。從使用方法來看,語音芯片的主要使用方式是先對其進(jìn)行錄音,錄音完成燒錄后再來對其使用。
  總的來說,語音IC是把聲音錄制進(jìn)去才能播放,語音合成IC是可以直接把文本的內(nèi)容播放出來。所以,語音合成芯片是一種高端智能的語音芯片,是一種采取了語音合成技術(shù)的、截然不同的智能語音芯片,它內(nèi)置了中文TTS軟件或語音合成軟件核心。從未來的市場發(fā)展和用戶體驗(yàn)要求上來看,語音合成模塊的便捷性始終優(yōu)于市場上的各類語音模塊,更確切的說,未來的語音合成芯片合成效果自然度將更高,性價比將更高,控制更方便以及面向多語種化。
  語音合成IC與語音IC本質(zhì)區(qū)別在于語音更新:
  語音合成IC,無需燒錄語音。只需要發(fā)送漢字的字庫就可以播報出來,特別是處理大量的非固定的文本信息的時候且需要實(shí)時語音提示時,就必須要用到語音合成了。市面上目前比較成熟的SYN6658語音合成芯片,受到很多研發(fā)人員的認(rèn)可。
  語音IC,需預(yù)錄制語音(涉及終端產(chǎn)品更新必須找同一錄音人)、需重新燒錄、需校驗(yàn),語音段長度受限,尤其是當(dāng)這些研制出的語音終端,銷往不同的用戶,就需要使用不同的語音錄制文件,這將會消耗研發(fā)人員大量的寶貴成本。
  目前市面上的語音合成IC對比如下圖,可迅速了解芯片的相關(guān)性能:
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點(diǎn)判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)