您當(dāng)前的位置是:  首頁 > 資訊 > 國(guó)內(nèi) >
 首頁 > 資訊 > 國(guó)內(nèi) >

思必馳語音合成技術(shù),助力 AI 虛擬形象探索聲音的價(jià)值

2019-12-10 13:49:59   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  12月2日~8日,第十屆中國(guó)國(guó)際新媒體短片節(jié)在深圳舉辦。AI數(shù)字人「陸川導(dǎo)演」與國(guó)內(nèi)首個(gè)AI虛擬偶像「子書美」與觀眾見面,可實(shí)現(xiàn)面對(duì)面互動(dòng)交流,為觀眾帶來打破虛擬空間和現(xiàn)實(shí)空間次元壁的實(shí)時(shí)實(shí)感交流互動(dòng)體驗(yàn)。
  虛擬形象不僅要看的見,其高辨識(shí)度的「嗓音」更是重要的聲音名片。值得一提的是,這兩位虛擬形象的「造聲」,均由思必馳提供的技術(shù)支持。
  其中,AI數(shù)字人陸川導(dǎo)演「造聲」是基于思必馳神經(jīng)網(wǎng)絡(luò)建立的語音合成學(xué)習(xí)模型,將采集錄制的陸川導(dǎo)演本人的音頻進(jìn)行訓(xùn)練學(xué)習(xí),合成出了以假亂真的AI數(shù)字人陸川導(dǎo)演的聲音。
  與復(fù)刻AI數(shù)字人陸川導(dǎo)演的嗓音不同,子書美的合成音需要「憑空創(chuàng)造」。思必馳結(jié)合子書美形象性格與人設(shè)屬性,為其量身打造了一款知性優(yōu)雅的合成音。
  語音合成技術(shù)也是當(dāng)今國(guó)際人機(jī)交互領(lǐng)域競(jìng)相研究的熱門技術(shù)之一,合成音的應(yīng)用極大減少了人力錄音的成本,成為了智能機(jī)器的標(biāo)配能力,幫助廠商打造voice-IP。
  思必馳提供數(shù)十種語音合成預(yù)設(shè)方案作為音色選擇,同時(shí)還可以對(duì)合成音進(jìn)行大數(shù)據(jù)深度定制與小數(shù)據(jù)快速定制服務(wù)。
  此外,關(guān)于語音合成的效果,一方面依賴算法模型,另一方面,依賴于用戶提供音頻語料的質(zhì)量。因此在音頻語料的采集上,建議在安靜的環(huán)境下進(jìn)行,說話語速勻速、聲音大小適當(dāng)、音色盡量一致、不要噴麥。語料音頻質(zhì)量越高,合成音效果自然越貼近真實(shí)人聲。
  語音合成,好比AI時(shí)代的活字印刷術(shù),創(chuàng)建一套合成模型,便可以「印出」你想要的聲音。語音合成出的聲音,以前所未有的方式改變著信息傳播交流的形式。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)