您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

標(biāo)貝科技語音庫|模仿童聲、中文女聲情感數(shù)據(jù)庫

--分為喜、怒、哀、驚、懼、厭六種情感的表達(dá)

2020-04-24 10:45:51   作者:   來源:CTI論壇   評論:0  點擊:


  語音合成技術(shù)的推廣應(yīng)用,對語音合成的質(zhì)量提出了更高的要求。如何進(jìn)一步提高語音合成的表現(xiàn)力,特別是讓合成語音能夠模擬表達(dá)說話人的情感狀態(tài),是語音合成未來發(fā)展的趨勢,也是語音合成研究領(lǐng)域所面臨的一個難題。而情感語音庫是語音合成技術(shù)的基礎(chǔ),也是決定語音合成效果的關(guān)鍵因素。
(點擊試聽情感效果)
  模仿童聲—情感音庫
  【模仿童聲DB-6-情感音庫】采集對象為標(biāo)準(zhǔn)普通話女聲模仿兒童,聽感活潑甜美。分為喜、怒、哀、驚、懼、厭六種情感的表達(dá)。錄制環(huán)境為專業(yè)錄音室和錄音軟件,錄音環(huán)境和設(shè)備自始至終保持不變,錄音環(huán)境的信噪比不低于35dB;單聲道錄音,用48KHz16比特采樣頻率、PCMWAV格式。錄音語料為中文,利于各情感的表達(dá),并對音節(jié)、音子、韻律等在有限語料基礎(chǔ)上做了盡可能全面的覆蓋。根據(jù)合成語音標(biāo)注標(biāo)準(zhǔn),依據(jù)發(fā)音人實際發(fā)音對音庫進(jìn)行文本音字校對、韻律層級標(biāo)注。
 。c擊試聽情感效果)
  數(shù)據(jù)應(yīng)用場景
  本語音數(shù)據(jù)庫應(yīng)用廣泛,可用于以下方面:
  1.科研,可用于語音合成系統(tǒng)模型訓(xùn)練;
  2.有聲讀物;
  3.生活出行;
  3.智能科技;
  4.教育、娛樂等。
  技術(shù)參數(shù)

數(shù)據(jù)規(guī)格

數(shù)據(jù)內(nèi)容

中文女聲DB-6情感音庫數(shù)據(jù)

錄音語料

6種情感各2000句語料(喜、怒、哀、驚、懼、厭)

有效時長

14成品小時(12000句)

平均字?jǐn)?shù)

15/

語言類型

標(biāo)準(zhǔn)普通話

發(fā)音人

女;20-30歲;聲音溫柔親切

錄音環(huán)境

聲音采集環(huán)境為專業(yè)錄音棚環(huán)境

1)        錄音棚符合專業(yè)音庫錄制標(biāo)準(zhǔn);

2)        錄音環(huán)境和設(shè)備自始至終保持不變;

3)        錄音環(huán)境的信噪比不低于35dB。

錄制工具

專業(yè)錄音設(shè)備及錄音軟件

采樣格式

無壓縮PCM WAV格式,采樣率為48KHz、16bit

標(biāo)注內(nèi)容

中文音字標(biāo)注、韻律標(biāo)注、聲韻母邊界標(biāo)注

標(biāo)注格式

文本標(biāo)注為.txt格式文檔;邊界標(biāo)注為.interval格式文檔

質(zhì)量標(biāo)準(zhǔn)

1. 語音文件為48k 16bit wav格式,音色、音量、語速一致,無截幅;

2.標(biāo)注文件字準(zhǔn)率不低于99.8%;

3.韻律無明顯不合理標(biāo)注錯誤;

4.音素邊界錯誤大于10ms的比例小于1%;音節(jié)邊界準(zhǔn)確率大于98%.

存儲方式

本地FTP存儲

文件格式

音頻文件:WAV 文本標(biāo)注文件:TXT 邊界標(biāo)注文件:INTERVAL

數(shù)據(jù)脫敏

數(shù)據(jù)敏感項

產(chǎn)品應(yīng)用

適用領(lǐng)域

科研、智能科技、生活、教育、娛樂等多領(lǐng)域應(yīng)用

版權(quán)歸屬

版權(quán)所有者

標(biāo)貝(北京)科技有限公司

  中文女聲—情感音庫
  【中文女聲DB-6情感音庫】采集對象為標(biāo)準(zhǔn)普通話女聲,分為喜、怒、哀、驚、懼、厭六種情感的表達(dá)。錄制環(huán)境為專業(yè)錄音室和錄音軟件,錄音環(huán)境和設(shè)備自始至終保持不變,錄音環(huán)境的信噪比不低于35dB;單聲道錄音,用48KHz16比特采樣頻率、PCMWAV格式。錄音語料為中文,利于各情感的表達(dá),并對音節(jié)、音子、韻律等在有限語料基礎(chǔ)上做了盡可能全面的覆蓋。根據(jù)合成語音標(biāo)注標(biāo)準(zhǔn),依據(jù)發(fā)音人實際發(fā)音對音庫進(jìn)行文本音字校對、韻律層級標(biāo)注、聲韻母邊界標(biāo)注。
(點擊試聽情感效果)
  數(shù)據(jù)應(yīng)用場景
  本語音數(shù)據(jù)庫應(yīng)用廣泛,可用于以下方面:
  1.科研,可用于語音合成系統(tǒng)模型訓(xùn)練;
  2.有聲讀物;
  3.生活出行;
  3.智能科技;
  4.教育、娛樂等。
  技術(shù)參數(shù)

數(shù)據(jù)規(guī)格

數(shù)據(jù)內(nèi)容

模仿童聲DB-6情感音庫數(shù)據(jù)

錄音語料

6種情感各2000句語料

有效時長

14成品小時(12000句)

平均字?jǐn)?shù)

15/

語言類型

標(biāo)準(zhǔn)普通話

發(fā)音人

女聲模仿兒童,活潑甜美風(fēng)格

錄音環(huán)境

聲音采集環(huán)境為專業(yè)錄音棚環(huán)境

1)        錄音棚符合專業(yè)音庫錄制標(biāo)準(zhǔn);

2)        錄音環(huán)境和設(shè)備自始至終保持不變;

3)        錄音環(huán)境的信噪比不低于35dB。

錄制工具

專業(yè)錄音設(shè)備及錄音軟件

采樣格式

無壓縮PCM WAV格式,采樣率為48KHz、16bit

標(biāo)注內(nèi)容

中文音字標(biāo)注、韻律標(biāo)注

標(biāo)注格式

文本標(biāo)注為.txt格式文檔

質(zhì)量標(biāo)準(zhǔn)

1.語音文件為48k 16bit wav格式,音色、音量、語速一致,無截幅;

2.標(biāo)注文件字準(zhǔn)率不低于99.8%

3.韻律無明顯不合理標(biāo)注錯誤。

存儲方式

本地FTP存儲

文件格式

音頻文件:WAV 文本標(biāo)注文件:TXT

數(shù)據(jù)脫敏

數(shù)據(jù)敏感項

產(chǎn)品應(yīng)用

適用領(lǐng)域

科研、智能科技、生活、教育、娛樂等多領(lǐng)域應(yīng)用

版權(quán)歸屬

版權(quán)所有者

標(biāo)貝(北京)科技有限公司

 

【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)