您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

標(biāo)貝科技推出情感合成TTS 多情感、強表現(xiàn)力聲效讓交互更有溫度

2020-05-28 15:33:28   作者:   來源:CTI論壇   評論:0  點擊:


  語音合成技術(shù)已進(jìn)入到人們的日常生活,有聲閱讀、智能客服、智能家居等場景都已經(jīng)出現(xiàn)了“它”的身影。有情感的聲音,賦予機器生命感,讓人機交互更美好、簡單。
  5月28日,標(biāo)貝科技重磅推出情感合成方案,主打高音質(zhì)及高自然度的情感語音合成效果,滿足有聲閱讀、兒童教育、車載、泛娛樂等多場景使用。據(jù)悉,標(biāo)貝科技本次打造情感合成方案,是繼3月成功推出留聲機方案之后,推出的又一全新TTS解決方案,通過整體提高情感合成聲音效果,提升用戶的交互體驗。
  AI情感合成讓語音交互更有溫度
  聲音的可用性,可以通過自然度、可懂度、識別度等維度來考量。語音技術(shù)的進(jìn)步,讓機器合成的聲音不再頓挫、冰冷,在自然度和可懂度等方面取得了不錯的成績,但當(dāng)前合成效果在合成音的表現(xiàn)力上,特別是語氣和情感方面,還有不足。缺乏情感的聲音,何談傳遞情感,留住用戶?
  情感合成,可以具有更進(jìn)一步的聲音表現(xiàn)力,傳遞出文本文字之外更多的信息,做到聲情并茂,以更動聽的聲音,更富有情感地表達(dá)內(nèi)容。
  事實上,不同場景及文本類型,對聲音的要求也不同,除了基本的高音質(zhì)、自然度要求外,讓聲音擁有情感是不可或缺的。同樣的文本內(nèi)容,用不同情感表達(dá)出的傳遞出的意思也不盡相同,需要“音”景制宜,以增強用戶的融入感、代入感。例如,這句話“為什么你要這么問我?”試想下用生氣、高興、恐懼等情感說出效果與表達(dá)的意思。
  此外,隨著語音技術(shù)推廣應(yīng)用深入不同的服務(wù)場景,用戶對聲音提出了更高的要求。智能客服場景,需要親和溫暖的聲音來提高用戶的滿意度;有聲閱讀場景,需要根據(jù)不同題材搭配出不同聲音,讓用戶感受有聲文本的魅力;智慧生活場景的語音交互,需要有情感的聲音賦予機器生命力,更懂用戶,感受科技生活的美好。
  因此,如何進(jìn)一步提高語音合成的表現(xiàn)力,特別是讓合成語音能夠模擬表達(dá)說話人的情感狀態(tài),是語音合成未來發(fā)展的趨勢,而這也正是標(biāo)貝科技一直努力的方向。
  打造高音質(zhì)、高自然度、強表現(xiàn)力的情感合成TTS
  據(jù)標(biāo)貝科技語音相關(guān)負(fù)責(zé)人介紹,基于深度學(xué)習(xí)技術(shù)及自有定制情感數(shù)據(jù),標(biāo)貝本次推出情感合成TTS,主打高音質(zhì)、高自然度與多情感,可以呈現(xiàn)出高興、憤怒、恐懼、哀嘆、悲傷等多種情感聲音,在韻律表現(xiàn)、聲音層次感、情感表達(dá)等方面做到更加接近真人情感化表達(dá)的語音效果。標(biāo)貝科技希望通過語音技術(shù)的不斷創(chuàng)新,打造出更有表現(xiàn)力、更自然、更動聽的情感合成語音,持續(xù)提升用戶交互體驗。
  例如有聲閱讀、兒童教育、智能硬件等場景,高音質(zhì)、自然度的情感很重要。標(biāo)貝通過使用情感TTS技術(shù),力求在語氣、語音、語調(diào)、情感等方面接近真人說話,與場景匹配,讓用戶在不同場景和碎片化時間,進(jìn)行有聲聽讀獲取資訊、體驗在線學(xué)習(xí)教育獲得優(yōu)質(zhì)體驗。
  以多角色情感合成為例,由于故事、小說等文本素材包含大量角色人物,通過不同情感合成聲音配合文本內(nèi)容,以展現(xiàn)文學(xué)小說人物的的特點,讓AI技術(shù)生產(chǎn)的有聲讀物更有“人情味”。
  下面通過一個多角色多情感的兒童故事合成樣本,來展示標(biāo)貝情感TTS帶來不一樣的有聲故事體驗。
  在故事中,我們可以切實感受到故事中人物情感的變化情況,更能夠吸引少兒聽眾,營造一種引人入勝的沉浸感。
  來自易觀發(fā)布《2020年中國音頻產(chǎn)業(yè)生態(tài)發(fā)展分析報告》表示,有聲市場呈現(xiàn)增長的態(tài)勢,越來越多的用戶開始接受有聲閱讀這樣的形式來收聽內(nèi)容。其中,2020年1季度,在某知名有聲書平臺的播放量和收聽人數(shù)上都有顯著增長,兩者環(huán)比分別增長80.32%和39.82%。此外,用戶在有聲讀物的付費購買上也更加積極,2019年該平臺整體有聲書專輯訂單中過半為付費訂單。
  毫無疑問,有聲市場的爆發(fā)增長,將誕生大量不同類型的有聲內(nèi)容,相信情感語音合成能夠帶來更加自然和豐富的語音體驗,為有聲讀物市場提供更有競爭力的差異化產(chǎn)品。
  自有數(shù)據(jù)庫加持讓情感合成實現(xiàn)“可定制”
  事實上,打造自然、高表現(xiàn)力的聲音效果,自然離不開語音情感數(shù)據(jù)支持。數(shù)據(jù)庫是語音合成技術(shù)的基礎(chǔ),也是決定語音合成效果的關(guān)鍵因素之一。據(jù)了解,標(biāo)貝科技本次打造的情感TTS,采用了自有定制的高保真的情感語音庫。
  目前,標(biāo)貝科技自有定制型語音庫已開發(fā)出包括中文女聲情感音庫、多語種多音色男女聲音庫、粵語語音庫、兒童語音庫、葡萄牙語音庫、臺灣普通話語音庫、日語音庫、韓語音庫、明星語音庫等數(shù)十種類別,IP語音庫還在不斷豐富和積累中。
  基于領(lǐng)先語音技術(shù)+高質(zhì)量的數(shù)據(jù)庫基礎(chǔ),標(biāo)貝能夠提供業(yè)內(nèi)優(yōu)質(zhì)的情感解決方案,呈現(xiàn)出聲音的多樣性、和個性化的合成效果體驗。這也是因為標(biāo)貝科技自成立起,將語音交互效果和數(shù)據(jù)質(zhì)量放在首位,擁有完整的采標(biāo)一體化解決方案,能夠?qū)崿F(xiàn)快速產(chǎn)出高質(zhì)量的語音合成、語音識別、自然語言處理、計算機視覺等采標(biāo)服務(wù),為行業(yè)提供一站式語音和數(shù)據(jù)服務(wù)。
  未來,隨著語音技術(shù)不斷發(fā)展,技術(shù)與場景的關(guān)系變得緊密,而用戶需求變得更加個性化。標(biāo)貝科技將加大技術(shù)創(chuàng)新投入,打造更有溫度的情感聲音,讓語音交互效果更“聲入人心”。
 
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)