您當(dāng)前的位置是:  首頁(yè) > 資訊 > 國(guó)內(nèi) >
 首頁(yè) > 資訊 > 國(guó)內(nèi) >

為開發(fā)者賦能,標(biāo)貝科技重磅推出智能語(yǔ)音開放平臺(tái)

2021-04-06 16:23:00   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  近年來(lái),人工智能行業(yè)快速發(fā)展,智能語(yǔ)音市場(chǎng)也異常火熱。無(wú)論是BAT、網(wǎng)易等互聯(lián)網(wǎng)大廠,還是以訊飛為首的人工智能大企業(yè),亦或者近些年在AI賽道上異軍突起的中小企業(yè),都在用開放平臺(tái)的戰(zhàn)略方式,試圖籠絡(luò)各開發(fā)者,建立屬于自己的AI產(chǎn)業(yè)生態(tài)圈。
  據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),國(guó)內(nèi)智能語(yǔ)音相關(guān)開放平臺(tái)已有50多家,其中不乏垂直領(lǐng)域的技術(shù)型小公司。標(biāo)貝科技作為一家深耕智能語(yǔ)音領(lǐng)域中小企業(yè),在2021年4月6日,也正式宣布加入智能語(yǔ)音開放平臺(tái)“大軍”,進(jìn)一步推動(dòng)人工智能語(yǔ)音場(chǎng)景落地,全效助力開發(fā)者構(gòu)建自身AI語(yǔ)音生態(tài)。
  據(jù)了解,標(biāo)貝開放平臺(tái)匯集了標(biāo)貝科技五年以來(lái)在智能語(yǔ)音領(lǐng)域取得的相關(guān)技術(shù)成果,以豐富的商業(yè)化AI語(yǔ)音能力、個(gè)性化效果,為開發(fā)者提供業(yè)界領(lǐng)先的人機(jī)對(duì)話技術(shù)調(diào)用,能快速解決開發(fā)者在語(yǔ)音交互相關(guān)技術(shù)開發(fā)難點(diǎn)、痛點(diǎn)問(wèn)題,提高開發(fā)者智能化產(chǎn)品落地速度,大大節(jié)省其開放成本和時(shí)間。
  兩大服務(wù),提升交互體驗(yàn)
  目前,標(biāo)貝開放平臺(tái)提供的智能語(yǔ)音服務(wù)主要包括語(yǔ)音合成(TTS)與語(yǔ)音識(shí)別(ASR),開發(fā)者可以在平臺(tái)操作界面創(chuàng)建多個(gè)智能語(yǔ)音應(yīng)用,系統(tǒng)自動(dòng)分配了語(yǔ)音識(shí)別和語(yǔ)音合成的全部服務(wù)到該應(yīng)用。語(yǔ)音識(shí)別包括一句話識(shí)別、長(zhǎng)語(yǔ)音識(shí)別、錄音文件識(shí)別,語(yǔ)音合成可選擇在線合成、離線合成、長(zhǎng)文本合成三種,并可根據(jù)客戶自身需求進(jìn)行用量、音色、并發(fā)等接入試用。特別值得一提的是,離線引擎的開放,使標(biāo)貝對(duì)智能電視等嵌入式設(shè)備廠商的服務(wù)更為全面。
  在語(yǔ)音合成方面,標(biāo)貝采用基于transfomer機(jī)制的高音質(zhì)合成,綜合利用聲學(xué)和語(yǔ)言學(xué)參數(shù),多音字的合成準(zhǔn)確率更高,韻律停頓更加自然,整體的語(yǔ)音聽感體驗(yàn)更接近場(chǎng)景化的真人表達(dá)。合成的接口全面支持多音字標(biāo)注,手動(dòng)校對(duì)發(fā)音,語(yǔ)速停頓調(diào)節(jié)等通用功能。語(yǔ)音識(shí)別方面,基于先進(jìn)的端到端的深度學(xué)習(xí)算法,聚焦中文普通話近場(chǎng)識(shí)別,在安靜環(huán)境下近字準(zhǔn)確率超過(guò)97%。除了支持16k的設(shè)備端交互,還支持8k的客服場(chǎng)景電話語(yǔ)音識(shí)別。并支持通過(guò)熱詞更新方式,進(jìn)行領(lǐng)域內(nèi)特定詞識(shí)別效果的快速優(yōu)化。
  全音庫(kù)開放,支持多應(yīng)用場(chǎng)景
  標(biāo)貝開放平臺(tái)發(fā)布后將開放近60個(gè)音色,涵蓋老人、兒童、青年男女音。每一種音色均使用海量音頻數(shù)據(jù)訓(xùn)練而成,聲音真實(shí)飽滿、富有表現(xiàn)力,MOS評(píng)分達(dá)到業(yè)內(nèi)領(lǐng)先水準(zhǔn)。同時(shí),平臺(tái)支持中文、英文、中英混合、方言和多語(yǔ)種發(fā)音,可滿足教育、新聞、有聲閱讀、泛娛樂(lè)等領(lǐng)域語(yǔ)音定制需求,并支持多語(yǔ)言、多情感同時(shí)使用。
  簡(jiǎn)單兼容,賦能開發(fā)者
  與目前主流智能語(yǔ)音開放平臺(tái)相同,標(biāo)貝開放平臺(tái)提供WEBAPI調(diào)用,Android、iOS等平臺(tái)SDK接入方式,平臺(tái)基于B/S架構(gòu)的管理平臺(tái),使開發(fā)者可根據(jù)需求同時(shí)創(chuàng)建多個(gè)應(yīng)用,支持千萬(wàn)級(jí)并發(fā),每個(gè)應(yīng)用有獨(dú)立的可視化數(shù)據(jù)統(tǒng)計(jì),幫助開發(fā)者實(shí)時(shí)、精確地監(jiān)測(cè)應(yīng)用服務(wù)調(diào)用情況。
  與此同時(shí),標(biāo)貝開放平臺(tái)設(shè)有應(yīng)用預(yù)警功能,通過(guò)預(yù)警管理,開發(fā)者可對(duì)調(diào)用頻次、剩余用量、并發(fā)量和有效期限等使用狀態(tài)進(jìn)行設(shè)置,實(shí)現(xiàn)精細(xì)化管理。來(lái)自標(biāo)貝科技的數(shù)據(jù)顯示,該平臺(tái)語(yǔ)音合成和語(yǔ)音識(shí)別的速度均達(dá)到行業(yè)領(lǐng)先水平,服務(wù)可靠性高達(dá)99.9%。
  除此之外,標(biāo)貝開放平臺(tái)非常注重交互感,無(wú)論是UI界面還是功能體驗(yàn),都比較人性化,是目前最簡(jiǎn)單且最兼容的智能語(yǔ)音交互平臺(tái)之一,致力于讓各位開發(fā)者,使用方便、效率翻倍。
  對(duì)于智能語(yǔ)音服務(wù)平臺(tái)的上線,標(biāo)貝開放平臺(tái)相關(guān)負(fù)責(zé)人表示,“憑借在基礎(chǔ)業(yè)務(wù)AI數(shù)據(jù)服務(wù)的長(zhǎng)期積累,以及不斷創(chuàng)新的技術(shù)研發(fā)投入,標(biāo)貝科技智能語(yǔ)音交互技術(shù)已達(dá)到業(yè)內(nèi)領(lǐng)先水平,希望通過(guò)標(biāo)貝語(yǔ)音服務(wù)開放平臺(tái)賦能各行業(yè),共同開創(chuàng)更多語(yǔ)音交互場(chǎng)景,實(shí)現(xiàn)開放共贏。”據(jù)悉,標(biāo)貝開放平臺(tái)新注冊(cè)的會(huì)員,可獲得一定量的無(wú)限期免費(fèi)服務(wù)及優(yōu)惠。
 
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)