您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

標(biāo)貝科技聲音理解功能上線 助力推進個性化語音交互時代

2021-12-17 14:14:36   作者:   來源:CTI論壇   評論:0  點擊:


  古有聽聲辨位,今有聽聲"識"人。說到聲音,其本質(zhì)是不同頻率聲音的集合,以波的形式振動(震動)傳播。由于每個人的發(fā)聲器官(口腔、鼻腔、聲帶)各不相同,因此每個人的聲音也不一樣。因而,你的聲音代表了個人很多關(guān)鍵信息,例如,性別、年齡、音色等特征。
  前幾年,韓國大熱的刑偵劇《Voice》里,女主是一個報警中心電話接聽員,天生聽力過人,不僅能聽到很多常人聽不到的細小微弱的聲音,還能分辨出人講話的聲音、物體碰撞的聲音、環(huán)境背景音等,靠著這個聽聲辨物的"超能力",女主通過現(xiàn)場聲音,準(zhǔn)確的分辨人、物、地點,幫助組員破獲了很多案件和解救人質(zhì)。
  如今,這種通過解讀聲音來識人辨物,已經(jīng)完全能靠人工智能來實現(xiàn)了,即眾所周知的聲音識別。
  在我們?nèi)粘I町?dāng)中,聲音識別已經(jīng)應(yīng)用得非常廣泛了。比如說我們平時使用一些智能家居設(shè)備時,通過語音進行指令操控;在不方便進行手動輸入的場景下,可以通過語音輸入,進行網(wǎng)頁搜索、導(dǎo)航設(shè)定、文本錄入,動嘴不動手,方便快捷。
  但僅僅是這樣還不夠。在實際的應(yīng)用場景里,用戶的說話環(huán)境往往包含各種各樣的噪聲,會在一定程度上污染說話人的聲音信號,使算法無法準(zhǔn)確獲取說話人的聲紋特征;甚至由于說話人過多,無法準(zhǔn)確分離出目標(biāo)人的聲音,提取不到準(zhǔn)確的聲紋特征等因素,都會對識別效果有影響。
  標(biāo)貝科技立足于對AI的理解,依托先進的語音交互技術(shù),以語言和語音為入口,持續(xù)研發(fā)全新的AI語音能力,打造更懂用戶的語音服務(wù)和更接地氣的語音產(chǎn)品,目前已經(jīng)推出中英文語音識別、多語種語音合成、聲音轉(zhuǎn)換和聲紋識別服務(wù),均得到落地應(yīng)用。與此同時,標(biāo)貝科技持續(xù)深挖細分領(lǐng)域,全新上線聲音理解功能,不僅能聽懂用戶說什么,還能鑒定用戶身份。
  標(biāo)貝科技聲音理解,即通過聲音識別基本算法,自動對說話人的語音信號進行特征提取,構(gòu)建聲音分析框架,由機器進行語音數(shù)據(jù)分析,快速區(qū)分噪音與人聲,并判定發(fā)音人性別和年齡段,進行更加精準(zhǔn)化的信息匹配。
  在應(yīng)用場景上,聲音理解功能尤為有意義。在人機交互系統(tǒng)中,可以通過說話人的性別和年齡確定說話人所屬的特定人群,從而更有針對性的進行交互。
  在智能家居領(lǐng)域,智能音箱、智能語音助手可以利用聲音理解的"辨認"技術(shù),得出其性別、年齡、歷史偏好等信息,提供個性化服務(wù),如針對老年人、兒童等年齡段用戶,按照興趣推薦不同的歌曲、新聞,對設(shè)備控制權(quán)限進行安全控制,讓機器更智能。
  在智能客服場景里,基于語義的自動電話銷售已經(jīng)成為行業(yè)常態(tài),而通過聲音理解功能對語音客服的音頻數(shù)據(jù)進行分析,構(gòu)造實時準(zhǔn)確的用戶畫像,能做到對不同電銷客戶的精準(zhǔn)推送,大大降低獲客成本,提升用戶活躍度,增強變現(xiàn)能力。
  在刑事偵查中,警方可以根據(jù)用戶的年齡和性別進行訪問授權(quán),快速確定說話人的性別和年齡,有助于縮小搜索范圍,并為分析犯罪心理和行為分析提供依據(jù)。
  總的來說,聲音作為人們進行信息交流最方便、有效的方式,未來必然也是人機交互的不可或缺的載體。隨著多種語音交互技術(shù)的不斷成熟和融合,語音交互越來越多的轉(zhuǎn)向個性化需求,結(jié)合語音識別、聲紋識別等多元技術(shù),聲音理解能力將逐漸融入人們的日常生活,產(chǎn)生巨大的應(yīng)用價值。標(biāo)貝科技也將持續(xù)推動AI語音技術(shù)創(chuàng)新研發(fā),助力企業(yè)與開發(fā)者實現(xiàn)更多個性化語音解決方案的落地。
  標(biāo)貝科技【聲音理解】服務(wù)已于12月16日在標(biāo)貝科技官網(wǎng)與標(biāo)貝開放平臺同步上線公測,免費體驗地址:
(1)標(biāo)貝科技官網(wǎng):https://www.data-baker.com/
(2)標(biāo)貝開放平臺:https://ai.data-baker.com/#/index?source=gzh001
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)