您當(dāng)前的位置是:  首頁(yè) > 資訊 > 國(guó)內(nèi) >
 首頁(yè) > 資訊 > 國(guó)內(nèi) >

新年上新|標(biāo)貝科技自學(xué)習(xí)引擎助力語(yǔ)音識(shí)別更精確

2022-01-07 16:58:27   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  每到歲末年初,總是職場(chǎng)人最忙碌的時(shí)候。各種名目繁多的年終總結(jié)會(huì)接踵而來(lái),小組分享會(huì)、部門總結(jié)會(huì)、公司全員會(huì)......參會(huì)不可怕,可怕的是,這次輪到誰(shuí)做會(huì)議紀(jì)要!要知道這些會(huì)議不僅持續(xù)時(shí)間長(zhǎng),參與人數(shù)多,會(huì)議錄音里很多話根本聽不清。
  但機(jī)智如小貝,提前從產(chǎn)品運(yùn)營(yíng)小姐姐那里弄來(lái)了自家語(yǔ)音識(shí)別SVIP權(quán)限,無(wú)論是線下會(huì)議、視頻會(huì)議,還是微信電話等,再長(zhǎng)的錄音語(yǔ)音文件,一鍵轉(zhuǎn)換,大份大份的會(huì)議紀(jì)要新鮮出爐,簡(jiǎn)直是強(qiáng)迫癥的福音有木有!
  其實(shí)在人工智能飛速發(fā)展的今天,隨著數(shù)據(jù)量增加、計(jì)算能力增強(qiáng)以及深度學(xué)習(xí)理論技術(shù)的發(fā)展,語(yǔ)音識(shí)別準(zhǔn)確率不斷提升,應(yīng)用領(lǐng)域不斷拓寬。不止是會(huì)議錄音文件轉(zhuǎn)寫,語(yǔ)音識(shí)別早就成為很多設(shè)備的標(biāo)配。例如,我們可以對(duì)著手機(jī)說(shuō)“siri,打個(gè)電話給老媽”,又或是“小度小度,放首歌”等等。
  雖然目前語(yǔ)音識(shí)別對(duì)于通用場(chǎng)景的語(yǔ)音識(shí)別效果較好。但是在一些特定和垂直的應(yīng)用領(lǐng)域,對(duì)于一些專有名字、專業(yè)術(shù)語(yǔ)、特定的命名實(shí)體等識(shí)別的準(zhǔn)確率卻不盡人意。例如游戲中有很多專屬的說(shuō)法,“冷靜,不要莽”,“不服來(lái)Sala(Solo)啊,父子局”、“咱們家沒(méi)有打野嗎”,這些特定的詞匯僅使用通用語(yǔ)音識(shí)別功能很難將其準(zhǔn)確識(shí)別。
  面對(duì)這些語(yǔ)音識(shí)別難題,標(biāo)貝科技強(qiáng)大的算法團(tuán)隊(duì)自主研發(fā)ASR自學(xué)習(xí)引擎,推出“自學(xué)習(xí)個(gè)性化模型”和“熱詞”的功能,以提高專屬場(chǎng)景下語(yǔ)音識(shí)別準(zhǔn)確率。
  01. 標(biāo)貝科技語(yǔ)音識(shí)別自學(xué)習(xí)工具是什么?
  目前市場(chǎng)上供應(yīng)商大多都是提供通用領(lǐng)域的語(yǔ)音識(shí)別服務(wù),對(duì)應(yīng)的語(yǔ)言模型為基礎(chǔ)語(yǔ)言模型。如果用戶需要識(shí)別的語(yǔ)音內(nèi)容不在現(xiàn)有的模型范圍內(nèi),就會(huì)出現(xiàn)部分詞匯默認(rèn)識(shí)別效果不好。
  通過(guò)標(biāo)貝科技“自學(xué)習(xí)工具”,在語(yǔ)音識(shí)別控制臺(tái)上傳專有領(lǐng)域或行業(yè)積累的文本數(shù)據(jù),通過(guò)對(duì)這些訓(xùn)練語(yǔ)料做模型訓(xùn)練,來(lái)生成自己的自學(xué)習(xí)個(gè)性化模型和熱詞模型,可以有效提高專有領(lǐng)域場(chǎng)景下的語(yǔ)音識(shí)別準(zhǔn)確率,尤其是對(duì)專有名詞和文本中的高頻詞匯,有較好的優(yōu)化效果。
  熱詞:通過(guò)標(biāo)貝開放平臺(tái)-【熱詞】功能,將特有的人名、地名、公司名、領(lǐng)域?qū)S性~匯(醫(yī)療、建筑、金融、保險(xiǎn)等領(lǐng)域)上傳并保存發(fā)布,秒級(jí)生效。
  個(gè)性化模型:通過(guò)標(biāo)貝開放平臺(tái)-【個(gè)性化模型】功能,將專有領(lǐng)域或行業(yè)積累的具有特點(diǎn)的文本數(shù)據(jù)上傳并保存發(fā)布,約5~20分鐘后生效。
  02. 標(biāo)貝科技語(yǔ)音識(shí)別自學(xué)習(xí)工具有什么優(yōu)勢(shì)?
  便捷接入
  標(biāo)貝科技自學(xué)習(xí)工具控制臺(tái)可實(shí)現(xiàn)一鍵配置文本,通過(guò)識(shí)別接口上傳文本參數(shù)即可快速生成識(shí)別效果,無(wú)需更多投入。
  快速生效
  通過(guò)標(biāo)貝科技自學(xué)習(xí)工具,只需要上傳專有領(lǐng)域的文本信息,熱詞保存秒級(jí)生效,開箱即用,個(gè)性化模型最快5分鐘即可訓(xùn)練完成,快速響應(yīng)用戶業(yè)務(wù)。
  全領(lǐng)域覆蓋
  標(biāo)貝科技自學(xué)習(xí)工具面向全領(lǐng)域的自學(xué)習(xí)訓(xùn)練優(yōu)化,滲透各垂直行業(yè)的業(yè)務(wù)信息即添加即影響,真正打造行業(yè)內(nèi)可快速落地的語(yǔ)音識(shí)別技術(shù)。
  03. 怎么使用標(biāo)貝科技語(yǔ)音識(shí)別自學(xué)習(xí)工具?
  (1)前往標(biāo)貝開放平臺(tái)創(chuàng)建應(yīng)用,并進(jìn)入語(yǔ)音識(shí)別服務(wù)-自學(xué)習(xí)工具;
 。2)進(jìn)入自學(xué)習(xí)工具-熱詞頁(yè)面,將專有領(lǐng)域和行業(yè)積累的文本數(shù)據(jù)整理保存為UTF-8編碼的 txt 文件,點(diǎn)擊“新增熱詞組”,進(jìn)行熱詞添加;
  (3)獲取熱詞組id,識(shí)別調(diào)用,測(cè)試效果。 隨著語(yǔ)音技術(shù)與智能手機(jī)、平板電腦等電子產(chǎn)品芯片集成的深入發(fā)展,中國(guó)智能語(yǔ)音市場(chǎng)規(guī)模將繼續(xù)保持穩(wěn)步擴(kuò)張態(tài)勢(shì)。
  語(yǔ)音識(shí)別作為人機(jī)交互的入口,應(yīng)用場(chǎng)景會(huì)更加廣泛。標(biāo)貝科技將持續(xù)加碼研發(fā)投入,推動(dòng)語(yǔ)音識(shí)別服務(wù)繼續(xù)優(yōu)化升級(jí),創(chuàng)造更加智能的語(yǔ)音交互體驗(yàn)。
  目前標(biāo)貝科技語(yǔ)音識(shí)別【自學(xué)習(xí)工具】已經(jīng)在官網(wǎng)和標(biāo)貝開放平臺(tái)上線,免費(fèi)對(duì)客戶開放。歡迎登錄標(biāo)貝開放平臺(tái)體驗(yàn)。
 。1)標(biāo)貝科技官網(wǎng):https://www.data-baker.com
 。2)標(biāo)貝開放平臺(tái):https://ai.data-baker.com/#/index?source=gzh001
 

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)