首頁(yè) > 新聞 > IT與互聯(lián)網(wǎng) >

語(yǔ)音識(shí)別領(lǐng)域新突破:進(jìn)食中也可精準(zhǔn)識(shí)別

2015-04-02 14:46:19   作者:   來(lái)源:洋蔥新聞   評(píng)論:0  點(diǎn)擊:


  近年來(lái),語(yǔ)音識(shí)別技術(shù)已得到廣泛應(yīng)用,但其識(shí)別準(zhǔn)確性依舊有待提升。拋開(kāi)各種口音與方言干擾,考慮到用戶可能在各種極端情況下講話,如何辨認(rèn)非標(biāo)準(zhǔn)發(fā)音已成為業(yè)內(nèi)亟需解決的問(wèn)題。

  日前,科技公司Voxil公布了其最新研究成果——一款復(fù)雜的語(yǔ)音識(shí)別程序,Voxil 稱(chēng)其為「自然語(yǔ)言識(shí)別領(lǐng)域的重大突破」。

  Voxil CEO Caleb Roush 在接受洋蔥新聞采訪時(shí)稱(chēng),「我們最新的語(yǔ)音識(shí)別軟件專(zhuān)為吃貨用戶服務(wù),即使用戶正在咀嚼或口中塞滿食物,也能精確識(shí)別用戶所說(shuō)的內(nèi)容。毫無(wú)疑問(wèn),這款軟件將幫助 Siri 等語(yǔ)音助手極大提升用戶體驗(yàn)。」

  Roush 表示,軟件算法較為復(fù)雜,也正因?yàn)槿绱耍梢跃珳?zhǔn)過(guò)濾外界噪音,例如咀嚼聲、牙齒摩擦聲、松脆的食物在口中被壓碎的聲音、雙唇和舌頭運(yùn)動(dòng)的聲音等,并從中分辨出用戶含混不清的說(shuō)話聲,其識(shí)別準(zhǔn)確度可達(dá)到驚人的 99%。

  Voxil 公司甚至提出了一個(gè)名為 GAR 的新概念(譯者注:GPS-aided recognition,位置輔助識(shí)別),稱(chēng)為提升識(shí)別精度,軟件自帶 GPS 功能,可精準(zhǔn)定位用戶坐標(biāo)并判定其所在餐廳類(lèi)別,從而結(jié)合大數(shù)據(jù),根據(jù)可能提供的食物種類(lèi)對(duì)識(shí)別內(nèi)容做出相應(yīng)調(diào)整。

  洋蔥日?qǐng)?bào)記者對(duì)「真正的吃貨在享受美食時(shí)并不愿講話」 這一角度提出了疑問(wèn),但 Voxil 公司并未給出正面回答。Roush 僅表示公司已著手研究如何在用戶吃太多無(wú)法講話的情況下通過(guò)腦電感應(yīng)識(shí)別用戶意圖,并透露相關(guān)智能硬件將在不久后面向公眾發(fā)布。

分享到: 收藏

專(zhuān)題