捷通華聲

捷通華聲靈云打造自然輕松的語音交互

2012-12-18 13:58:41   作者:   來源:CTI論壇   評論:0 點擊:


  CTI論壇(ctiforum)12月18日消息(記者 凡易):不久前,北京捷通華聲語音技術(shù)有限公司在京召開的“靈云”發(fā)布會引起了產(chǎn)業(yè)界的廣泛關(guān)注,就智能人機交互(HCI)技術(shù)的發(fā)展和產(chǎn)品的落地應(yīng)用展開了廣泛探討。作為智能人機交互(HCI)產(chǎn)業(yè)中重要的組成部分之一,并作為未來十年最重要的技術(shù)之一,語音交互技術(shù)得到了各界朋友的特別青睞。
 
  回眸語音技術(shù)的發(fā)展,除語音合成(TTS)技術(shù)應(yīng)用較早外,更多的語音技術(shù)并沒有得到廣泛的應(yīng)用,即使到今日,通過語音技術(shù)實現(xiàn)的場景應(yīng)用并不是很多。其實,語音技術(shù)一直在發(fā)展,以語音識別(ASR)技術(shù)舉例,從1952年貝爾研究所成功研究了世界上第一個能識別10個英文數(shù)字發(fā)音的實驗系統(tǒng)以來,到如今中文語音識別技術(shù)已實現(xiàn)了自由說輸入,語音識別技術(shù)從算法到模型都有了強勁的蛻變和發(fā)展。
 
  捷通華聲公司從創(chuàng)立到如今,核心技術(shù)的研究也無時無刻的在創(chuàng)新發(fā)展。作為從事十余年的專業(yè)語音技術(shù)民營企業(yè),捷通華聲憑借在語音合成(TTS)技術(shù)上的自主創(chuàng)新和精湛技術(shù),與國家扶持的科大訊飛公司幾乎平分了中國語音合成市場。時至今日,全國超過八成的銀行排隊叫號服務(wù)和全部高鐵站臺語音播報系統(tǒng)仍使用捷通華聲自主研發(fā)的語音合成TTS技術(shù)。在語音識別ASR技術(shù)上,捷通華聲公司也專注研發(fā),從無到有,從識別率一般到真實環(huán)境下普通話自由說語音識別準(zhǔn)確率超過90%,達到國內(nèi)一流的技術(shù)水平,實現(xiàn)了質(zhì)的飛躍。近年,捷通華聲順應(yīng)發(fā)展,推出了全球第一款人機交互(HCI)感知云:靈云!基于云技術(shù)的優(yōu)勢和特點,靈云的語音技術(shù)達到更好的實際效果,得到更廣泛的應(yīng)用。
 
  從中文語音技術(shù)的發(fā)展現(xiàn)狀看,復(fù)雜的環(huán)境和中國語言文化的博大精深影響著中文語音識別效果。僅從實際效果看,語音識別正確率能超過80%就已經(jīng)是很不錯了。靈云平臺的誕生,將捷通華聲語音識別技術(shù)與云計算有機結(jié)合起來,再整合捷通華聲自身及合作伙伴的數(shù)據(jù)資源,讓語音識別技術(shù)形成了可落地的實際應(yīng)用。如國內(nèi)首款“能說會聽、能寫會識”的智能手機助手小唐龍就應(yīng)用了靈云的各項智能交互技術(shù)和百度、電信、移動等數(shù)據(jù)資源,尤其語音技術(shù)讓其在功能上實現(xiàn)了人與機器間的語音交互過程。
 
  同樣,作為智能人機交互(HCI)技術(shù)中重要的自然語言理解(NLU)也是靈云語音云中重要的一環(huán)。自然語言理解能力是實現(xiàn)語音識別和語音合成效果的保證,是實現(xiàn)人與機器的交互像人與人之間溝通的保障之一。靈云作為HCI技術(shù)交互平臺,在自然語言處理、分析、理解上下足了功課,在能源、金融、電信、服務(wù)等多個領(lǐng)域做出了應(yīng)用。
 
  語音技術(shù)作為智能人機交互(HCI)技術(shù)的一種,與靈云的其他各項HCI能力進行了整合。如語音技術(shù)應(yīng)用到靈云智能客服機器人中,實現(xiàn)了以自然語言理解和多種智能人機交互技術(shù)為核心,通過網(wǎng)頁、即時通訊等多種展現(xiàn)形式,實時與用戶進行交互的智能系統(tǒng)。靈云文檔OCR識別技術(shù),更是增加了NLU模型,提升OCR中文識別校對能力,識別正確率幾近100%。
 
  在發(fā)展語音技術(shù)的同時,捷通華聲更看重與云平臺企業(yè)的合作,靈云與中國電信開放平臺的深入合作、與中國惠普云基地的協(xié)作共贏,通過合作的模式讓靈云的語音技術(shù)得到更多的汲養(yǎng),無論是云計算模式還是開發(fā)者對語音技術(shù)的開發(fā)應(yīng)用,都為靈云語音技術(shù)開拓了無限視野。
 
  智能人機交互(HCI)技術(shù)的發(fā)展仍有很多關(guān)鍵技術(shù)亟待突破,靈云HCI平臺還有更多合作需要展開。靈云中的語音技術(shù)作為人機交互的核心之一,在復(fù)雜環(huán)境的語音識別和語義理解等能力上還需進一步探索完善。只有我們的核心技術(shù)不斷提高,才能讓人機交互更智能、更自然!更多信息請訪問靈云網(wǎng)站(hcicloud.com)
分享到: 收藏