首頁 > 新聞 > 國內(nèi) >

捷通靈云實現(xiàn)遠場語音識別 服務智能家居

2015-10-13 10:07:18   作者:   來源:CTI論壇   評論:0  點擊:


  捷通華聲面向智能車載、智能家電、智能家居、機器人等領域?qū)iT開發(fā)的全方位解決方案——靈云種子近期將全面升級,靈云種子將采用靈云遠場語音識別技術能力,從根本上改變目前市場上因各式問題導致的僅能近距離交互的方式,為智能語音技術應用于智能車載、智能家電、智能家居、機器人等靈云奠定堅實的基礎。

  靈云種子自2015年初發(fā)布以來,得到了智能硬件、車載、機器人等多個領域的一致好評,特別是在機器人領域,解決了之前存在的種種人機交互困難的問題,使設備脫離了機械控制,真正讓機器人實現(xiàn)了“能說會聽、能思考、會判斷”。

  很長一段時間以來,科大訊飛、NUANCE等語音技術公司都在努力開拓智能硬件市場,但智能硬件產(chǎn)品在很多場景下因語音交互體驗不如人意而不能滿足市場的需求,究其原因主要是受限于背景噪音、其他聲音干擾、回聲、混響等多重復雜因素,進而導致的識別距離近、識別率低等明顯痛點,在這些問題沒有解決之前,智能硬件語音交互方面將一直是一個短板。鑒于此,靈云推出遠場語音識別技術,將極大推進語音識別技術在真實生活場景中的應用。

  遠場語音識別技術的核心有兩點,一是語音前端處理:利用麥克風陣列、回聲消除等技術將目標說話人的聲音增強,并抑制/消除周圍無用的聲音(噪聲+回聲);二是語音識別引擎針對麥克風陣列處理后的數(shù)據(jù)進行專門優(yōu)化,以使遠場識別效果達到最優(yōu)。

  靈云種子此次推出的遠場語音識別技術,集成了全新的麥克風陣列方案,并利用麥克風陣列的空域濾波特性——在目標說話人方向形成拾音波束,抑制波束之外的噪聲和反射聲,其降噪和去混響效果均為國內(nèi)領先水平。

  可以想象,基于靈云遠場語音識別的遠距離、高識別率支撐,現(xiàn)在用戶在以家庭為單位的活動范圍內(nèi),幾乎可以通過語音輕松操控家里的一切智能硬件設備,推而廣之,搭載遠場識別的智能硬件產(chǎn)品將無限擴大適用范圍和應用場景。目前的方案主要根據(jù)算法不同,可分為適用于電視機、空調(diào)、機器人等的加性麥克風陣列和適用于采訪話筒、錄音筆等的差分麥克風陣列。

  靈云種子  智能終端交互一站式解決方案

  2015年以來,國內(nèi)各種智能硬件產(chǎn)品在爭論中不斷涌現(xiàn),尤其是蘋果公司apple watch的發(fā)布,幾乎是給原本叫好不叫座的智能硬件市場打了一劑強心針,智能硬件廠商更是如雨后春筍般冒芽而出。盡管智能硬件以及機器人市場被炒得火熱,但怎么定義智能,并真正體現(xiàn)智能依然為產(chǎn)業(yè)界,也是媒體爭論的熱點,傳統(tǒng)人機交互方式帶來的局促感也越來越顯著,甚至成為其“叫好不叫座”的核心因素之一。過去,鮮有一套完整的方案能夠全面滿足各類智能硬件的智能交互需求。

  在此背景之下,捷通華聲依托靈云平臺(hcicloud.com),強化靈云全方位人工智能技術的融合,向企業(yè)級開發(fā)商特別推出了一整套智能終端交互組件—靈云種子,包括靈云語音識別、語音合成、語義理解、聲紋識別、人臉識別、指紋識別等多種人工智能交互能力,并提供簡單易用的開發(fā)接口,供各類智能終端進行集成調(diào)用,實現(xiàn)人與終端設備多種方式的自由溝通和控制。包括智能語音交互、智能語音導航、智能語音控制、聲紋解鎖、手寫輸入、智能圖像識別、安全身份認證等多種人機交互功能,滿足了包括機器人、智能車載、智能家電、智能家居及可穿戴式設備等各個行業(yè)的對人工智能技術的應用的大量且多方位的需求。

  目前,捷通華聲“靈云種子”已經(jīng)升級到3.0版,新版靈云種子新增云端和本地同時識別,并從結(jié)果中擇優(yōu)的功能,提高了語音識別的準確率和識別速度。優(yōu)化了意圖理解的32個領域。可廣泛應用在以下場景中:

  • 語音檢索:支持包括路況導航類、家居菜單智能導航類、周邊服務類、生活服務類、娛樂類等多種語音檢索服務;
  • 消息提醒:人性化定制推送類別:來電提醒、短信提醒、應用提醒,并可將設置在云端;
  • 通訊娛樂:支持短信發(fā)送,電話通訊,多媒體播放,手機操控;
  • 健康服務:支持傳感器,提供傳感器數(shù)據(jù)分析,為用戶提供健康圖表,并結(jié)合云端服務提供定制健康指導等現(xiàn)有及正在研發(fā)的能力;
  • 云平臺:基于靈云平臺,提供多設備數(shù)據(jù)同步,私人信息云存儲,智能推薦;
  • 智能支付:結(jié)合智能終端特點,提供更便捷、更多樣的智能支付方式。
  • 虛擬現(xiàn)實擴展:將AR技術與LBS技術整合,為用戶提供包括周邊景點商圈實景展示,路線提示,為O2O服務提供優(yōu)秀體驗;

  這些方案類似于一個開發(fā)模版,靈云(hcicloud.com)平臺將這些特定領域和場景的智能交互方案經(jīng)過設計和優(yōu)化后,打造出一體化的全智能人機交互解決方案——“靈云種子”。直接應用“靈云種子”配置的技術服務和內(nèi)容服務,即可滿足各種智能硬件的智能化需求。
 

分享到: 收藏

專題