首頁 > 新聞 > 國內(nèi) >

捷通華聲靈云遠場語音識別 距離不再阻礙交流

2015-11-26 09:47:14   作者:   來源:CTI論壇   評論:0  點擊:


  靈云科技26日消息:捷通華聲靈云遠場語音識別技術(shù)全面升級,可獲取7到8米外的語音,語音識別率仍不低于90%,從根本上改變目前市場上因各式問題導(dǎo)致的僅能近距離交互的方式,為智能語音技術(shù)應(yīng)用于智能車載、智能家電、智能家居、機器人等靈云奠定堅實的基礎(chǔ),讓智能硬件不再為遠場語音識別的瓶頸而擔(dān)憂。據(jù)悉,靈云種子已采用靈云遠場語音識別技術(shù)。
\
  靈云種子自2014年發(fā)布以來,得到了智能硬件、車載、機器人等多個領(lǐng)域的一致好評,特別是在機器人領(lǐng)域,解決了之前存在的種種人機交互困難的問題,使設(shè)備脫離了手動控制,真正讓機器人實現(xiàn)了“能說會聽、能思考、會判斷”。
  靈云遠場語音識別  距離不再阻礙交流
  很長一段時間以來,科大訊飛、NUANCE等語音技術(shù)公司都在努力開拓智能硬件市場,但智能硬件產(chǎn)品在很多場景下因語音交互體驗不如人意而不能滿足市場的需求,究其原因主要是受限于背景噪音、其他聲音干擾、回聲、混響等多重復(fù)雜因素,進而導(dǎo)致的識別距離近、識別率低等明顯痛點,在這些問題沒有解決之前,智能硬件語音交互方面將一直是一個短板。鑒于此,靈云推出遠場語音識別技術(shù),將極大推進語音識別技術(shù)在真實生活場景中的應(yīng)用。
  遠場語音識別技術(shù)的核心有兩點,一是語音前端處理:利用麥克風(fēng)陣列、回聲消除等技術(shù)將目標(biāo)說話人的聲音增強,并抑制/消除周圍無用的聲音(噪聲+回聲);二是語音識別引擎針對麥克風(fēng)陣列處理后的數(shù)據(jù)進行專門優(yōu)化,以使遠場識別效果達到最優(yōu)。
  靈云遠場語音識別技術(shù),是基于多麥克風(fēng)陣列的語音硬件前端方案,并利用麥克風(fēng)陣列的空域濾波特性——在目標(biāo)說話人方向形成拾音波束,抑制波束之外的噪聲和反射聲,其降噪和去混響效果均為國內(nèi)領(lǐng)先水平,并可成功實現(xiàn)語音喚醒;聲源定位;遠場識別;回聲消除;語音打斷等5大功能。
  可以想象,基于靈云遠場語音識別的遠距離、高識別率支撐,現(xiàn)在用戶在以家庭為單位的活動范圍內(nèi),幾乎可以通過語音輕松操控家里的一切智能硬件設(shè)備,推而廣之,搭載遠場識別的智能硬件產(chǎn)品將無限擴大適用范圍和應(yīng)用場景。目前的方案主要根據(jù)算法不同,可分為適用于電視機、空調(diào)、機器人等的加性麥克風(fēng)陣列和適用于采訪話筒、錄音筆等的差分麥克風(fēng)陣列。
  靈云種子  智能終端交互一站式解決方案
  智能硬件熱炒兩三年,至今未見哪個企業(yè)已經(jīng)將成熟的一套方案或者說場景完整地展現(xiàn)出來并得到推廣?傮w上來說,目前很多企業(yè)設(shè)想的場景對于消費者的價值究竟是什么沒有考慮清楚;外部來說,智能家居還未深入老百姓,市場還未感知到,沒有爆款產(chǎn)品,產(chǎn)品形態(tài)整體傳統(tǒng);從內(nèi)部講,大大小小的企業(yè)都在喊著做平臺,資本市場也炒的很熱,但實際上參與其中的很多智能軟件公司并沒有一套整體的方案能拿的出手。
  如果整體目前玩不轉(zhuǎn),那么先從做單品或者微場景來吸引大眾眼球似乎是不錯的路子,這就是智能硬件目前呈現(xiàn)的結(jié)果。在智能家居的部分,基本上所有推出產(chǎn)品的企業(yè)都在強調(diào)可以聯(lián)WIFI,可以遠程操控,甚至可以在一臺冰箱上看視頻聽音樂,即所謂的娛樂化?蛇@些并不是真正的“智能”。目前,智能單品遇到的市場瓶頸,包括操控形式本末倒置、形式大于實際效果、存在安全性等問題。
  怎么定義智能,并真正實現(xiàn)智能,依然為產(chǎn)業(yè)界,也是媒體爭論的熱點。越來越多的人認為,能夠?qū)崿F(xiàn)手機app控制即為智能,但是手機控制卻也需要手動操作各類硬件,依然不夠智能。
  隨著人工智能技術(shù)的應(yīng)用越來越廣泛,手機app控制、語音控制等多重控制方式越來越多的應(yīng)用到了智能硬件上。靈云智能種子可實現(xiàn)通過語音識別、語音合成、自然語言理解等人工智能技術(shù),為用戶提供各種智能交互服務(wù),用戶只需要用說話的方式發(fā)布命令,就可以控制相應(yīng)的系統(tǒng)。
  例如,對著手機app說一聲“我五分鐘之后到家”,就會得到回復(fù)“好的,按照您的習(xí)慣,空調(diào)已經(jīng)調(diào)到26度,熱水器調(diào)到35度”;說一聲“幫我煮杯咖啡”,咖啡機就開始工作;說一聲“太熱了,溫度調(diào)低兩度”,空調(diào)就開始調(diào)溫窩在沙發(fā)上看著無聊的電視節(jié)目,說一聲“我想看上周的非誠勿擾”,對應(yīng)的電視臺就自動搜索出來了;說一聲“我要睡覺了”,空調(diào)就自動調(diào)到睡眠模式,門窗自動鎖閉。用戶可以通過語音來開啟燈光、調(diào)整燈光的亮度、啟動私人家庭影院、控制家用電器、等等,讓家庭自動化的功能往前邁向了一大步。
  但由于國內(nèi)諸多語音廠商能力參差不齊、語義理解能力高低有別,而且語音交互僅能辨別指令及交互,僅是智能家居的一部分,并不能為家居的安防、家庭成員的辨別提供能力,因此并不能為家居提供全方位的智能服務(wù)。而國內(nèi)技術(shù)廠商所推出的智能家居解決方案卻往往固步在“聲”的方向,無法覆蓋聲紋識別、人臉識別、指紋識別等生物識別能力等全套能力。
  2014年,為方便智能終端廠商與集成商、開發(fā)商更好地使用靈云平臺(www.hcicloud.com)全方位人工智能能力,捷通華聲特別推出了企業(yè)級開發(fā)者專用的智能終端交互方案:靈云種子。靈云種子強化了靈云全方位人工智能平臺各項人工智能技術(shù)的融合,包括靈云語音識別、語音合成、語義理解、聲紋識別、人臉識別、指紋識別等全方位人工智能交互能力,并提供簡單易用的開發(fā)接口,供智能家居、車載等各類智能終端進行集成調(diào)用,實現(xiàn)人與終端設(shè)備多種方式的自由溝通和控制。企業(yè)級開發(fā)商通過應(yīng)用靈云種子,可以輕松實現(xiàn)智能語音交互、智能語音導(dǎo)航、智能語音控制、聲紋解鎖、手寫輸入、智能圖像識別、安全身份認證等多種人機交互功能,滿足智能家居、智能車載、智能家電、機器人及可穿戴式設(shè)備等各個行業(yè)對人工智能技術(shù)應(yīng)用大量且多方位的需求。
  經(jīng)過與眾多智能終端廠商的合作,為不斷滿足合作的應(yīng)用需求,捷通華聲“靈云種子”已經(jīng)升級到2.0版,新版靈云種子新增云端和本地同時識別,并從結(jié)果中擇優(yōu)的功能,提高了語音識別的準(zhǔn)確率和識別速度,優(yōu)化了意圖理解的幾十個領(lǐng)域。目前,靈云種子可廣泛應(yīng)用在以下場景中:
  語音檢索:支持包括路況導(dǎo)航類、家居菜單智能導(dǎo)航類、周邊服務(wù)類、生活服務(wù)類、娛樂類等多種語音檢索服務(wù);
  消息提醒:人性化定制推送類別:來電提醒、短信提醒、應(yīng)用提醒,并可將設(shè)置在云端;
  通訊娛樂:支持短信發(fā)送,電話通訊,多媒體播放,手機操控;
  健康服務(wù):支持傳感器,提供傳感器數(shù)據(jù)分析,為用戶提供健康圖表,并結(jié)合云端服務(wù)提供定制健康指導(dǎo)等現(xiàn)有及正在研發(fā)的能力;
  云平臺:基于靈云平臺,提供多設(shè)備數(shù)據(jù)同步,私人信息云存儲,智能推薦;
  這些方案類似于一個開發(fā)模版,靈云(www.hcicloud.com)平臺將這些特定領(lǐng)域和場景的智能交互方案經(jīng)過設(shè)計和優(yōu)化后,打造出一體化的全智能人機交互解決方案——“靈云種子”。直接應(yīng)用“靈云種子”配置的技術(shù)服務(wù)和內(nèi)容服務(wù),即可滿足各種智能硬件的智能化需求。
  在機器人方面,靈云機器人已成功應(yīng)用靈云種子,全面整合捷通華聲靈云平臺多項人工智能技術(shù)能力,讓稍顯“笨拙”的物理機器人成為真正“能說會聽,能寫會看,能思考、會判斷”,有一定分析與辨別能力的聰明、生動的智能機器人,可廣泛為金融、電信、交通、教育、醫(yī)療等智能客戶服務(wù)領(lǐng)域,也可以為教育、娛樂、家居生活等行業(yè)提供智能問答、智能聊天、智能“保姆”等服務(wù)。同時,靈云機器人具備平滑的移植性,可移植到市面上各類智能機器人硬件設(shè)備中。
  據(jù)捷通華聲靈云產(chǎn)品研發(fā)部門人員介紹,靈云種子更主要的作用是在產(chǎn)業(yè)中起到示范與引導(dǎo)作用,期望伴隨靈云種子在各行各業(yè)智能硬件中的不斷“生根發(fā)芽”,中國智能硬件將進入一個全新的、真智能的時代!
  捷通華聲靈云種子扎根智能終端  攜手合作伙伴共贏
  靈云平臺(www.hcicloud.com)是捷通華聲于2011年推出的首個全方位人工智能開放平臺。為推動人工智能產(chǎn)業(yè)的廣泛應(yīng)用,靈云平臺自推出以來一直面向產(chǎn)業(yè)全面開放,包括個人開發(fā)者在內(nèi)的合作伙伴,都可以通過靈云平臺獲取智能語音、智能圖像、智能語義、生物特征等技術(shù)能力。
  在中國華南地區(qū),尤其廣州、深圳地區(qū)經(jīng)濟發(fā)達、創(chuàng)新力強,在智能家居、智能車載、智能家電、機器人、穿戴式設(shè)備研發(fā)與創(chuàng)新上擁有獨特優(yōu)勢。為了向華南地區(qū)廣大合作伙伴提供更加直接的支持與幫助,捷通華聲在2015年初成立了深圳捷通華聲公司,旨在依托靈云平臺,利用靈云平臺智能語音、智能圖像、語義理解等全方位人工智能技術(shù)能力和豐富完善的智能終端交互解決方案,與華南地區(qū)硬件廠商加強合作關(guān)系,發(fā)揮華南地區(qū)智能終端設(shè)備研發(fā)和生產(chǎn)的優(yōu)勢,期望伴隨靈云種子在各行各業(yè)智能硬件中的不斷“生根發(fā)芽”,以推動智能終端產(chǎn)業(yè)長足的進步,攜手智能硬件廠商互惠共贏,推動中國智能硬件進入一個全新的、真智能的時代!
  未來發(fā)展,伴隨人工智能產(chǎn)業(yè)在世界范圍內(nèi)的高速發(fā)展,捷通華聲與清華大學(xué)共同創(chuàng)建清華靈云人工智能研究中心、清華海峽研究院人工智能研究中心,捷通華聲將以清華大學(xué)人工智能研究力量為依托,更加專注人工智能技術(shù)研究與產(chǎn)業(yè)化的推廣與應(yīng)用,與合作伙伴精誠合作,共同創(chuàng)建良好的人工智能產(chǎn)業(yè)生態(tài),共同推動中國人工智能產(chǎn)業(yè)的發(fā)展進步,為中國人工智能產(chǎn)業(yè)的發(fā)展做出應(yīng)有的貢獻!
  靈云平臺更多信息請訪問:www.hcicloud.com
  靈云智能辦公平臺更多信息請訪問:aioffice.hcicloud.com
  了解靈云產(chǎn)品與捷通華聲,請致電問詢靈云客服機器人:010-82826886-8898
分享到: 收藏

專題