您當(dāng)前的位置是:  首頁 > 新聞 > 國內(nèi) >
 首頁 > 新聞 > 國內(nèi) >

捷通華聲靈云讓阿U機器人“能聽會說”

2016-04-11 15:55:22   作者:   來源:CTI論壇   評論:0  點擊cti:


  靈云科技4月11日消息:8日,捷通華聲受邀出席慈星股份和阿優(yōu)文化聯(lián)合舉辦的“智童道合”服務(wù)機器人發(fā)布會,公司總經(jīng)理武衛(wèi)東代表公司與慈星股份和阿優(yōu)文化合資創(chuàng)建的開心果機器人簽訂了戰(zhàn)略合作協(xié)議。
\
  此次發(fā)布的阿U兔智兒童機器人(以下簡稱兔智機器人),是一款能陪孩子學(xué)習(xí)和玩耍的家庭服務(wù)機器人。捷通華聲為該款兔智機器人提供了靈云環(huán)形麥克風(fēng)陣列和靈云智能語音技術(shù),讓兔智機器人不僅能準(zhǔn)確識別主人話語,還能說出可愛的童聲,讓孩子與兔智機器人的語音交互更加流暢、自然。
  語音交互作為該產(chǎn)品的一大亮點技術(shù),是孩子與兔智機器人溝通的主要方式。由于兔智機器人所在的家庭環(huán)境,經(jīng)常會有家用電器、室內(nèi)娛樂等環(huán)境噪音,孩子也可能離兔智機器人忽遠(yuǎn)忽近,所以對語音識別技術(shù)的抗噪能力和遠(yuǎn)場識別能力有較高要求。對此,捷通華聲為兔智機器人提供了靈云環(huán)形麥克風(fēng)陣列,能定向獲取孩子的聲音,并通過降噪、語音增強、回聲消除等系列技術(shù),準(zhǔn)確識別遠(yuǎn)處孩子的話語。同時,靈云語音合成技術(shù)的采用,讓兔智機器人不但能說出可愛的童聲,還能用童聲唱出清明透亮、悅耳動聽的歌聲,讓兔智機器人“能說會唱”,極大地提升了孩子與兔智機器人的互動體驗。
  靈云環(huán)形麥克風(fēng)陣列 讓機器人準(zhǔn)確識別主人話語
  為了讓兔智機器人準(zhǔn)確獲取來自家庭范圍內(nèi)各個方向的語音,捷通華聲專門推出了靈云環(huán)形麥克風(fēng)陣列。與車載麥克風(fēng)陣列不同,因為車載設(shè)備只需拾取設(shè)備對面180°范圍內(nèi)的乘車人話語,采用線性麥克風(fēng)陣列即可滿足需求,而家庭范圍較為開放,說話人會移動,聲源可能在各個方位,需要用環(huán)形麥克風(fēng)陣列來定位和獲取360°范圍內(nèi)的語音信息。
\
  靈云環(huán)形麥克風(fēng)陣列能根據(jù)聲音到達(dá)的時間差,準(zhǔn)確計算出聲源與陣列模塊之間的角度和距離,實現(xiàn)對目標(biāo)聲源的定位,并利用麥克風(fēng)陣列的空域濾波特性,在目標(biāo)說話人方向形成拾音波束,僅拾取波束的信號,抑制波束之外的噪聲和混響(反射聲)。
  由于聲音能量會隨著傳播距離的變遠(yuǎn)而衰減,陣列模塊通過將多個麥克風(fēng)拾取的聲音信號進行有機疊加,增強整體拾取的語音波束能量。同時,利用回聲消除技術(shù),過濾掉機器自身音頻設(shè)備發(fā)出的聲音,為語音識別引擎輸入更為清晰、純凈的聲音。
  由于在麥克風(fēng)陣列模塊的拾音過程中,會不可避免的拾取部分環(huán)境噪音,對此,捷通華聲針對環(huán)境噪音進行建模,并用大量真實噪音數(shù)據(jù)進行訓(xùn)練,優(yōu)化語音識別算法,推出了具備極強抗噪能力的靈云語音識別技術(shù),能輕松應(yīng)對常見環(huán)境噪音。同時,該技術(shù)采用的深度神經(jīng)網(wǎng)絡(luò)(DNN)算法,可在用戶使用過程中,用積累的語音數(shù)據(jù)訓(xùn)練、優(yōu)化算法,不斷提升的抗噪能力,讓機器人準(zhǔn)確識別主人話語。
  靈云語音合成 讓機器人“能說會唱”
  除了采用靈云環(huán)形麥克風(fēng)陣列和語音識別技術(shù),兔智機器人還采用了捷通華聲的靈云語音合成技術(shù),可以說出可愛稚嫩、流暢自然的話語,讓人感覺是在和一個六七歲的小孩說話。捷通華聲作為國內(nèi)最早從事語音合成技術(shù)研究與應(yīng)用的企業(yè),早在2001年就推出了代表行業(yè)頂尖水平的靈云語音合成技術(shù),經(jīng)過十多年的技術(shù)積累,以及在成千上萬家企業(yè)的應(yīng)用實踐和磨合,捷通華聲不斷優(yōu)化文本分析模型、完善韻律規(guī)劃,讓靈云語音合成技術(shù)的合成效果真實飽滿、抑揚頓挫,MOS值已高達(dá)4.6,可懂度、自然度、流暢度達(dá)到行業(yè)頂尖水平。
  靈云語音合成技術(shù)已全面支持中文普通話、英語、粵語、維吾爾語、日、韓、俄、德、法等21種語言,覆蓋了全球90%以上的國家和地區(qū),中英混讀、粵英混讀自然流暢,全面適應(yīng)目前的多語種語音合成要求,讓機器人“說”出流暢、自然的話語。
  近期,捷通華聲依靠在語音合成領(lǐng)域數(shù)十年的深厚積累,推出了靈云歌唱合成技術(shù)。該技術(shù)可根據(jù)歌譜信息,讓機器人唱出甜美可愛、清明透亮、悅耳動聽,如真人般歌唱的歌聲,成功實現(xiàn)機器從“開口說話”到“放聲歌唱”的跨越式進步,讓機器人“能說會唱”。讓機器人學(xué)會唱歌,不僅提升了機器人服務(wù)的趣味性,更意味著機器人在擬人度和服務(wù)體驗方面跨出了一大步。
  靈云平臺面向機器人產(chǎn)業(yè)全面開放
  捷通華聲作為中國人工智能產(chǎn)業(yè)的領(lǐng)軍企業(yè),在2011年推出了國內(nèi)外第一個全方位人工智能開放平臺-靈云(www.hcicloud.com)。靈云平臺面向產(chǎn)業(yè)全面開放,并以“云 + 端”方式,為產(chǎn)業(yè)界提供語音合成、語音識別、OCR、手寫識別、人臉識別、聲紋識別、指紋識別、語義理解、機器翻譯等全方位人工智能能力。
  捷通華聲自2015年初就宣布靈云平臺對中國機器人產(chǎn)業(yè)全面開放,并相繼為開心果、中智物聯(lián)、新松、兆緯、科沃斯、阿凡達(dá)、奇諾軟通、NAO等數(shù)百家國內(nèi)外機器人廠商提供了全方位靈云人工智能能力服務(wù),傾全力支持中國機器人產(chǎn)業(yè)打造真正的“能聽會說、能寫會看、能思考、會判斷”的機器人。大量使用了靈云能力的機器人,有的已實現(xiàn)批量上市,更多的在金融、電信、能源政府、商業(yè)機構(gòu)營業(yè)廳、商場等場所展開大規(guī)模測試,得到了產(chǎn)業(yè)界與廣大用戶的廣泛關(guān)注與贊譽。
\
  近年來,伴隨人工智能產(chǎn)業(yè)的爆發(fā)性增長,捷通華聲憑借人工智能技術(shù)深厚功底與對機器人產(chǎn)業(yè)發(fā)展的準(zhǔn)確預(yù)見,憑借合作共贏的理念,不與機器人廠商爭利,更不會與機器人廠商爭市場的合作意識,贏得了國內(nèi)機器人廠商的廣泛支持,目前已與絕大多數(shù)國內(nèi)主要機器人廠商建立了穩(wěn)固的合作伙伴關(guān)系,靈云人工智能已在中國機器人產(chǎn)業(yè)已獨樹一幟,幾乎無處不在!
  未來發(fā)展,捷通華聲將繼續(xù)以清華大學(xué)人工智能研究力量為依托,全面響應(yīng)并支持國家創(chuàng)新發(fā)展戰(zhàn)略,全面促進靈云平臺與中國機器人產(chǎn)業(yè)界的全面對接,與中國所有機器人廠商一起精誠合作,共同打造屬于中國機器人產(chǎn)業(yè)的輝煌。
  靈云平臺更多信息請訪問:www.hcicloud.com
  了解靈云產(chǎn)品與捷通華聲,請致電問詢靈云客服機器人:010-82826886-8898
 

專題