也談?wù)Z音識別技術(shù)在玩具領(lǐng)域的低成本應(yīng)用

趙大有 2003/01/06

  據(jù)香港玩具廠商會最近完成的一項有關(guān)香港玩具業(yè)前景的調(diào)查報告分析,大部分玩具商認為電子和創(chuàng)新科技玩具將是未來三年的主流訂購貨品。為此,經(jīng)香港立法局討論通過,香港政府不久將成立"香港玩具創(chuàng)新設(shè)計中心",以幫助和推動玩具業(yè)的創(chuàng)新、高科技應(yīng)用和設(shè)計師的水平。

  所謂的高科技對一般人而言,是那么的神秘莫測。有人說成本是產(chǎn)品銷售的關(guān)鍵,在玩具上應(yīng)用高科技是否符合玩具生產(chǎn)的低成本要求呢?在此,我要告訴大家的是,首先科技是為生產(chǎn)服務(wù)的,只有真正能推動生產(chǎn)力發(fā)展的科學(xué)技術(shù),才會有生命力;再者,基于半導(dǎo)體技術(shù)的不斷發(fā)展,高科技不僅能應(yīng)用到玩具生產(chǎn)上,而且有許多暢銷正是因為它們集成了多種高科技,才會變得更智能、更有趣,從而成為包括兒童和成人在內(nèi)的各種人群的寵愛。

  玩具產(chǎn)品中的科技運用,離不開聲、光、電三方面,語音(包括發(fā)聲、說話、唱歌)、接觸感覺、互動感應(yīng)(包括觸摸感應(yīng)、光感應(yīng)、熱感應(yīng)、語音感應(yīng))、動作控制(包括內(nèi)部程序控制和外部線控、紅外、射頻、聲控、語音控制)等。從技術(shù)看,低級到高級,簡單到復(fù)雜都存在,從語音IC、智能IC、中央處理器,應(yīng)用呈現(xiàn)出不同的臺階,既不會高不可攀也不存在高門檻,多層次的分布也為企業(yè)在產(chǎn)品中的運用提供了很大的空間。

  在國外,特別是在日本,玩具設(shè)計師往往會把科學(xué)家在智能機器人研究方面發(fā)明、創(chuàng)造的高新技術(shù),從中選取一種應(yīng)用到智能玩具的設(shè)計開發(fā),或用來對傳統(tǒng)玩具進行創(chuàng)新改造上。這些技術(shù)包括機械機構(gòu)優(yōu)化設(shè)計、語音識別技術(shù)、圖像識別技術(shù)、路徑規(guī)劃、自主避障、電池電量檢測、微電腦技術(shù)、物體跟蹤技術(shù)、軌跡跟蹤技術(shù)等等,以后我會為大家一一進行詳盡的介紹;在此我挑選一種使用成本低、功能實用性強、易操作的技術(shù)推薦給大家——語音識別、語音合成技術(shù)。為什么呢?

  例如,當我們看到一名兒童與另一個天真爛漫的娃娃在進行著有趣的對話,那娃娃一會兒娓娓而談,一會兒又唱又笑,她們之間的親密程度已使人沒有注意到其中有一個是玩具娃娃,這就是在傳統(tǒng)的公仔玩具里植入了一顆語音識別芯片后,獲得了生命力的高智能仿生娃娃。而當我們看到一個活潑可愛的寵物跟著它的主人撒歡,并隨著主人的指令作者各種不同的動作,甚至還開口說話、唱歌了,你們不要奇怪,這就是利用語音識別技術(shù)設(shè)計出來的智能寵物玩具。這些有"靈感"能"思維",有聽覺,能講話的玩具的出現(xiàn)將打破自公仔玩具問世以來的長期聾啞感,并將給人們帶來更多的能與之進行交流,甚至幫助孩子們學(xué)習(xí)成長的智能玩具。要達到上述這些類似人類特征的要求,唯一的條件是要使得娃娃聽懂人們的問話,并經(jīng)過"思考",能善解人意地答復(fù)問題。

  充分利用語音識別技術(shù),就能做到上述要求。在20世紀六七十年代以來,語音識別的研究人員一直致力于語音識別專用芯片的研究,但是,大多數(shù)的語音識別專用芯片識別性能差,不具備實用的要求。直到近十年以來,隨著語音識別算法的深入研究和集成電路技術(shù)的發(fā)展,才出現(xiàn)了一些具有實用價值和市場前景的語音識別專用芯片。其中,較為成功的芯片是由美國Sensory Integrated Circuit公司開發(fā)的RSC系列語音識別芯片,是一顆為消費類電子產(chǎn)品應(yīng)用的低價位的語音識別專用芯片。

  依據(jù)專家的說法,語音識別技術(shù)現(xiàn)在正處于高速增長的狀況,因為硅片價格和寄存器成本不斷下滑,算法更復(fù)雜、完善,半導(dǎo)體技術(shù)也好過以前很多,應(yīng)用前景非常廣闊。

  確實,有好幾家玩具公司正在使用SENSORY語音識別系列芯片并取得了輝煌的成績,美國MGA公司的語音控制智能機器人玩具Commandobot,美國TIGER公司的機器寵物小鳥Chirpy-chi,日本SONY公司的智能機器狗Aibo等世界知名的流行玩具,無不是采用了美國Sensory公司的語音識別技術(shù)。

  Sensory的推廣機構(gòu)遍布全球,歐洲、美洲、在亞洲還有它專門的技術(shù)開發(fā)合作伙伴,深圳市捷通語音技術(shù)開發(fā)有限公司(WWW.SZJTVOICE.COM)負責(zé)中國玩具廠商的開發(fā)設(shè)計需要。

  同時,國內(nèi)一些專家學(xué)者、科研機構(gòu)、技術(shù)公司一直在研究開發(fā)中國人自己的語音識別技術(shù)。清華大學(xué)與華錄集團合作,成功地研究開發(fā)了國內(nèi)的第一個具有自主知識產(chǎn)權(quán)的語音識別專用芯片。該芯片以8位MCU為核心,采用嵌入式芯片設(shè)計方法。芯片中包括了8位MCU核、低通濾波器、A/D、D/A、預(yù)放、功放、RAM、ROM、PWM等模塊,并載入了語音識別、語音壓縮編碼、語音合成算法,構(gòu)成一個完整的高集成度語音識別片上系統(tǒng)。該芯片能夠識別約20~30條特定人語音命令,同時具有語音合成(提示)與語音編解碼(回放)功能。語音識別率達到98%以上,性能達到國際先進水平。由于華錄是優(yōu)先考慮了語音識別技術(shù)在玩具業(yè)的應(yīng)用,與國際上同類芯片相比,華錄的語音識別芯片在基于漢語的SI(不依靠說話者語音)技術(shù)的應(yīng)用方面有明顯的優(yōu)勢,同時它還增加了其他同類芯片沒有的自帶LCD驅(qū)動功能,更吸引人的是它比其他的芯片的功耗低一至二倍。


語音識別芯片的基本結(jié)構(gòu)框圖

  目前他們正在研發(fā)新一代基于16位定點DSP的語音識別專用芯片,其性能將更加強大。該芯片將能夠識別特定人、非特定人語音命令和漢語數(shù)碼,識別的語音命令可以達到200條以上。此外,系統(tǒng)中還包括:高質(zhì)量低速率語音編解碼、

  語音合成、說話人識別、回聲抵消、噪聲相消等其他功能。其中,非特定人漢語數(shù)碼語音識別率達到98%以上,人名呼叫撥號識別率達到99.5%,達到國際先進水平。該芯片可以用于汽車電子系統(tǒng),實現(xiàn)語音控制和語音撥號,語音PDA,高檔語音智能玩具,語音監(jiān)錄器,智能語音遙控器,高檔電話伴侶等。

  華錄潤聲公司負責(zé)人說,隨著研究的進一步深入和半導(dǎo)體工藝的完善,相信我們自己的語音識別芯片,無論在性能和價格上,都將大大優(yōu)于國外的同類芯片,真正為中國玩具也實現(xiàn)高科技的低成本應(yīng)用提供物質(zhì)保證,從而帶動國內(nèi)傳統(tǒng)玩具實現(xiàn)低成本改造,提高國產(chǎn)玩具的檔次和國際競爭力。

深圳捷通公司供稿 CTI論壇編輯



相關(guān)鏈接:
捷通82語音識別模塊產(chǎn)品說明書 2003-06-09
語音合成芯片情況介紹和產(chǎn)品設(shè)想 2003-05-06
數(shù)字可視復(fù)讀機方案 2003-04-09
語音識別控制電話機方案 2003-04-04
智能早教機方案 2003-04-03

分類信息:     文摘   技術(shù)_語音識別_文摘