張連毅:合作共贏,靈云開發(fā)者社區(qū)筑夢HCI

2013-07-19 08:21:51   作者:王麗娜   來源:CTI論壇   評論:0  點擊:


  當盲人無法看到手機短信,卻可以聽取這些信息;當老年人看不清手機按鍵,卻可以通過說來對手機下達“命令”;當司機在駕駛過程中為保證安全,通過收聽語音播報獲得叫車信息……
 
  那么是什么,給我們的生活、工作帶來了這些實實在在的便捷?不得不說,它們是包括語音合成、語音識別、光學字符識別、手寫識別等技術在內的智能人機交互(HCI)技術。
 
  如果說智能人機交互技術是繼鍵盤、鼠標、觸控技術之后的人與計算機交互的一種全新的手段,你是否會有一些感動,為這種高新技術帶來的全新體驗而感動;蛟S,隨著技術的不斷成熟,不但人們使用計算機及移動智能終端的方式將得到全面顛覆,智能人機交互技術也將廣泛深入到各行各業(yè)中去。

 合作共贏,靈云開發(fā)者社區(qū)筑夢HCI

  近日,CTI論壇記者采訪到北京捷通華聲語音技術有限公司(以下簡稱“捷通華聲”)董事長張連毅先生。張連毅對于智能人機交互技術懷揣了多年的夢想、熱衷于技術的不斷完善與進步、一步一個腳印深耕于HCI這塊兒土地。就是他,用執(zhí)著兩個字將所有的堅持與熱情一帶而過,換來一個智能人機交互技術應用更加廣闊而開放的時代。
 
  智能人機交互技術錦上添花
 
  張連毅涉足智能人機交互技術可以追溯到90年代初,當時致力于推進中國漢字印刷體識別系統(tǒng)商品化進程;到90年代末,智能人機交互技術掀起了一股光學字符識別的熱潮,而捷通華聲也是在此時正式成立的;到現階段,各項智能人機交互技術成熟度都大幅提高,相互支撐,達到了一個融合狀態(tài)。“相對來講,可以說目前智能人機交互技術初步進入一個百花齊放、全面發(fā)展的階段”張連毅說。
 
  實際上,張連毅個人本身的工作經歷也見證了智能人機交互技術的起起伏伏。所以,他對智能人機交互技術也有著深刻的理解:“樂視智能電視增加了語音點播,汽車導航可以聽新聞、給某某打電話,完成這些功能的就是HCI技術,這就促進了產業(yè)升級。當我們認同產業(yè)的變革,智能人機交互技術起到的作用就是錦上添花。”
 
  “HCI技術使得人和機器的距離拉近了,但如果拋開這個表象之后,實際上我們并沒有改變什么。HCI技術是為內容服務的。”
 
  為了更好地為內容服務,一直以來,捷通華聲潛心研究智能人機交互技術,張連毅講到,“HCI技術具有旺盛的生命力,這種旺盛的生命力來自于需求、來自于技術的不完美。因為不完美,所以人們不斷提出新的要求,不斷去提升它的性能、指標, 從而成為可持續(xù)發(fā)展到動力。而捷通華聲務實、低調的氛圍,助力實現這種可持續(xù)性發(fā)展。”
 
  新技術將重構社會,HCI助力發(fā)展
 
  “一個全新時代的大幕才剛剛拉開,云、移動、大數據這些技術蓬勃發(fā)展,新的商業(yè)模式也初現曙光。當我們把所有用戶的行為和需求匯集到一塊去的時候,整個社會都將被技術的發(fā)展所重構。”張連毅引用百度大數據首席架構師林仕鼎的話來展開他的觀點與想法。
 
  在他看來,云計算勢如破竹撞擊著傳統(tǒng)產業(yè),移動互聯(lián)網改變著人們生活工作的方式,大數據讓整個世界變得更加有規(guī)律可循,而智能人機交互技術雖然沒那么轟轟烈烈,但它卻悄然地在人們的生活、工作中助力著這幾大板塊的應用。
 
  “當今HCI進入一個相對成熟的階段,大眾對它也日益了解,無論移動互聯(lián)網、大數據、云計算,其實和HCI都是息息相關的。”張連毅認為,這幾項新興技術與HCI技術之間具有相互作用的關系,他分析到:
 
  首先,移動互聯(lián)網及智能終端的普及,使得運用HCI技術的廣泛應用成為可能,并深入到每個人的生活當中;反過來,HCI技術同時也助力了移動互聯(lián)網的發(fā)展。
 
  其次,作為靈云云服務平臺,所研究的是怎么才能實現大家對HCI的應用,怎么才能實現靈云能力的共享。答案是通過云計算能力實現。云計算使得智能人機交互技術的服務能夠滿足everybody希望使用HCI技術的需求。
 
  再次,對于大數據,如果沒有大數據,語音識別技術不一定能夠得到突破。比如說,語音識別需要對語音語料進行訓練。過去可能是兩三百小時,現在輕則兩三千小時,重則上萬小時;過去的原始文本語料有幾個GB就很了不起,現在都可以以TB來計算了。無論是成千上萬的語音語料、還是基礎的的文本語料,都屬于大數據。由此可以看出,大數據助力智能人機交互技術性能的提升。

  云計算、大數據、移動互聯(lián)網,甚至是HCI技術,彼此相互交融,正是這種技術的發(fā)展,在悄然地改變著人們的生活。

  靈云開發(fā)者社區(qū)打造合作共贏局面
 
  順應時代的變化發(fā)展,為了將自身優(yōu)質的資源向合作伙伴全部敞開,打造一個合作共贏的局面,捷通華聲靈云平臺開發(fā)者社區(qū)面向開發(fā)者,全面開放語音識別、語音合成、手寫識別、OCR等HCI技術能力。
 
  “靈云開發(fā)者社區(qū)將改變原有商業(yè)合作模式,全面開放SDK,需要開發(fā)者做的只是簡單地注冊而已。”張連毅表示,全面開放靈云能力,目的是推廣HCI技術的應用,他這樣說:
 
  首先,對于開發(fā)商及企業(yè),希望通過使用靈云能力,能夠提高企業(yè)產品品質和技術創(chuàng)新能力,使產品的應用性更強、更有趣。例如,嘀嘀打車,使用的便是捷通華聲的語音合成技術。
 
  其次,對于個人開發(fā)者,捷通華聲希望激發(fā)民眾之中的創(chuàng)意,讓他們的創(chuàng)意能夠通過應用HCI技術得益于實現,從而服務于大眾、服務于社會。
 
  所以,對于靈云開發(fā)者社區(qū),對于不同的點有不同的期許,但核心本質是希望大家都能夠了解、掌握、應用HCI技術,使得靈云開發(fā)者社區(qū)更加大眾化,開啟一個HCI全面開放的時代。
 
  靈云開發(fā)者社區(qū)為打造一個合作共贏的局面,張連毅同時也強調:“也希望通過商業(yè)模式同從事同一領域的企業(yè)加強合作,把更多的HCI技術如人臉識別、指紋識別、聲紋識別、虹膜識別等生物特征識別技術納入到靈云平臺來。”
 
  為與合作伙伴建立合作共贏的關系,捷通華聲多年來都遵循著自己的原則,張連毅肯定地講到:“捷通華聲非常尊重合作伙伴,絕不和用我們技術的企業(yè)或行業(yè)搶生意,這是我們一直以來的信念。”
 
  “當然,捷通華聲也希望塑造自己的品牌,但這種塑造是按照尊重產業(yè)發(fā)展規(guī)律的方式、尊重合作的商業(yè)規(guī)則來實現的。捷通華聲希望加強一些宣傳方面的規(guī)范,如在合同中要求:需要在廠商產品或者界面上,顯示相關HCI技術由捷通華聲提供。”

  為深刻認識HCI技術的一些應用,捷通華聲首先運用靈云能力為自己開發(fā)了“捷通知道”這樣一個智能客服系統(tǒng)。智能客服的核心是自然語言處理技術。通過對一定數據的處理,把一些共性問題提取出來。隨著技術的發(fā)展,智能客服在呼叫中心的應用將會越來越廣,“將逐漸成為呼叫中心領域的一個‘配件’、一個功能模塊。”

  之所以要做“捷通知道”,張連毅說:“一個好的產品一定要具有一定的通用性。作為設計者、開發(fā)者,我們必須抓住靈云智能客服系統(tǒng)的本質,從而更好地為企業(yè)服務。而‘捷通知道’本身具有對捷通品牌宣傳的特點,起到提高企業(yè)形象、促進企業(yè)宣傳、提升企業(yè)規(guī)范化建設的作用。”

分享到: 收藏

專題