首頁 > 新聞 > 國內(nèi) >

捷通華聲“云+端”O(jiān)CR 再掀智能圖像熱潮

2014-06-09 14:49:04   作者:   來源:CTI論壇   評論:0  點擊:


  CTI論壇(ctiforum)6月9日消息(記者 于鑫):2013年炒得最熱的不是房地產(chǎn),而是智能人機(jī)交互技術(shù)(HCI)在IT圈的極速擴(kuò)張。國內(nèi)的互聯(lián)網(wǎng)大佬代表BAT在搜索、電商、移動等各個領(lǐng)域搶灘攻地,在智能人機(jī)交互(HCI)領(lǐng)域炒得更是火爆,從百度首先戰(zhàn)略投資國內(nèi)第一大智能語音技術(shù)開發(fā)商捷通華聲開始,就已打開了智能語音五彩的市場;然而隨著2013年沸沸騰騰的語音熱潮逐漸退去,2014年圖像識別熱潮又開始幕天席地而來,其中以O(shè)CR技術(shù)尤為矚目。

  OCR(光學(xué)字符識別)技術(shù)隸屬圖像識別技術(shù)的一支,也是HCI技術(shù)領(lǐng)域最早實現(xiàn)商業(yè)化的技術(shù),早期多用于辦公文檔錄入與金融、保險等大型企業(yè)的票證識別系統(tǒng),然而近年來隨著智能移動端的迅速發(fā)展,OCR技術(shù)已在潛移默化中從To B端延伸至To C端,被廣泛地應(yīng)用于各個領(lǐng)域、各項軟硬件中。

  放眼國外,近日來有iphone6 ios 8系統(tǒng)透露的用戶信用卡掃描功能以及微軟SkyDrive欲推出的OCR搜索的消息。

  而國內(nèi)BAT三巨頭也馬不停地相繼推出OCR相關(guān)服務(wù)和產(chǎn)品,例如百度的涂書筆記、騰訊微信智能開放平臺開放圖像識別端口、阿里提出的深化手機(jī)應(yīng)用概念。

  這是否預(yù)示著2014年將是OCR技術(shù)重新迸發(fā)活力的一年?

  語音熱潮漸消,OCR后浪迭起

  眾所周知,2013年是APP全面攻陷國民智能移動端的一年,其中尤以智能語音交互技術(shù)炒得轟轟烈烈,在蘋果siri引爆語音識別后,國內(nèi)在這一領(lǐng)域的技術(shù)先驅(qū)企業(yè)捷通華聲、訊飛等更是奮力直追,打造出更符合漢語言習(xí)慣的智能語音交互技術(shù);而在語音合成(TTS)技術(shù)方面,一直作為國內(nèi)TTS技術(shù)領(lǐng)導(dǎo)者的捷通華聲更是在2013年因其靈云平臺(hcicloud.com)推出十幾種國際語言合成技術(shù),滿足全球90%地區(qū)的語音合成服務(wù)而獨領(lǐng)風(fēng)騷。

  然而信息技術(shù)瞬息萬變,在智能語音剛被推上一個新的關(guān)注和應(yīng)用高度的時候,OCR等智能圖像技術(shù)又順勢創(chuàng)新應(yīng)用于各領(lǐng)域,引起業(yè)內(nèi)的廣泛關(guān)注。

  在國內(nèi),OCR技術(shù)商品化最早成熟于上世紀(jì)90年代,對于行業(yè)內(nèi)人士和金融通信類企業(yè)來講并不陌生,那時多應(yīng)用于文本自動錄入與證件和表格掃描,以便減少人工錄入成本。

  然而,現(xiàn)今隨著云計算、大數(shù)據(jù)時代的到來,各行業(yè)各領(lǐng)域的單位和開發(fā)者對OCR技術(shù)的需求也越來越多樣化,大至銀行海關(guān)證照,小到淘寶店主收支票據(jù),而智能移動端的迅速發(fā)展正給OCR便捷化、普遍化提供了可能和新的發(fā)展機(jī)遇。

  OCR再次以其獨特的錄入方式而成為互聯(lián)網(wǎng)新的入口,引發(fā)了產(chǎn)業(yè)界與各大IT大佬的 廣泛關(guān)注,不斷的產(chǎn)品與技術(shù)創(chuàng)新比拼,使OCR技術(shù)在2014年重又走上了IT舞臺的中心,在HCI技術(shù)領(lǐng)域,繼智能語音之后,一場智能圖像領(lǐng)導(dǎo)者的爭斗戰(zhàn)再次打響。

  捷通華聲“云+端”OCR,滿足用戶多樣化需求

  捷通華聲OCR首席技術(shù)官李健表示:“在國內(nèi),OCR技術(shù)已發(fā)展了數(shù)十年,而我們對該項技術(shù)的研究也已積累了數(shù)十年的調(diào)研數(shù)據(jù)和實踐經(jīng)驗,無論是識別率、識別速度、用戶界面的友好性,還是產(chǎn)品的穩(wěn)定性、易用性及可行性等,都足以與國內(nèi)外IT巨頭抗衡。

  自2011年,捷通華聲推出國內(nèi)外第一個全方位HCI技術(shù)云服務(wù)平臺靈云后,靈云OCR系統(tǒng)發(fā)揮靈云“云+端”的優(yōu)勢,可滿足用戶多樣化定制需求,為OCR技術(shù)的應(yīng)用提供了比以往任何時候都寬廣的發(fā)展空間。傳統(tǒng)的OCR軟件只是通過單一的終端設(shè)備,無法聯(lián)網(wǎng),應(yīng)用、操作較單一;而靈云OCR系統(tǒng)則可通過靈云服務(wù)全方位拓展應(yīng)用領(lǐng)域。如:每年我國有眾多數(shù)字圖書館建設(shè)中的大量紙張數(shù)據(jù)信息,所有銀行、稅務(wù)局、保險公司的大量票據(jù),公安邊防海關(guān)等部門的各類證照卡數(shù)據(jù)信息等等,都需要輸入到電腦里并做分析存儲,幾乎可覆蓋到國家及各部委的所有重點行業(yè)領(lǐng)域。與此同時,新興的商業(yè)及個人應(yīng)用與服務(wù)市場更是一個巨大的市場空白,捷通華聲靈云OCR在這一即將成熟的領(lǐng)域已搶占先機(jī)。”

分享到: 收藏

專題