您當(dāng)前的位置是:  首頁 > 新聞 > 國內(nèi) >
 首頁 > 新聞 > 國內(nèi) >

捷通華聲與清華合力攻關(guān) 靈云OCR技術(shù)實(shí)現(xiàn)國際領(lǐng)先

2016-09-29 09:49:26   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  近期,捷通華聲與清華科研團(tuán)隊(duì)?wèi)?yīng)用最新機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)訓(xùn)練集群,實(shí)現(xiàn)靈云OCR技術(shù)重大突破。該技術(shù)顛覆了傳統(tǒng)方法,使文字識(shí)別正確率實(shí)現(xiàn)跨越式提升,全面超越國內(nèi)OCR廠商及代表國際最高水平的某俄羅斯公司,推動(dòng)國內(nèi)OCR技術(shù)達(dá)到國際領(lǐng)先水平。
\
  OCR即光學(xué)字符識(shí)別(Optical Character Recognition),是將印刷體字符識(shí)別為電子文本的一項(xiàng)技術(shù)。目前主流的OCR識(shí)別技術(shù),先要對(duì)圖像進(jìn)行清晰度判斷、版面分析、直方圖均衡、灰度化、二值化、傾斜校正、字符切割等預(yù)處理,得到端正、清晰的字符圖像;再用字符識(shí)別和語言模型,對(duì)文字進(jìn)行識(shí)別;最后通過后處理,輸出文本結(jié)果。
  由于這種方法過于依賴圖像處理算法以便在不同場景下對(duì)圖像進(jìn)行適應(yīng)性調(diào)整和處理,對(duì)紙張的擺放位置、拍照的光線環(huán)境、掃描儀的精度等有較高要求,很大程度上限制了文字識(shí)別正確率的提升。
  對(duì)此,清華實(shí)驗(yàn)室與捷通華聲科研團(tuán)隊(duì)基于最新的機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)訓(xùn)練集群,在充分研究拍照、掃描圖像的特性后,收集和整理了海量的圖像數(shù)據(jù),從文本的定位到識(shí)別,采用了一體化的End-to-end模型結(jié)構(gòu)和訓(xùn)練方法,推出了最新靈云文本引擎iRead 7.0 Text——新一代靈云OCR技術(shù)。
  該技術(shù)的推出,讓機(jī)器不再只能識(shí)別“清晰、端正的文字”,還能識(shí)別“傾斜、相對(duì)模糊的文字”,并且支持更多的字體。這不但省去了主流方法繁雜的預(yù)處理和后處理工作,將模型訓(xùn)練時(shí)間從以月為單位降低到幾天,更是將OCR技術(shù)的字正確率提高到99.9%,行正確率(一行字全部識(shí)別正確)從80%提高到98%,實(shí)現(xiàn)跨越式進(jìn)步。
  清華大學(xué)早在上世紀(jì)90年代就推出了代表行業(yè)最高水平的中文OCR技術(shù),是國內(nèi)最早從事中文OCR技術(shù)研究與應(yīng)用的高校。清華OCR技術(shù)已廣泛服務(wù)于各行業(yè)、各領(lǐng)域,為中文OCR技術(shù)的發(fā)展做出了重大貢獻(xiàn)。
  此次清華大學(xué)與捷通華聲科研團(tuán)隊(duì)的合作,再次展現(xiàn)了清華大學(xué)在OCR領(lǐng)域強(qiáng)大的科研實(shí)力,以及捷通華聲十多年在OCR市場應(yīng)用中的產(chǎn)業(yè)積累,是捷通華聲與清華大學(xué)“靈云科技 源自清華”戰(zhàn)略合作、“產(chǎn)學(xué)研”相結(jié)合的最新科研成果。
  靈云OCR  提供文檔、證照、票據(jù)、名片等全方位文字識(shí)別服務(wù)
  OCR作為最早實(shí)用化的人工智能技術(shù)之一,已在產(chǎn)業(yè)中得到廣泛應(yīng)用。捷通華聲靈云OCR技術(shù)經(jīng)過多年的市場應(yīng)用和技術(shù)積累,已推出文檔識(shí)別、證照識(shí)別、票據(jù)識(shí)別、名片識(shí)別等全方位文字識(shí)別產(chǎn)品與服務(wù),廣泛服務(wù)于各行業(yè):
  • 金融辦公:實(shí)現(xiàn)海量銀行業(yè)務(wù)憑單、統(tǒng)一對(duì)賬單、托管資料等表單的批量識(shí)別,助力金融企業(yè)建立電子資料檔案庫;
  • 物流貨運(yùn):物流貨運(yùn)單的批量識(shí)別,助力物流企業(yè)優(yōu)化貨運(yùn)流程和管理供應(yīng)鏈;
  • 海關(guān)邊檢&旅游:實(shí)現(xiàn)護(hù)照、港澳通行證、回鄉(xiāng)證、臺(tái)胞證、大陸證、戶口簿、居住證等證照的精準(zhǔn)快速識(shí)別,縮短旅客排隊(duì)時(shí)間。
  • 金融開戶:身份證、銀行卡、名片自動(dòng)識(shí)別,讓銀行、證券、保險(xiǎn)的線下開戶更快捷。
  • 移動(dòng)警務(wù):身份證、駕駛證、行駛證識(shí)別,讓交警能更高效地錄入司機(jī)信息。
  • 財(cái)務(wù)辦公:發(fā)票、文檔識(shí)別,打造OA辦公系統(tǒng)。
\
  相比傳統(tǒng)人工錄入,OCR技術(shù)不但為企業(yè)節(jié)省了大量人工成本,提高了信息錄入效率和準(zhǔn)確度,還能助力企業(yè)建立可以即時(shí)搜索、便于管理和調(diào)用的電子資料檔案庫,為企業(yè)的發(fā)展提供強(qiáng)有力的數(shù)據(jù)服務(wù)。
  新一代靈云OCR技術(shù)即將上線靈云平臺(tái)(www.AIcloud.com),面向廣大個(gè)人開發(fā)者和企業(yè)開發(fā)商全面開放。捷通華聲將繼續(xù)鞏固與清華大學(xué)“靈云科技 源自清華”的戰(zhàn)略合作,專注全方位人工智能技術(shù)研究與產(chǎn)業(yè)化應(yīng)用,為產(chǎn)業(yè)提供更為優(yōu)質(zhì)的技術(shù)與服務(wù)。
  靈云平臺(tái)更多信息:www.AIcloud.com
  體驗(yàn)靈云客服機(jī)器人:010-82826886-8898

專題