捷通華聲

靈云HCI核心技術介紹——光學字符識別(OCR)

2013-10-17 16:21:29   作者:   來源:CTI論壇   評論:0 點擊:


  OCR(光學字符識別),是通過圖像處理和模式識別技術對光學的字符進行識別的意思,是自動識別技術研究和應用領域中的一個重要方面,F(xiàn)在OCR主要是指文字識別軟件,它是一種能夠將文字自動識別并錄入的軟件技術。

  捷通華聲OCR核心引擎是針對特定語言的識別軟件模塊,該軟件模塊是整個軟件的核心模塊。核心模塊接收其他模塊的設置,并根據(jù)設置內容對文字圖片數(shù)據(jù)進行識別,并將識別結果列表返回給調用模塊。
靈云HCI核心技術介紹——光學字符識別(OCR)

  捷通華聲OCR圖像識別技術具有以下特點:
  • 支持多國文字識別:支持中文簡繁體、純英文識別,識別率達到99%以上。
  • 支持多種識別方式:支持掃描識別和拍照識別。
  • 支持多圖像格式:支持TIFF、BMP、PNG、GIF、JPEG格式圖像的讀取,支持黑白、灰度、彩色圖像的處理;
  • 支持自動版面分析:能自動分析出橫排文本、豎排文本、表格和圖像等區(qū)域,并對文本和表格區(qū)域的文字進行識別。針對特殊應用(例如名片識別)有專門優(yōu)化的版面分析算法;
  • 支持手動版本分析:支持對用戶指定區(qū)域的文字圖像進行識別;
  • 傾斜校正功能:可以對圖像由于掃描引起的傾斜進行自動校正;
  • 畸變校正功能:可以對由于非統(tǒng)一照度和近距拍攝造成的灰度畸變和幾何畸變進行自動校正;
  • 識別字體多樣:支持多語種、多字體、多字號識別;
  • 多種字符集輸出:支持GB2312、BIG5、GBK、Unicode、UTF-8等內碼的輸出;
  • 可獲取識別結果詳細信息:能夠獲取識別文字在原文中的信息,包含文字在圖像中的坐標、字體、字號、可信度和候選字!

相關閱讀:

分享到: 收藏