• 咨询:0592-5588468
  • 产品试用
  • 前往新站
  • 首页
  • 产品中心
    • 身份证识别系统
    • 银行卡识别系统
    • 车牌识别系统
    • 驾驶证识别系统
    • 行驶证识别系统
    • 火车票识别系统
    • 社保卡识别系统
    • 人民币冠字号识别系统
  • 解决方案
    • 社保应用
    • 金融
    • 运营商
    • 药监行业
    • 网贷P2P
  • 第二事业部
    • 数字展厅设计
    • 数字会议中心
    • 网络安全产品
  • 合作伙伴
  • 公司
    • 关于我们
    • 新闻中心
新闻中心
您现在的位置:首页 > 新闻中心 > 公司新闻

OCR识别的真面目

作者:厦门市图睿信息科技有限公司 发布于:2014-10-20 15:05:32 点击量:

随便在百度百科或其他百科中很容易我们就可以找到关于OCR的定义了。所谓的OCR的是英文——Optical Character Recognition的缩写,中文翻译是光学字符识别,行业内又称为OCR识别、字符识别。

作为一名非专业的OCR使用者,这样的解释似乎很难让人理解。让我们来一层层的揭开OCR的神秘面纱。

通俗说来,OCR就是把通过拍照或扫描的方式取得的图片上的文字,通过图像处理、图像分析和图像理解的方式,翻译成可编辑的文本文字。

这实际上是一个逆过程。

很多人都习惯于使用纸质的文本文档。所以,才会把文本通过打印机等外部设备将我们的合同、稿件、书本等转化成物质材料。随着企业ERP进程的推进以及人们对于电子阅读习惯的养成。纸质文本的电子归档变得尤为重要。这也是OCR在近几年得到不断发展的重要原因。

回过头来继续在技术层面上谈谈我们的OCR识别,它是怎么构造起来的呢?

简单的说,是软件。软件就应该有软件的样子,图睿OCR识别软件标准把整体分成五个层:数据传输层、图像处理层、版面解析层、OCR识别层、栏目后处理层(非必需)。具体的,数据传输层主要是对图像的输入方式进行定义,允许以图像流、图像路径等多种方式进行数据传输,同时还设计了数据加密接口,保证在数据传输过程中,数据不会被破译。图像处理层的工作在于,把解密数据通过传统的图像处理技术如去噪、二值化等,把图像优化成为可供OCR识别的图像形式。

版面解析层其实是OCR识别不可分割的一部分,工作中,需要扫描识别一份文件的时候,常常需要的不仅仅是图像上的文字得到识别,更多的还需要对字符的字号、版面位置等信息进行识别。而版面解析层正是完成这样的操作。OCR识别层就是完成将图像文字转化成文本文字的功能。

对于栏目后处理层,对于例如证件识别(身份证识别、驾驶证识别以及行驶证识别等)、名片识别,就需要把对应的栏目放到指定的位置。同时,证件、名片等具备一定的特殊性,比如地址栏目可以通过上下文的联系进行一些修订,我们把这一功能称之为后处理,后处理对于提高整体识别率具有不可估量的作用。

转载请标明出处:www.xmturui.com/www.xmturui.cn,版权所有厦门市图睿信息科技有限公司



上一篇:用身份证识别(OCR)拯救你——手机实名制

下一篇:OCR身份证识别软件来了:手工录入过时了?

新闻中心     产品展示     第二事业部     解决方案     关于我们     合作伙伴      


Copyright © 2014 - 2016 厦门市图睿信息科技有限公司网站地图. All Rights Reserved 闽ICP备14008237号-2

在线客服

技术支持
点击这里给我发消息
产品咨询
点击这里给我发消息
销售1号
点击这里给我发消息