OCR识别的真面目-公司新闻-厦门市图睿信息科技有限公司

新闻中心

OCR识别的真面目

作者：厦门市图睿信息科技有限公司发布于：2014-10-20 15:05:32 点击量：

随便在百度百科或其他百科中很容易我们就可以找到关于OCR的定义了。所谓的OCR的是英文——Optical Character Recognition的缩写，中文翻译是光学字符识别，行业内又称为OCR识别、字符识别。

作为一名非专业的OCR使用者，这样的解释似乎很难让人理解。让我们来一层层的揭开OCR的神秘面纱。

通俗说来，OCR就是把通过拍照或扫描的方式取得的图片上的文字，通过图像处理、图像分析和图像理解的方式，翻译成可编辑的文本文字。

这实际上是一个逆过程。

很多人都习惯于使用纸质的文本文档。所以，才会把文本通过打印机等外部设备将我们的合同、稿件、书本等转化成物质材料。随着企业ERP进程的推进以及人们对于电子阅读习惯的养成。纸质文本的电子归档变得尤为重要。这也是OCR在近几年得到不断发展的重要原因。

回过头来继续在技术层面上谈谈我们的OCR识别，它是怎么构造起来的呢？

简单的说，是软件。软件就应该有软件的样子，图睿OCR识别软件标准把整体分成五个层：数据传输层、图像处理层、版面解析层、OCR识别层、栏目后处理层（非必需）。具体的，数据传输层主要是对图像的输入方式进行定义，允许以图像流、图像路径等多种方式进行数据传输，同时还设计了数据加密接口，保证在数据传输过程中，数据不会被破译。图像处理层的工作在于，把解密数据通过传统的图像处理技术如去噪、二值化等，把图像优化成为可供OCR识别的图像形式。

版面解析层其实是OCR识别不可分割的一部分，工作中，需要扫描识别一份文件的时候，常常需要的不仅仅是图像上的文字得到识别，更多的还需要对字符的字号、版面位置等信息进行识别。而版面解析层正是完成这样的操作。OCR识别层就是完成将图像文字转化成文本文字的功能。

对于栏目后处理层，对于例如证件识别（身份证识别、驾驶证识别以及行驶证识别等）、名片识别，就需要把对应的栏目放到指定的位置。同时，证件、名片等具备一定的特殊性，比如地址栏目可以通过上下文的联系进行一些修订，我们把这一功能称之为后处理，后处理对于提高整体识别率具有不可估量的作用。

上一篇：用身份证识别（OCR）拯救你——手机实名制

下一篇：OCR身份证识别软件来了：手工录入过时了？

在线客服

技术支持产品咨询销售1号

OCR识别的真面目

在线客服