什么是OCR?

OCR(Optical Character Recognition,光学字符识别),通过检测暗、亮的模式确定其形

状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的

方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换

成文本格式,供文字处理软件进一步编辑加工的技术。简单来说就是就是将图像信息转换为文

字信息输出展示。

如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。它需要进行大量的真实样本和模拟样本测试。

依托优秀的图像处理技术和海量优质数据进行模型识别训练。

1.二值化:摄像头采集的多数是彩色图,为了让计算机更快的,更好的识别文字,我们需要先对彩色图进行处理,可以简单的定义图片前景信息和背景信息。

2.干扰去除:对图像的干扰信息去除。

3.倾斜较正:由于图片拍摄的随意化和不规则,导致图像信息不可避免的产生倾斜。

4.版面分析:将所要识别的文档分段、分行处理。

5.字符切割:字符定位和字符切割,定位出字符串的边界。对分割出的字符识别。

6.字符识别:以特征提取为主,识别出字符。

7.版面恢复:将识别结果按照原来的版面排班。

8.后处理校正: 根据特定的语言上下文的关系,对识别结果进行较正的算法,就是后处理。

最终得出识别数据结果。

ocr识别的系统的简单工作流是把一个影像作为转换介质,通过文字特征提取,对比识别算法以及字词后处理、人工校对等手段校正识别模型得到文字结果集的一个过程。

图像文字识别广泛的应用于多场景、多语种。比如卡证识别身份证、驾驶证、行驶证、学生证、护照等多证件。




图像识别用GPU吗_数据