OCR/ICR 服务

概述

有时,客户需要处理的文档是打印体居多,或者表单本身就是为OCR/OMR设计的。那么,客户为了提高效率、降低处理时间和节省费用,同时,又需要高精度的数据采集。此时,客户就需要使用到以下技术:

光学字符识别(OCR):主要针对打印体效果最佳。
智能字符识别(ICR):主要针对手写体。
光学标记识别(OMR):主要针对单选、多选等选择性内容效果更佳。

OCR/OMR技术应用最佳效果

文档的打印效果是清晰的,在字母、句子、表格中的列、周围图形图像等之间保持一致的分离,而且相互之间最好有清晰的线条。这使得扫描仪和OCR软件能够容易地识别文档或图像中的文字。

OCR/ICR服务范围

全文OCR:
用于从文档中捕获所有文本、图形、图表、表格等,保存为PDF,Word、doc、txt、RTF等创建一个可以搜索和编辑的数字文件。对于“全文”OCR,很多时候软件无法创建原始文档的精确副本。广纳可以校对OCR结果进行人工处理,重新格式化文件,重新调整段落、页边距、字体、表格等。使得副本跟原始版本保持99.5%的复原。
结构化表单捕获(OCR/ICR):
从表单上的特定框或字段捕获数据。数据可以输出到数据库、电子表格或文本文件。
非结构化表单捕获(OCR/ICR):
OCR搜索与文档特定信息相关的字段。例如,从许多不同的发票格式中捕获“客户”字样的文本。ICR也提高了手写识别能力,ICR引擎可以用来“训练”学习阅读不同的手写体风格。
光学标记识别(OMR):
从调查问卷、答卷、登记卡等中获取特定标记(如单选框、复选框等)的结果。
条形码(Barcode)或二维码识别:
从表单或文档中提取二维码和条码内容信息。

OCR验证与修复

无论选择哪种技术,软件往往不能精确读取特定某些区域的文档或数据。这可能需要由人工校对验证的最关键的字段。广纳提供了专业OCR操作员和校对员以最大限度地提高生产率和质量。