商业医保发票字符识别系统的单字识别模块的设计与实现文献综述-综述网

文献综述（或调研报告）：

字符识别系统一般分为预处理、特征抽取、分类器和后处理模块等。其中预处理包括二值化、去噪、形变反变换和尺寸标准化等步骤。预处理与特征抽取紧密相连。而特征抽取、分类器是整个识别系统的核心。大体上，特征可以分为结构特征和统计特征两类。由于分类器选取取决于所提取的特征，因此相应的识别方法便有结构方法和统计方法。

预处理

预处理是字符识别中很重要的一环，一般提取特征都是在预处理后的图像上完成的，因此，如果预处理的步骤结果不理想，往往会给后面的识别环节带来无法纠正的错误。常见的预处理主要包括倾斜矫正、笔划粗细的调整、消除干扰。

1. 倾斜矫正

由于一些客观因素，图像上的字符有可能带有不同的倾斜角度，如果不进行倾斜矫正，同一字形在不同倾斜角度的图像将体现为不同的模块，势必加大训练负担，降低识别率。为了减弱这个因素的影响，采用了倾斜矫正，使矫正后字的上端和下端水平位置对齐。

1. 笔划粗细的调整

由于扫描条件的差异，同一字形的笔划可能体现为不同的醋许，为了消除这种影响，一种可能的途径是通过细化提起骨架，使细化带来一系列副作用：信息丢失、产生伪笔划等，而且由于细化，一般通过反复扫描完成，速度较慢。为此，采用一些基于数学形态学的粗细调整算法。

1. 消除干扰

在实际图像中，干扰的存在是不可避免的。在预处理中引入干扰消除算法，在确定形状的外接边框时，做横向和纵向的投影直方图，把直方图上很低的部分作为噪声区域滤除。但是，这个步骤也有可能把属于字形的一部分笔划切除掉。为了解决这个矛盾，把识别置信度分析引入预处理中。

特征抽取

特征抽取可能是高识别性能的一个很重要的部分。特征抽取的方法有很多，但是对于这些方法的评估是对具体应用领域选择最好的特征抽取方法。另外，特征抽取的性能也依赖于不同类型分类器的需求。不同特征类型可能需要不同类型的分类器。一般特征抽取方法可以分为基于结构特征、统计特征以及将结构特征与统计特征相融合的方法。

2.1结构特征

结构特征是汉字识别研究初期的主流方法，需要先抽取结构基本单元，再由这些基本单元构成来描述汉字特征。结构特征比较直观，符合人们书写汉字的过程，能较好地反映汉字的结构特性；缺点是对结构基本单元提取困难，各结构元素之间的拓扑关系复杂，抗干扰性较差。同时，由于汉字的结构特征通常都要利用细化算法提取，不仅计算量大而且会出现形变问题，给汉字识别带来新的噪声影响。结构特征主要有基于特征点、基于笔画以及基于部件三种方法。

2.2统计特征

统计特征一般针对单个汉字，即整字(Holistic)，提取方便，抗干扰能力强。汉字结构的复杂，在统计特征中，不仅不是缺点，而且使得汉字比其他西方文字具有更强的鉴别能力。统计特征不仅可以识别成千上万个超多类汉字，而且具有高抗干扰和高鲁棒识别性能，这是结构分析方法无法达到的。统计特征的缺点是没有充分利用汉字的结构信息。统计特征的四个主流方法是弹性网格特征、方向线素特征、Gabor特征和矩特征。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

商业医保发票字符识别系统的单字识别模块的设计与实现文献综述

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章