手机微距拍照的图像分析算法研究文献综述

 2022-10-27 04:10

文献综述(或调研报告):

符号识别由于其在日常生活中各种有用的应用(如商标识别,形状检索,手写数字的识别,分类和技术图纸的解释等),一直是模式识别研究中的热点问题之一。在线图中,一个符号可以被定义为一个具有特定图形的实体,并在特定的应用场景中具有具体的意义。典型的符号有徽标,商标,图表,图形图标,图纸等等[1]。现有的有关符号识别的工作主要针对逻辑图表,工程图和地图。通过各种标志识别的竞赛,现有的标志识别的方法也得到了有效的性能评估。

符号匹配/识别可以被认为是对一般的形状匹配/分析问题的具体应用。实际上,大多数现有的符号识别的工作是通过利用形状特征和描述来设计的。这样做,一个主要挑战是如何处理形状不变的问题,包括视点更改,旋转和尺度变换。额外的需求是如何处理形状衰减和环境噪声的问题(即符号处在一个噪点很多的环境中)。现在学界已经提出了各种方法来部分解决这些需求。 然而,很难找到这样一个形状描述符不仅能满足对于不变性的需求,也能高效地用于实时应用之中。经典的符号识别算法包括形状上下文,Shapemes,矢量化函数等等[2][3]。这些方法很多时候在精确度和时间复杂度上不能同时达到较为理想的效果。

除了传统的这些方法以外,近些年深度学习在图像识别领域取得了巨大的成就。它是近十年来人工智能领域取得的最重要的突破之一,它在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域都取得了巨大成功。深度卷积网络以端到端的多层方式集成了高/中/低的特征和分类器,已经为图像识别和分类带来了一系列突破 。大数据的出现在很大程度上缓解了深度学习中训练过拟合的问题。例如ImageNet训练集拥有上百万有标注的图像。计算机硬件的飞速发展提供了强大的计算能力,使得训练大规模神经网络成为可能。一片GPU 可以集成上千个核。此外神经网络的模型设计和训练方法都取得了长足的进步。例如,为了改进神经网络的训练,学者提出了非监督和逐层的预训练。

综合以上,标志识别领域经过多年的研究与探索,已经取得了长足的进步。然而如何进一步优化算法,将其与实际的应用场景相融合,从而为人们所用还是一个需要进一步探讨与研究的问题。

[1] Huang Z, Yu Y, Gu J, et al. An Efficient Method for Traffic Sign Recognition Based on Extreme Learning Machine[J]. IEEE Transactions on Cybernetics, 2017, 47(4):920.

[2] Savchenko A V. Maximum-Likelihood Approximate Nearest Neighbor Method in Real-time Image Recognition[J]. Pattern Recognition, 2016, 61:459-469.

[3] Pham T A, Hoang N, Le H, et al. Symbol recognition using directional and spatial features[C]// International Conference on Image Processing Theory, TOOLS and Applications. IEEE, 2016:193-198.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。