基于深度学习的车牌识别系统文献综述

 2022-08-19 11:08

一、文献综述

  1. 国内外研究现状

早期神经网络模型类似于仿生机器学习,它试图模仿大脑的学习机理。最早是在1943年由Walter Pitts教授和Warren McCulloch教授提出的McCulloch-PittsNeuron(MP)计算结构模型,大致模拟了人类神经元的工作原理,使用了简单的线性加权和的方式来模拟变换。Frank Rosenblatt教授在1958年提出了一个感知机模型(perceptron) 。它首次实现了依据样本数据集来学习权重。这两个模型深深的影响了现代机器学习,为现代机器学习奠定了基础,但自身也存在许多不足。Seymour Paper教授和Marvin Minsky 教授在1969年出版的《Perceptron》 书中证明了感知机模型只能解决线性可分问题,无法解决异或问题。在之后的十几年里,关于神经网络的研究全部处于停滞状态。
直到20世纪80年代末,第二波神经网络研究热潮因为分布式知识表达和神经网络反向传播算法的提出而重新兴起。这很大程度上增强了模型的表达能力,让神经网络由宽度到深度发展,这为之后的深度学习奠定了基础。1986年David Everett Rumelhart教授、Geoffrey Everset Hinton教授和Ronald J. Willians教授在自然杂志上发表的“Leamning Representations by Back-propagating errors”文章中首次提出了反向传播算法,这个算法大幅降低了训练神经网络所需的时间。直到今天依旧是训练神经网络的主要方法。如今使用的一些神经网络结构,例如:卷积神经网络,循环神经网络,在这个阶段取得了显著的成就。Sepp Hochreiter教授和Juergen Schmidhuber教授在1991年提出的LSTM模型可以有效的对较长的序列进行建模,比如一段文字,语音等。
深度学习算法,最早尝试应用的领域是计算机视觉问题。在1989年,Yann LeCun教授提出了卷积神经网络的概念,这是一种包含卷积层的深度神经网络模型。最初卷积神经网络,在小规模的问题上取得了非常好的效果,但却没有取得重大突破。原因就是卷积神经网络对大图像的处理得不到理想的效果。直到2012年深度学习算法,AlexNet赢得图像分类比赛:ILSVRC的冠军,卷积神经网络才得以重新被热议研究。ILSVCR是基于ImageNet图像数据集的图像识别类比赛,在计算机视觉领域有很高的影响力。2013年开始,ILSVRC基本都是深度学习在参赛。在2012年到2015年间,通过对深度学习算法的不断研究,ImageNet的图像分类错误率以每年4%的速度递减。这说明深度学习打破了传统机器学习算法在图像分类上的瓶颈,让图像分类问题得到更好的解决。在2015年自然科学杂志上刊登的深度学习综述DeepLearning,对现有的深度学习理论进行了总结,文章中提到了用ReLu函数代替Sigmoid函数成为最流行的作用函数,加上GPU加速运算等,这些共同促进了深度学习在图像识别的成功,给计算机视觉领域带来了一场革命。
国内互联网巨头,百度公司将深度学习相关技术应用到计算机视觉上,推出了一系列产品,并且聘请了美籍华人科学家吴恩达主导百度的深度学习,取得了显著的成果(paddlepaddle),在2017年最强大脑上,由吴恩达团队设计的小度智能机器人,与国内外顶级最强大脑进行对决,未尝败绩。

中文车牌识别,经过近二十年的发展,在特定场景下,已经具备了相对成熟的解决方案。如停车场门口,小区入口等。车牌识别技术是现代智能交通系统重要组成部分,其应用十分广泛。它以计算机视觉处理,数字图像处理,模式识别等技术为基础,对摄像机所拍摄的车辆图像进行处理分析,得到每辆车的车牌号码,从而完成识别的过程。车牌识别在高速公路车辆管理中得到广泛应用,如高速收费、交通违章检测等。在停车场的管理中,车牌识别技术是识别车辆身份的主要手段。目前市场上的车牌识别产品,大多采用检测 分割 识别的方案,这种方案依赖于分割的效果,对于图像模糊粘连处理有一定难度。当前的一些基于深度学习车牌识别,也有一些公司在做,在大陆多种车牌上取得了不错的效果。

  1. 研究主要成果
  2. 深度学习的研究成果
    上个世纪,神经网络发展前景不好,传统神经网络学习算法却得到了突破性的进展,并在90年代的时候超过了神经网络,成为当下最先进的方法。最典型的案例就是1998年,使用支持向量机(SVM)的算法在手写体识别上,可以把错误率降低到0.8%,这是神经网络无法做到的。导致这种情况的原因主要是因为在当时的计算资源下,训练深层的神经网络仍然非常困难,其次,当时的数据量比较小,无法满足训练深层神经网络的需求。
    随着计算机性能进一步提高,以及云计算,GPU的出现,在2010年左右,计算量不再是阻碍神经网络发展的问题。同时,随着互联网的发展,获取海量的数据也变得容易。于是新的神经网络高潮再次来临。在2012的lmageNet举办的图像分类竞赛ILSVRC中,由Alex Krizhevsky 教授实现的深度学习系统AlexNet赢得了冠军。他的论文ImageNet Classification with Deep Convolutional Neural Networks,也成为深度学习基石,被大家所熟知。自后深度学习作为深层神经网络的代名词被大家所熟知。在2013年深度学习被MIT评为了年度十大科技突破之一。在2013年ImageNet比赛中,效果较好的模型都是使用深度学习。在2014年ImageNet比赛中,谷歌的GoogLeNet加深网络深度到20多层,将top5错误率降到了6.656%。
  3. 车牌识别的研究成果

目前市场上车牌识别产品,大多采用检测、分割、识别的方案,这种方案依赖于分割的效果,对于图像模糊、粘连处理有一定难度。当前的一些基于深度学习的车牌识别,有一些公司在做。在开源界也有许多优秀的算法,目前github上比较优秀的开源方案包括OpenALPR、easyPR、HyperLPR等。其中OpenALPR是针对国外车牌,如果需要利用其识别国内车牌,需要重新训练及代码的修改,可以作为一种车牌识别的思路进行参考。easyPR是车牌识别爱好者开发的中文车牌识别框架,作者目前在南京大学读博,代码具有一定参考价值。编译运行代码,但是速度跟准确率都不能达到商用。HyperLPR是智云视图开源的一个车牌识别代码,作者提到该算法采用了神经网络,端到端的进行识别。

  1. 发展趋势

深度神经网络呈现的层数越来越深,结构越来越复杂的发展趋势。为了提升深度神经网络的性能,业界从网络深度,网络结构两方面持续进行探索。神经网络层数已扩展到上百层甚至上千层,随着网络层数不断加深,学习效果也越来越好。深度神经网络工程化应用的技术不断深化。深度神经网络模型大都具有上亿的参数量、数百兆的占用空间,运算量大,难以部署到智能手机,摄像头以及可穿戴设备等性能和资源受限的终端类设备。为了解决这个问题,业界采用模型压缩的技术降低模型参数量、尺寸,减少运算量。目前采用的模型压缩方法包括对已训练好的模型做修剪和设计更精细的模型两类。深度学习算法建模和调参过程繁琐,应用门槛高。为了降低深度学习应用门槛,业界提出了自动化机器学习技术,可实现深度神经网络的自动化设计,简化使用流程。

深度学习和多种机器学习技术不断融合发展。深度学习和强化学习融合发展,诞生的深度强化学习技术,结合了深度学习的感知能力、强化学习的决策能力。克服了强化学习只适用于状态为离散且低维的缺陷,直接从高维原始数据学习控制策略。为了降低深度神经网络模型训练所需数据量,业界引入了迁移学习思想,从而诞生了深度迁移学习的技术。迁移学习是指利用数据,任务或模型之间的相似性,将在旧领域学习过的模型应用于新领域的一种学习过程。通过将训练好的模型迁移到类似场景,实现需少量的训练数据就可以达到较好的效果。

  1. 存在的问题

尽管深度学习在许多领域取得了巨大的成功,但是它还有很长的路要走。还有很多地方有待改进。至于局限性,例子也是相当多。例如:Nguyen 等人表明深度神经网络在识别图像时容易被欺骗。还有其他问题,如Yosinski等提出的学习的特征可迁移性。Huang 等提出了一种神经网络攻击防御的体系结构,认为未来的工作需要防御这些攻击。。

对于车牌识别技术,虽然已经得到了很大发展,但是仍然存在难点。这些难点集中体现在以下几个方面:(1)由于光照,大雾,沙尘暴等天气影响,导致采集到的图像质较低,字符容易受到噪声干扰,造成部分目标图像被背景图像掩盖,降低车牌字符识别准确率。(2)我国车牌的特殊性。我国车牌的字符包括中文、数字以及英文字母。由于中文字符的笔画较为复杂,在对中文字符进行二值化处理,容易造成笔画的模糊,从而导致错误的识别。同时在对车牌字符识别的时候,需要对英文字母和数字进行混合识别,受到部分英文字母和数字字符相似影响,造成英文字母和数字的误识。我国车牌识别颜色的多样性,比如蓝色白底,黄底黑字,黑底白字等,在利用车牌颜色的特征时需要考虑多种情况,增加了额外的工作量。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。