基于人脸识别的考勤系统设计文献综述

 2022-08-09 07:08

一、文献综述

(一)国内外研究现状

深度学习极大地促进了机器学习的发展,受到了世界各国相关研究人员和互联网公司的重视,目前深度学习应用最广泛的三个领域是语音识别,图像识别和自然语言处理。

深度学习在语音识别领域的研究现状

长期以来,语音识别系统大多是采用高斯混合模型(GMM)来描述每个建模单元的概率模型。由于这种模型估计简单,方便使用大规模数据对其训练,该模型有较好的区分度训练算法,保证了该模型能够很好的训练。在很长时间内占据了语音识别应用领域主导性地位。但是GMM实质上一种浅层学习网络模型,特征的状态空间分布不能够被充分描述。而且,使用GMM建模数据的特征维数通常只有几十维,这使得特征之间的相关性不能被充分描述。最后GMM建模实质上是一种似然概率建模方式,即使一些模式分类之间的区分性能够通过区分度训练模拟得到,但是效果有限。

从2009年开始,微软亚洲研究院的语音识别专家们和深度学习领军人物Hinton合作。2011年微软公司推出基于深度神经网络的语音识别系统,这一成果将语音识别领域已有的技术框架完全改变。采用深度神经网络后,样本数据特征间相关性信息得以充分表示,将连续的特征信息结合构成高维特征,通过高维特征样本对深度神经网络模型进行训练。由于深度神经网络采用了模拟人脑神经架构,通过逐层的进行数据特征提取,最终得到适合进行模式分类处理的理想特征。

深度学习在图像识别领域的研究现状

对于图像的处理是深度学习算法最早尝试应用的领域。2012年的ImageNet竞赛中,Krizhevsky等人训练了一个大型的深度卷积神经网络AlexNet,它包含了8个学习层:5个卷积层和3个全连接层。Krizhevsky等人成功借助了ImageNet这个足够大的数据集,借助了GPU的强大计算能力,借助了深层的CNN网络,借助了随机梯度下降(SGD)和Dropout等优化技巧,借助了训练数据扩充策略,最终赢得了2012年的ILSVRC,实现了top-5的错误率为15.3%的好成绩。无论如何,他们靠着深度学习震惊了机器学习领域,从此大量的研究人员开始进入这个领域,一发不可收拾。2013年的ZFNet错误率降到了11.2%。2014年Christian Szegedy等人[4]设计的GoogLeNet是一个22层的卷积神经网络,在ILSVRC2014上top-5的错误率降到了6.7%。2015年,微软亚洲研究院的Kaiming He等人设计了一个多达152层的ResNet架构,它比之前的深度神经网络都深,但却降低了复杂度,从而更易于训练,ResNet的错误率也降到了3.6%。而人类的水平也仅仅是5%-10%,由此可见,深度学习网络已经跟人类的分辨能力相当了。

深度学习在自然语言处理领域的研究现状

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。