基于人脸识别的考勤系统设计文献综述-综述网

一、文献综述

（一）国内外研究现状

深度学习极大地促进了机器学习的发展，受到了世界各国相关研究人员和互联网公司的重视，目前深度学习应用最广泛的三个领域是语音识别，图像识别和自然语言处理。

深度学习在语音识别领域的研究现状

长期以来，语音识别系统大多是采用高斯混合模型（GMM）来描述每个建模单元的概率模型。由于这种模型估计简单，方便使用大规模数据对其训练，该模型有较好的区分度训练算法，保证了该模型能够很好的训练。在很长时间内占据了语音识别应用领域主导性地位。但是GMM实质上一种浅层学习网络模型，特征的状态空间分布不能够被充分描述。而且，使用GMM建模数据的特征维数通常只有几十维，这使得特征之间的相关性不能被充分描述。最后GMM建模实质上是一种似然概率建模方式，即使一些模式分类之间的区分性能够通过区分度训练模拟得到，但是效果有限。

从2009年开始，微软亚洲研究院的语音识别专家们和深度学习领军人物Hinton合作。2011年微软公司推出基于深度神经网络的语音识别系统，这一成果将语音识别领域已有的技术框架完全改变。采用深度神经网络后，样本数据特征间相关性信息得以充分表示，将连续的特征信息结合构成高维特征，通过高维特征样本对深度神经网络模型进行训练。由于深度神经网络采用了模拟人脑神经架构，通过逐层的进行数据特征提取，最终得到适合进行模式分类处理的理想特征。

深度学习在图像识别领域的研究现状

对于图像的处理是深度学习算法最早尝试应用的领域。2012年的ImageNet竞赛中，Krizhevsky等人训练了一个大型的深度卷积神经网络AlexNet，它包含了8个学习层：5个卷积层和3个全连接层。Krizhevsky等人成功借助了ImageNet这个足够大的数据集，借助了GPU的强大计算能力，借助了深层的CNN网络，借助了随机梯度下降（SGD）和Dropout等优化技巧，借助了训练数据扩充策略，最终赢得了2012年的ILSVRC，实现了top-5的错误率为15.3%的好成绩。无论如何，他们靠着深度学习震惊了机器学习领域，从此大量的研究人员开始进入这个领域，一发不可收拾。2013年的ZFNet错误率降到了11.2%。2014年Christian Szegedy等人[4]设计的GoogLeNet是一个22层的卷积神经网络，在ILSVRC2014上top-5的错误率降到了6.7%。2015年，微软亚洲研究院的Kaiming He等人设计了一个多达152层的ResNet架构，它比之前的深度神经网络都深，但却降低了复杂度，从而更易于训练，ResNet的错误率也降到了3.6%。而人类的水平也仅仅是5%-10%，由此可见，深度学习网络已经跟人类的分辨能力相当了。

深度学习在自然语言处理领域的研究现状

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可： Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版

注册

找回密码

基于人脸识别的考勤系统设计文献综述

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章