基于深度视觉特征的图像分类算法研究文献综述

 2022-11-12 04:11

文 献 综 述

【摘要】图像分类是计算机视觉领域的热门研究方向之一,也是很多图像应用领域的基础。其中图像特征是决定图像分类的关键环节,良好的特征设计能够减轻对后续机器学习算法的依赖性,从而制约着整个图像分类系统的性能。图像的视觉特征以及图像抽象语义是图像特征的两个很具有代表性的方面。本文通过图像的视觉特征以及卷积神经网络(Convolution Neural Network, CNN)提取的图像特征进行相关图像分类算法的研究。

【关键词】 图像分类;深度学习;卷积神经网络(Convolution Neural Network, CNN);图像特征

1 图像分类简介

图像分类,是指图像的信息经过一定的处理后能够达到区分不同类别的目标的一种分类任务。根据图像的语义信息将不同类别图像区分开来,是计算机视觉中重要的基本问题,在诸如人脸识别,视频分析,智能机器人设计等领域有着广泛的应用。

基于深度学习的图像分类方法,可以通过有监督或无监督的方式学习层次化的特征描述,从而取代之前的手工设计或选择图像特征的工作。近年来,采用深度学习模型中的卷积神经网络(Convolution Neural Network, CNN)进行图像分类成为了计算机视觉领域的重点并取得了惊人的成绩。CNN直接利用图像像素信息作为输入,最大程度上保留了输入图像的所有信息,通过卷积操作进行特征的提取和高层抽象,模型输出直接是图像识别的结果。这种基于”输入-输出”直接端到端的学习方法取得了非常好的效果,得到了广泛的应用。

2 图像数据的选择

目前世界上很多著名的研究机构和大学均建立了不同规模、类别的数据库以供计算机视觉领域的研究使用,部分数据集介绍如下:

(1)自然场景数据库

自然场景图像的数据库有很多,包括 Olivaamp;Torralba(OT)彩色自然场景图像数据库( 8 类)[1],Scene 15 Dataset 灰度自然场景图像数据库(15 类)[2]及大规模的 SUN(Scene UNderstanding)数据库(目前 908 类)[3]。鉴于后续章节的实验分析,下面仅介绍 Scene 15 数据库。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。