基于深度学习的行为图像理解文献综述

 2022-09-14 04:09

文献综述(或调研报告):

3.1 课题介绍

虽然基于动作/视频的人类动作识别仍然是计算机视觉和模式识别中的一个活跃的研究课题,但最近的研究已经开始探索静止图像中的动作识别,并且基于静止图像的人类动作识别已经逐渐成为计算机视觉和模式识别中的一个活跃的研究课题。它侧重于从单个图像中识别一个人的行为,与使用视频或图像序列的传统动作识别方法不同,静止图像不包含用于动作表征的时间信息。因此,基于视频的动作分析的主要时空特征不适用于基于静态图像的动作识别。而且,在静止图像中将人类从背景中分割出来并不是微不足道的小事,因为并没有运动提示可以使用,同时图像的场景可能十分的混乱。因此,在解决基于静止图像的动作识别问题方面存在新的挑战。

较为新颖的一种静态图像动作识别方法是利用过去时间观察积累的视觉动态概念的启发。主要思想是从视频中获取物体和人物如何移动的模型,然后将得到的知识信息嵌入到单个图像的表示中。以这种方式,即使仅限于一个观察时刻(单个图像),也可以通过预期的动态来通知动作识别。特别是,训练深度网络以从大量为标记的视频中学习运动,然后将学习的运动从视频传输到静态图像以使其运动产生幻觉。

3.2 动作识别的相关研究

在基于静态图像的动作识别中,没有可用的时间信息,因此传统的时空特征不再适用。此外,在传统的基于视频的动作识别中,从时空体积中提取的低级特征可以直接用于动作识别。但是,在基于静态图像的动作识别中,通常直接从整个图像中提取的低级特征不能很好地工作。因此,过往的很多思路很少仅将整个图像或场景用于低级特征提取和动作识别。由于在杂乱背景的单个图像中只有空间信息可以使用,因此研究人员在静止图像中追求不同的高级线索,以便在整个图像中使用低级特征来更好的表征动作。高级线索可以通过各种低级特征来表示,然后可以组合不同的高级线索以识别静止图像中的动作。

然而一个比较新颖的思路就是为静态图像配备了从中学习的动态视频,并利用视频作为增强测试观察运动的先验。网络从视频中获取物体和人物如何移动的模型,然后将得到的知识信息嵌入到单个图像的表示中。以这种方式,即使仅限于一个观察时刻(单个图像),也可以通过预期的动态来通知动作识别。

3.3 视觉预测的相关研究

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。