基于多源信息融合的目标检测算法研究文献综述

 2022-11-27 03:11

基于多源信息融合的目标检测算法研究文献综述

摘要:目标检测算法得到了越来越多关注,应用场景也多种多样。目前基于二维图像的目标检测算法已经有大量的工作,然而检测效果也达到了瓶颈期;于是基于雷达点云、红外线等多维度信息源的检测算法应运而生,目前已经取得了一些进步。设想能否将二维图像与雷达点云等多种信息源结合起来,利用各自的优点来弥补单一信息源的不足。已有事实证明这种方法是可取的,本课题将在前人的基础上进一步探索可行性。

关键词:目标检测;雷达点云;二维图像;多源信息融合;

引言

目标检测技术是机器学习视觉领域的重要构成部分,大到国防、小到日常生活各个方面,都有目标检测的影子。比如近年来谷歌、百度和特斯拉等知名公司都进行了无人驾驶车辆的研发,其中重要的一个环节就是:目标检测算法的研究,且对其检测准确度要求极高。

随着硬件性能的提升,相比于2012年之前,结合深度学习的目标检测算法效果有了极大提升,如2012年ImageNet大赛的冠军得主AlexNet大大提高了目标检测的准确率。一些有代表性的基于二维图像的算法[1,2,3],其检测准确度已经有了很大的提高,但对于物体遮挡、形变不能很好的解决,虽然有应对策略,但是检测效果的提升到达了瓶颈;三维目标检测算法[4,5]能够弥补一些二维图像丢失的信息,但是三维信息源数据的稀疏性,对于小目标检测能力有限。人们就想找到一种算法,可以同时解决遮挡、形变和小目标丢失问题。多源信息融合就是基于这种思想的一种算法。近些年多源信息融合算法也有不同的发展方向,本次课题就专注于寻找一种令人满意的多源信息融合算法。

主体

信息源的介绍:除了基于图像的物体检测技术外,还发展了其他的信息源,比如:LIDAR(雷达点云)、红外线视图。雷达点云的优点是深度信息准确,但数据比较稀疏;而相机拍摄的图片保存更详细的语义信息,但是容易造成遮挡、形变。

特征的获取:现有深度学习模型如AlexNet[6]、VGGNet[7]均可以作为前端网络,AlexNet的问题在于视野域、步长偏大、深度较少,对于复杂识别问题力不从心,而VGGNet就可以应对大多数的特征提取任务。选择性区域搜索(Regin Proposal Extraction)已经广泛应用于各大目标检测网络模型,如与AlexNet之间结合产生了RCNN,随后逐步发展产生了SPP Net、Fast RCNN、Faster RCNN[8]。

我们知道低层的特征语义信息比较少,但是目标位置准确;高层的特征语义信息比较丰富,但是目标位置比较粗略。小物体进行多次卷积操作,往往会丢失其语义信息,Faster RCNN对于小物体的检测,效果就差了一些。为了解决这个问题,有部分采用了多尺度融合如SDD net。像SSD(Single Shot Detector)采用这种多尺度特征融合的方式,没有上采样过程,即从网络不同层抽取不同尺度的特征做预测,这种方式不会增加额外的计算量,但是这种方法没有用到足够低层的特征。另外虽然也有些算法采用多尺度特征融合的方式,但是一般是采用融合后的特征做预测。FPN(feature pyramid networks)[9]顶层特征通过上采样和低层特征做融合,而且每层都是独立预测的,因此能够获得足够低层的特征,对于检测小物体是很有帮助的。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。