基于多源信息融合的目标检测算法研究文献综述-综述网

基于多源信息融合的目标检测算法研究文献综述

摘要：目标检测算法得到了越来越多关注，应用场景也多种多样。目前基于二维图像的目标检测算法已经有大量的工作，然而检测效果也达到了瓶颈期；于是基于雷达点云、红外线等多维度信息源的检测算法应运而生，目前已经取得了一些进步。设想能否将二维图像与雷达点云等多种信息源结合起来，利用各自的优点来弥补单一信息源的不足。已有事实证明这种方法是可取的，本课题将在前人的基础上进一步探索可行性。

关键词：目标检测；雷达点云；二维图像；多源信息融合；

引言

目标检测技术是机器学习视觉领域的重要构成部分，大到国防、小到日常生活各个方面，都有目标检测的影子。比如近年来谷歌、百度和特斯拉等知名公司都进行了无人驾驶车辆的研发，其中重要的一个环节就是：目标检测算法的研究，且对其检测准确度要求极高。

随着硬件性能的提升，相比于2012年之前，结合深度学习的目标检测算法效果有了极大提升，如2012年ImageNet大赛的冠军得主AlexNet大大提高了目标检测的准确率。一些有代表性的基于二维图像的算法[1,2,3]，其检测准确度已经有了很大的提高，但对于物体遮挡、形变不能很好的解决，虽然有应对策略，但是检测效果的提升到达了瓶颈；三维目标检测算法[4,5]能够弥补一些二维图像丢失的信息，但是三维信息源数据的稀疏性，对于小目标检测能力有限。人们就想找到一种算法，可以同时解决遮挡、形变和小目标丢失问题。多源信息融合就是基于这种思想的一种算法。近些年多源信息融合算法也有不同的发展方向，本次课题就专注于寻找一种令人满意的多源信息融合算法。

主体

信息源的介绍：除了基于图像的物体检测技术外，还发展了其他的信息源，比如：LIDAR（雷达点云）、红外线视图。雷达点云的优点是深度信息准确，但数据比较稀疏；而相机拍摄的图片保存更详细的语义信息，但是容易造成遮挡、形变。

特征的获取：现有深度学习模型如AlexNet[6]、VGGNet[7]均可以作为前端网络，AlexNet的问题在于视野域、步长偏大、深度较少，对于复杂识别问题力不从心，而VGGNet就可以应对大多数的特征提取任务。选择性区域搜索(Regin Proposal Extraction)已经广泛应用于各大目标检测网络模型，如与AlexNet之间结合产生了RCNN，随后逐步发展产生了SPP Net、Fast RCNN、Faster RCNN[8]。

我们知道低层的特征语义信息比较少，但是目标位置准确；高层的特征语义信息比较丰富，但是目标位置比较粗略。小物体进行多次卷积操作，往往会丢失其语义信息,Faster RCNN对于小物体的检测，效果就差了一些。为了解决这个问题，有部分采用了多尺度融合如SDD net。像SSD（Single Shot Detector）采用这种多尺度特征融合的方式，没有上采样过程，即从网络不同层抽取不同尺度的特征做预测，这种方式不会增加额外的计算量，但是这种方法没有用到足够低层的特征。另外虽然也有些算法采用多尺度特征融合的方式，但是一般是采用融合后的特征做预测。FPN（feature pyramid networks）[9]顶层特征通过上采样和低层特征做融合，而且每层都是独立预测的，因此能够获得足够低层的特征，对于检测小物体是很有帮助的。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于多源信息融合的目标检测算法研究文献综述

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章