基于多尺度感知特征和图割模型的自然图像分割技术研究文献综述

 2022-11-10 11:11

文 献 综 述

一、研究的背景及意义

技术和图像应用技术的蓬勃发展,对图像处理的各种要求越来越高,而图像分割作为图像处理和图像分析的重要基础,在近年来得到了广泛地研究与推广。由于细节较多,图像灰度分布不均匀,目标与背景对比度低、纹理特征复杂等原因,传统的图像分割无法满足人们的越来越高的需求。

分割是指将目标从背景中分离出来, 是图像分析、模式识别、计算机视觉等领域的关键步骤. 交互式图像分割是指在分割的过程中加入一些用户的交互来指引分割, 以便获得符合用户目的的分割结果. 交互式图像分割方法以其灵活的交互方式、满意的分割结果已经成为了一个研究热点.基于图论的图割算法作为一种基于区域交互的方法, 在图像分割中得到了广泛的应用. 用户只需要在图像中标记一些种子点作为前景或者背景,算法将完成对整幅图像的分割. 一般而言, 图像分割方法可以分为基于图像区域的分割方法[1-3]以及基于图像边界的分割方法[4-6]2 类. 基于区域的分割方法 , 比如高斯混合模型 (Gaussian mixturemodel, GMM), 是通过在图像的特征空间进行聚类, 采用最大期望算法进行迭代求解, 直至算法收敛; 然而此类方法容易出现过分割现象, 且不确定能否得到全局最优解. 基于图像边界的分割方法一般需要先手动画一条轮廓曲线作为初始化轮廓曲线, 然后基于该初始化的轮廓曲线进行迭代修正; 此类方法对初始化非常敏感, 很容易陷入局部极值. 因为上述方法不能确保得到全局最优解, 因此当获得不满意的分割结果时很难判断是能量函数设计不当还是求解方法不合适造成的. Boykov等[7]首先提出了基于图割的交互式图像分割方法,该方法在分割的过程中合并了图像的区域和边界信息, 把图像转化为图, 通过求取图的最小割集来获得全局最优解, 因此基于图割的分割方法能够得到较满意的分割结果. 传统的图割方法在图像统计直方图的基础上, 根据用户标记的前、背景种子点估计每个像素属于前景和背景的概率. 但由于直方图的局限性, 当图像中包含低对比度、复杂背景等情况时, 该类方法往往不能得到满意的分割结果, 且算法对用户交互非常敏感, 特别是在处理背景比较复杂的图像时需要更多的用户交互.Rother 等[8]采用 GMM 代替直方图, 提出了 Grabcut方法. 该方法交互更加简单, 只需要用户在感兴趣区域附近绘制一个矩形框, 然后算法对框内的目标进行分割, 且通过迭代更新 GMM 中的各个参数,以获得更优的分割结果; 然而, 迭代方法增加了算法的时间复杂度, 导致算法运行速度较慢. 为了提高分割速度, Li等[9]提出了懒人抠图法,通过超像素代替像素进行分割, 大大提升了算法的运行效率;但是超像素的引入容易导致算法出现过分割现象.为了进一步提高分割精度, 减少用户交互, Peng 等[10]提出了基于迭代区域合并的局部化图割算法(iterated region merging with localized graph cuts,IRM-LGC), 该方法从用户标记的子图开始迭代地去标记子图周围未分割的区域, 相同用户交互下更能获得满意的分割结果; 但是同样由于超像素的引入容易导致算法出现过分割现象.近年来, 基于图像非局部信息的方法相继应用在图像处理方面, 比如图像去噪[11-13]、图像分割[14-16]等, 并取得了明显的效果. 其中文献[16]在分割过程中通过计算图像中所有像素点之间的相似性关系表示图像的非局部信息指引分割. 虽然相似性高的像素点之间相似性权重很大, 相似性低的像素点之间相似性权重很小, 但是在遇到相似性高的像素点数量远远少于相似性低的像素点数量的情况时, 相似性低的所有像素对之间的权重之和却很大, 容易得到错误的分割结果; 且该方法在计算像素之间相似性时需要一组序列图像来为每个像素点提供样本, 训练出均值和方差, 比较适合处理序列图像, 不方便直接分割单幅图像.基于上述分析,本文提出的方法具有如下的性质, 提升了图像的分割精度。1)设计实现了一种结合图像块层和超像素层的多层图约束的交互式图像分割算法。在图割方法的基础上,提出了像素层结合图像块层和超像素层的方法。该方法首先进行两次图像预处理,分别得到基于图像块的图像块层和基于超像素的超像素层。图像块是对整幅图像进行按步长和窗口大小分割后得到的基于图像局域的信息,由于采用图像块内像素点特征均值作为该像素块的特征信息,所以它的特征信息中增加了像素点与周围像素点的连接关系,提供了纹理和组织结构上的特征。但由于是取均值,弱化了该图像块在保持图像内部边缘信息。因此将图像块与图像层结合,丰富了区域部分的特征信息,也弥补了像素块对边缘分割不好的缺点。然后加入超像素的方法,在图割算法中加入超像素层,在建立图模型时加入超像素关系,引入高次信息,为分割提供了更丰富的信息,降低了分割的错误率。通过在两个公共图像库数据集提供的测试图片上的实验,表明了本章算法对复杂背景和低对比图像分割的有效性和可行性,不仅利用了像素点的灰度特征, 且考虑了像素的邻域结构特征, 使得像素点之间相似性的计算更加鲁棒; 2)为每个像素点设置搜索窗口, 提高了算法的效率, 且避免了可能出现的错误分割现象现有的图像分析识别精度仍远不能满足实际应用的需要,寻找新的分类算法,完善分类的方法和模型,从而高精度的完成图像分割的任务,对满足经济和社会发展的各项需要,都具有非常重要的意义。

  1. 国内外研究现状

Greig 等于 20 世纪 80 年代末首次将图割理论应用于图像处理领域[17], 同时他最早提出使用组合优化理论中的最小割/最大流算法来最小化计算机视觉中的能量函数. 20 世纪 90 年代末 Boykov等[18] 将该理论应用到图像分割领域, 提出了基于图割的交互式图像分割方法, 正式引发了国际上对图割理论及其应用的研究热潮.

2.1 基于图割的交互式和自动分割方法

与自动分割方法相比, 交互式分割方法有很多优点: 1) 更准确地理解用户的需求; 2) 更准确地提取目标区域.2001 年, Boykov 等[23] 将图割应用到灰度图像前景提取领域. 用户分别指定一部分区域作为前景和背景, 算法自动实现图像分割. 该方法以其简洁的交互方式, 较快的处理速度, 以及能够综合颜色、纹理等各种信息引起了人们的广泛关注.Blake 等[19] 使用高斯混合模型对前景和背景的颜色空间进行建模, 从而能够利用图像的颜色信息,对彩色图像的分割效果较好. Rother 等[20] 提出的Grab cut 方法采用迭代的图割进行图像分割. Grabcut 总体上仍采用高斯混合模型和图割的框架, 但是在用户的交互方式上更为简洁, 用户只需提供两个点, 形成一个将目标套住的包围盒. 该方法的不足是当包围盒中的背景不能充分表示背景区域时, 分割效果较差. 用户提供包围盒是一种简单和流行的交互方式, 然而, Rother 等仅利用提供包围盒来排除外部区域和初始化能量函数, 文献 [21] 进一步讨论将包围盒作为一个拓扑形状先验, 来阻止过度收缩,确保用户提供的包围盒以有效的、紧的方式来约束分割结果.2004 年, 出现了懒人抠图 (Lazy snapping)[22]技术, 这是一种新颖的能够从粗到细地提取出前景对象的方法. 懒人抠图技术包括两步: 快速的对象标记和简单的边界编辑. 对象标记是在较粗糙的尺度上进行, 用户绘制几条标记线来指定感兴趣的对象;边界编辑是在较细致的尺度上进行, 用户通过简单的点击或者拖动附着在前景边界上的多边形顶点来编辑对象边界.图 割 方 法 易 于 分 割 出 小 目 标, 而 测 地(Geodesic) 分割方法可以避免这个不足[23], 但是对种子点的位置非常敏感, 而且由于缺乏边缘建模,很难精确定位目标的边界. 因此, 文献 [24] 在图割优化框架下结合了测地距离信息和边缘信息, 不仅克服了传统图割方法的缺点, 而且提高了分割精度,减少了用户交互. 文献 [25] 提出的方法仅需提供一个目标种子点, 就可以实现自动分割, 将交互程度降到了最低.当然, 图割方法也可完全自动化, 思路是将图割方法和其他方法结合, 比如 PUMA (Phase un?wrapping max-flow)[26] 方法, 利用相位展开方法获取种子点, 然后用图割进行自动分割; 文献 [27] 利用SIFT 算子来获取种子点, 从而实现自动分割; 文献[28] 利用显著性检测算法来自动粗定位目标, 然后用加权核密度估计和图割算法来优化分割.考虑到分割图像的复杂程度和图像是否有明显的感兴趣特征是影响自动分割的关键因素, 也限制着自动分割的适用范围. 因此, 当前实用的方法仍然是基于图割的交互式分割方法. 对交互方式有两点值得注意, 其一是交互方便; 其二是交互要少, 如参与的次数要少, 每次参与的时间也要少. 总之, 在交互式分割方法中, 既要发挥用户的判断能力, 指导分割的进行, 又要充分利用计算机的运算性能, 使分割方法具有实用性.

2.2 能量函数中融入各种先验的图割方法

1) 在能量函数中体现纹理信息. 考虑到马尔科夫随机场模型和条件随机场模型, 只含有单个像素信息 (一阶势) 和成对像素信息 (二阶势), 而一阶势和二阶势并不适合表示纹理信息, Russell 等[29] 在能量函数中引入了高阶 Potts 模型. 鉴于结构张量进行纹理分析非常有效, 可有效呈现边缘及其方向,且运算速度快, Malcolm 等[30] 在张量空间中引入了图割理论.2) 在能量函数中引入形状先验信息. Malcolm等[31] 采用一个训练形状集, 并使用 KPCA (Kernelprincipal component analysis) 来构建一个统计形状空间, 取得了喜人的效果, 但它的形状能量不是基6 期 刘松涛等: 基于图割的图像分割方法及其新进展 917于形状测度的, 不能处理形状的仿射变换, 也不能同时分割多个目标. Veksler[32] 采用星形先验信息, 没有局限于具体的形状, 可部分解决多目标问题, 但不能区分目标. Wang 等[33] 提出了自适应形状先验方法, 主要思想是基于图像灰度信息推导出概率图, 让低概率值的像素比高概率值的像素具有更强的形状先验.3) 在能量函数中加入序约束. 比如目标分割中,标记车轮的像素不可能在标记车顶的像素上面. 加入序约束后, 普通 alpha; 扩展移动图割会陷入局部最小,文献 [34] 提出同时作用在所有标记上的序保护的移动方法.4) 在能量函数中体现全局属性. 普通 MRF 仅建模了局部连接, 文献 [35] 推导出一个势函数, 可以让输出的标记具有连接性. 连接性可以让非均匀目标形成一个整体, 也可以滤除干扰杂波.

2.3 能量函数中正则参数的自适应确定方法

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。