基于语义自编码的零样本学习方法文献综述

 2022-11-09 11:11

文献综述

一、研究背景

在分类问题中,因为数据库大小有限,因此在使用分类模型进行预测时,出现了在训练集没有出现过的类别。举个例子,我们有个小型数据库,里面所含的类别只有人、鸟、汽车,经过我们的训练,发现模型对于这些类别的目标已经有很好的性能了,但是突然出现了一个新的类别——狗,此时模型并不认识这个类别,这也就意味着模型肯定没法对这个新的类别进行新的分类。

这个问题就是一个典型的因训练样本不足而导致的模型出现欠缺的问题,那么该如何缓解这种问题呢?最简单直接的方法就是大量的增加样本,让模型学习更多的类别,但是如果我采集一张新的类别样本的成本太高,或者几乎没法采集到某些类别的样本,此时该怎么办?也就是说如何在数据库有限的情况下,让模型竟可能的容忍新的类别,或者训练集中没有出现过的样本?

上述问题就是一个典型的zero-shot learning问题,zero-shot learning的根本目的就是解决这种类别从未出现在训练集中的情况。如果我们不用上面这些符合标签,而采用一些具有语义信息的描述标签,比如我们描述人时,我们不说这是人,我们说这个物体是一种动物,直立行走,食肉,没有尾巴。通过这些语义描述,我们可以对人这一类别进行属性描述,当语义信息足够多时,那么人这一类别也就会变得独一无二。通过训练就可以将这些属性列表与人相对应。

同理,当出现了新的物体是,虽然我们不知道这些物体是什么,但是我们可以通过上述的属性描述对这一新的物体进行描述,从而避免了无法识别新类别的尴尬情况。[7]这位就是所谓的零点学习。现有的零点学习(ZSL)模型通常学习从视觉特征空间到语义嵌入空间(例如〜属性空间)的投影函数。本次我们将借鉴一种新的方法。

二、国内外研究现状

零样本学习的概念在 2008 年由 Larochelle 等人首先提出[20]。在零样本学习中,未知(测试)类别并没有已知的训练样本,只能通过学习已知(训练)类别的知识,迁移到未知(测试)类别中,并对未知(测试)样本进行分类。每个样本都有属于自己的特征,但是特征作为底层语义信息很难和高层语义标签建立联系,由此引入属性的概念进行零样本分类。由于零样本场景下的学习问题与一般场景下的学习问题存在较大差异,因此仍需结合零样本学习场景的特点来构建具有针对性的属性分类器。零样本场景下的属性分类与现有的属性分类学习方法存在如下几个重要区别:首先,作为介于底层特征和模式识别的一种中间表示,属性在零样本学习中起着知识传递的作用,因此描述能力越强的属性越有可能促进学习性能的提升;其次,各属性分类器的分类能力对属性和类别标签的映射关系有一定的影响,因此最终影响零 样本学习的整体性能。

零样本学习充分反映了迁移学习的基本思想,实现两个类别或者多个类别之间的知识迁移。零样本学习的基础在于已知样本和未知样本的特征提取,属性和底层特征有一定的关系;其中 Animal with Attributes(AWA)数据集[33]应用到基于属性的零样本学习中时,共提供了6种特征提取方法,包含了图像的各个方面,如颜色、纹理和形状等;分别是颜色直方图(CQ)、SIFT、rgSIFT、PHOG、SURF 和局部自相似直方图[33],这几种特征可以很好的应用于非在线分类器[21],而其他特征提取方法分别是以上六种特征提取方法的近似算法[21]。

零样本学习的一般思路是通过构建语义特征空间,使得类别的语义特征和样本的特征之间的相似度 可以直接进行度量,从而能够比较测试样本的特征与未出现过的类别的语义特征之间的相似度,进而找出 最相近的类别[19]。现有的语义特征空间可分为3类:①属性(attribute)特征空间[24-26];②文本特征空间[22-23];③公共特征空间[27-28]。以下只重点说明属性特征空间。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。