基于图模型的数据标记增强算法文献综述

 2022-11-27 03:11

摘要:

标记分布包含一定数量的标记,表示每个标记描述实例的程度。用标记分布标记实例的学习过程称为标记分布学习(LDL)。由于直接获取标记分布的困难,许多训练集只包含简单的逻辑标记而不包含标记分布。而从训练集中的逻辑标记中恢复标记分布的过程被定义为标记增强(LE),它加强了训练集中的监督信息。基于图模型的标记增强算法充分利用了特征空间的拓扑关系来指导标记空间相关性信息挖掘,有良好的数学基础,有利于形成适合数据本身特点的标记分布,能显著提升传统多标记学习的效果。

关键词:标记分布学习、标记增强、图模型

1、基本定义

1.1标记分布学习:

一种新型机器学习范式,传统的单标记和多标记学习都可以看做是该范式的特例。是一种更为泛化的学习范式。将不同标记对示例的重要程度用标记分布来显式刻画,能够处理标记的不同重要程度(描述度),对许多实际应用问题具有普适性。

1.2标记增强:

将原始逻辑标记提升为标记分布的过程。现有的多数数据集中却仅具有简单的逻辑标记而非完整的标记分布,因此无法直接应用标记分布学习。为解决这一问题,可以通过挖掘训练集中蕴含的标记重要性信息,恢复出每个示例的标记分布,即标记增强。

标记增强利用特征向量间拓扑关系或标记间相关性,将简单逻辑标记增强为标记分布,极大地拓展标记分布学习的应用范围。可以看做为标记分布学习服务的一种数据预处理技术。

2、概述:

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。