基于对抗神经网络的图片压缩系统文献综述-综述网

杭州国际服务工程学院教务科

文献综述

（一）国内外研究现状

随着社会经济的飞速发展，人们的日常收入不断增长，国民消费水平得到明显的提升，人工智能越来越走进了我们的生活中，带给我们越来越多的便利。在人工智能领域中，生成式对抗网络（GAN， Generative Adversarial Network）是近年来复杂分布上无监督学习最具前景的方法之一[1]。近年来，深度学习在计算机视觉领域已经占据主导地位，不论是在图像识别还是超分辨重现上，深度学习已成为图片研究的重要技术，但它们的能力并不仅限于这些任务；现在深度学习技术已进入图片压缩领域。

生成式对抗网络作为一种深度学习模型，模型通过框架中两个模块：生成模型（Generative Model）和判别模型（Discriminative Model）的互相博弈学习产生相当好的输出。原始 GAN 理论中，并不要求 G 和 D 都是神经网络，只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为 G 和 D [2]。而新的在GAN的主要灵感来源于博弈论中零和博弈的思想，应用到深度学习神经网络上来说，就是通过生成网络G（Generator）和判别网络D（Discriminator）不断博弈，进而使G学习到数据的分布均匀，这个框架由两部分组成：一个 ComCNN 用于学习输入图像中最优的紧凑表示，然后编码图像的网络，一个 RecCNN 用于重构出高质量的解码图像，作为解码图像的网络[3]。

生成模型指在现存样本的基础上，使用模型来生成新案例，比如，基于现存的照片集生成一组与其相似却有细微差异的新照片。GAN是使用两个神经网络模型训练而成的一种生成模型。其中一个称为“生成器”或“生成网络”模型，可学习生成新的可用案例[4]。另一个称为“判别器”或“判别网络”，可学习判别生成的案例与实际案例。生成器企图愚弄判别器，而判别器则要同时处理生成案例和实际案例[6]。GAN解决了大量的问题。如扩充数据集、生成人脸照片、图像转换、文字-图片转化等等各个领域[7]。

（二）研究主要成果

人们对图像压缩一直是图像处理领域的一个基础和重要的研究课题。传统的图像压缩算法，如 JPEG，JPEG2000 和 BPG，依赖于手工制作的编码器。基于此的图像编解码器HEIF和BPG也具有称为定向帧内预测的基于块的定向预测技术。随着深度学习时代的来临，深度学习已成为图片研究的重要技术，但它们的能力并不仅限于这些任务，现在深度学习技术已进入图片压缩领域[5]。

目前市面上影响力比较大的图片压缩技术是WebP和BPG

（1）WebP：谷歌在2010年推出的一款可以同时提供有损压缩和无损压缩的图片文件格式，其以VP8为编码内核，在2011年11月开始可以支持无损和透明色功能。目前facebook、Ebay等网站都已采用此图片格式。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于对抗神经网络的图片压缩系统文献综述

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章