基于对抗神经网络的图片压缩系统文献综述

 2022-08-12 11:08

杭州国际服务工程学院教务科

  1. 文献综述

(一)国内外研究现状

随着社会经济的飞速发展,人们的日常收入不断增长,国民消费水平得到明显的提升,人工智能越来越走进了我们的生活中,带给我们越来越多的便利。在人工智能领域中,生成式对抗网络(GAN, Generative Adversarial Network)是近年来复杂分布上无监督学习最具前景的方法之一[1]。近年来,深度学习在计算机视觉领域已经占据主导地位,不论是在图像识别还是超分辨重现上,深度学习已成为图片研究的重要技术,但它们的能力并不仅限于这些任务;现在深度学习技术已进入图片压缩领域。

生成式对抗网络作为一种深度学习模型,模型通过框架中两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN 理论中,并不要求 G 和 D 都是神经网络,只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为 G 和 D [2]。而新的在GAN的主要灵感来源于博弈论中零和博弈的思想,应用到深度学习神经网络上来说,就是通过生成网络G(Generator)和判别网络D(Discriminator)不断博弈,进而使G学习到数据的分布均匀,这个框架由两部分组成:一个 ComCNN 用于学习输入图像中最优的紧凑表示,然后编码图像的网络,一个 RecCNN 用于重构出高质量的解码图像,作为解码图像的网络[3]。

生成模型指在现存样本的基础上,使用模型来生成新案例,比如,基于现存的照片集生成一组与其相似却有细微差异的新照片。GAN是使用两个神经网络模型训练而成的一种生成模型。其中一个称为“生成器”或“生成网络”模型,可学习生成新的可用案例[4]。另一个称为“判别器”或“判别网络”,可学习判别生成的案例与实际案例。生成器企图愚弄判别器,而判别器则要同时处理生成案例和实际案例[6]。GAN解决了大量的问题。如扩充数据集、生成人脸照片、图像转换、文字-图片转化等等各个领域[7]。

(二)研究主要成果

人们对图像压缩一直是图像处理领域的一个基础和重要的研究课题。传统的图像压缩算法,如 JPEG,JPEG2000 和 BPG,依赖于手工制作的编码器。基于此的图像编解码器HEIF和BPG也具有称为定向帧内预测的基于块的定向预测技术。随着深度学习时代的来临,深度学习已成为图片研究的重要技术,但它们的能力并不仅限于这些任务,现在深度学习技术已进入图片压缩领域[5]。

目前市面上影响力比较大的图片压缩技术是WebP和BPG

(1)WebP:谷歌在2010年推出的一款可以同时提供有损压缩和无损压缩的图片文件格式,其以VP8为编码内核,在2011年11月开始可以支持无损和透明色功能。目前facebook、Ebay等网站都已采用此图片格式。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。