GAN是通过积分概率度量实现数据分布的拟合,从原始的GAN一路发展下来经过了多次重大的改进。Wesserstein距离代替了原始GAN中KullbackLeibler(KL)散度,从而提出了WGAN;梯度惩罚下的WGAN-GP;MMD GAN匹配在希尔伯特空间中单位球上定义的有序矩;SNGAN为代表的参数归一化的实现;Cram’er GAN使用能量距离来训练GAN。这些改进都在对判别器进行约束,本博客将介绍的Sphere GAN使用超球面来绑定目标函数中的积分概率度量(IPM),实现了更加快捷稳定的GAN的训练,同时这篇论文也被选作CVPR 2019 Oral。
在同一域下的图像和数据是符合一个整体流形分布的,一旦域中的数据缺失,能否利用已有的域中数据去还原丢失的数据呢?Collaborative GAN提出了一种新的缺失图像数据插补框架,称为协同生成对抗网络(CollaGAN)。CollaGAN是在现在已经成熟的单图像到图像生成的基础上,研究多域图像到图像的翻译任务,以便单个生成器和判别器网络可以使用剩余的干净数据集成功估计丢失的数据。
图像模糊是影响图像质量的重要因素,显着降低了许多计算机视觉应用的性能,例如物体检测和人脸识别。随着深度神经网络的发展,计算机视觉领域的难题被一个个解决,单纯依靠先验核去实现图像去模糊的技术已经渐渐被取代。本文将针对CVPR2019 Unsupervised Domain-Specific Deblurring via Disentangled Representations一文进行分析,梳理一下基于深度神经网络下图像去模糊的实现方法。
subscribe via RSS