TCSNGAN:基于Transformer和谱归一化CNN的图像生成模型 |
| |
引用本文: | 钱惠敏,毛邱凌,陈实,韩怡星,吕本杰.TCSNGAN:基于Transformer和谱归一化CNN的图像生成模型[J].计算机应用研究,2024(4):1221-1227. |
| |
作者姓名: | 钱惠敏 毛邱凌 陈实 韩怡星 吕本杰 |
| |
作者单位: | 河海大学人工智能与自动化学院 |
| |
摘 要: | 生成对抗网络(generative adversarial network, GAN)已成为图像生成问题中常用的模型之一,但是GAN的判别器在训练过程中易出现梯度消失而导致训练不稳定,以致无法获得最优化的GAN而影响生成图像的质量。针对该问题,设计满足Lipschitz条件的谱归一化卷积神经网络(CNN with spectral normalization, CSN)作为判别器,并采用具有更强表达能力的Transformer作为生成器,由此提出图像生成模型TCSNGAN。CSN判别器网络结构简单,解决了GAN模型的训练不稳定问题,且能依据数据集的图像分辨率配置可调节的CSN模块数,以使模型达到最佳性能。在公共数据集CIFAR-10和STL-10上的实验结果表明,TCSNGAN模型复杂度低,生成的图像质量优;在火灾图像生成中的实验结果表明,TCSNGAN可有效解决小样本数据集的扩充问题。
|
关 键 词: | 生成对抗网络 图像生成 Transformer Lipschitz判别器 |
|
|