TCSNGAN:基于Transformer和谱归一化CNN的图像生成模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

TCSNGAN:基于Transformer和谱归一化CNN的图像生成模型

引用本文：	钱惠敏,毛邱凌,陈实,韩怡星,吕本杰.TCSNGAN:基于Transformer和谱归一化CNN的图像生成模型[J].计算机应用研究,2024(4):1221-1227.

作者姓名：	钱惠敏毛邱凌陈实韩怡星吕本杰

作者单位：	河海大学人工智能与自动化学院

摘要：	生成对抗网络(generative adversarial network, GAN)已成为图像生成问题中常用的模型之一，但是GAN的判别器在训练过程中易出现梯度消失而导致训练不稳定，以致无法获得最优化的GAN而影响生成图像的质量。针对该问题，设计满足Lipschitz条件的谱归一化卷积神经网络(CNN with spectral normalization, CSN)作为判别器，并采用具有更强表达能力的Transformer作为生成器，由此提出图像生成模型TCSNGAN。CSN判别器网络结构简单，解决了GAN模型的训练不稳定问题，且能依据数据集的图像分辨率配置可调节的CSN模块数，以使模型达到最佳性能。在公共数据集CIFAR-10和STL-10上的实验结果表明，TCSNGAN模型复杂度低，生成的图像质量优；在火灾图像生成中的实验结果表明，TCSNGAN可有效解决小样本数据集的扩充问题。
关键词：	生成对抗网络图像生成 Transformer Lipschitz判别器