基于自监督注意和图像特征融合的文本生成图像方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于自监督注意和图像特征融合的文本生成图像方法

作者姓名：	廖涌卉张海涛金海波

作者单位：	辽宁工程技术大学软件学院,辽宁,葫芦岛,125105;汕头职业技术学院计算机系,广东,汕头,515071

基金项目：	国家自然科学基金（No.62173171）;

摘要：	现有的层级式文本生成图像的方法在初始图像生成阶段仅使用上采样进行特征提取,上采样过程本质是卷积运算,卷积运算的局限性会造成全局信息被忽略并且远程语义无法交互。虽然已经有方法在模型中加入自注意力机制,但依然存在图像细节缺失、图像结构性错误等问题。针对上述存在的问题,提出一种基于自监督注意和图像特征融合的生成对抗网络模型SAF-GAN。将基于ContNet的自监督模块加入到初始特征生成阶段,利用注意机制进行图像特征之间的自主映射学习,通过特征的上下文关系引导动态注意矩阵,实现上下文挖掘和自注意学习的高度结合,提高低分辨率图像特征的生成效果,后续通过不同阶段网络的交替训练实现高分辨率图像的细化生成。同时加入了特征融合增强模块,通过将模型上一阶段的低分辨率特征与当前阶段的特征进行融合,生成网络可以充分利用低层特征的高语义信息和高层特征的高分辨率信息,更加保证了不同分辨率特征图的语义一致性,从而实现高分辨率的逼真的图像生成。实验结果表明,相较于基准模型（AttnGAN）,SAF-GAN模型在IS和FID指标上均有改善,在CUB数据集上的IS分数提升了0.31,FID指标降低了3.45;在COCO数据集上的IS分数提升了2.68,FID指标降低了5.18。SAF-GAN模型能够有效生成更加真实的图像,证明了该方法的有效性。
关键词：	计算机视觉生成对抗网络文本生成图像 CotNet 图像特征融合
收稿时间：	2023-03-24
修稿时间：	2023-04-07

	点击此处可从《液晶与显示》浏览原始摘要信息
	点击此处可从《液晶与显示》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏