结合互信息最大化的文本到图像生成方法 Text-to-image generation combined with mutual information maximization期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

结合互信息最大化的文本到图像生成方法

引用本文：	莫建文,徐凯亮,林乐平,欧阳宁.结合互信息最大化的文本到图像生成方法[J].西安电子科技大学学报,2019,46(5):180-188.

作者姓名：	莫建文徐凯亮林乐平欧阳宁

作者单位：	桂林电子科技大学信息与通信学院, 广西壮族自治区桂林 541004

基金项目：	国家自然科学基金(61661017);广西自然科学基金(2016GXNSFAA380149)

摘要：	在堆叠式文本到图像生成模型的基础上,针对其生成样本分布不均匀导致多样性不足的问题,提出了一种结合局部-全局互信息最大化的堆叠式文本到图像的生成对抗网络模型。首先利用生成模型将全局向量解耦得到不同尺度特征图;然后通过最大化特征图与全局向量间的互信息,对图像全局特征与文本描述的相关性进行增强;最后,将特征图提取为局部位置特征向量,通过最大化局部位置特征向量与全局向量之间的平均互信息,加强局部位置特征与文本描述的相关性,得到更紧密的文本到图像的映射关系。在CUB数据集上的实验验证了该方法能有效地提高生成样本的多样性,同时在主观评价上能生成语义精确度更高的样本,更接近自然图像。
关键词：	图像生成互信息生成对抗网络局部位置特征向量
收稿时间：	2019-03-05
Text-to-image generation combined with mutual information maximization

MO Jianwen,XU Kailiang,LIN Leping,OUYANG Ning.Text-to-image generation combined with mutual information maximization[J].Journal of Xidian University,2019,46(5):180-188.

Authors:	MO Jianwen XU Kailiang LIN Leping OUYANG Ning

Affiliation:	School of Information and Communication Engineering,Guilin University of Electronic Technology,Guilin 541004,China

Abstract:

Keywords:	image generation information generative adversarial networks local position feature vector

	点击此处可从《西安电子科技大学学报》浏览原始摘要信息
	点击此处可从《西安电子科技大学学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏