首页 | 本学科首页   官方微博 | 高级检索  
     

结合互信息最大化的文本到图像生成方法
引用本文:莫建文,徐凯亮,林乐平,欧阳宁.结合互信息最大化的文本到图像生成方法[J].西安电子科技大学学报,2019,46(5):180-188.
作者姓名:莫建文  徐凯亮  林乐平  欧阳宁
作者单位:桂林电子科技大学 信息与通信学院, 广西壮族自治区 桂林 541004
基金项目:国家自然科学基金(61661017);广西自然科学基金(2016GXNSFAA380149)
摘    要:在堆叠式文本到图像生成模型的基础上,针对其生成样本分布不均匀导致多样性不足的问题,提出了一种结合局部-全局互信息最大化的堆叠式文本到图像的生成对抗网络模型。首先利用生成模型将全局向量解耦得到不同尺度特征图;然后通过最大化特征图与全局向量间的互信息,对图像全局特征与文本描述的相关性进行增强;最后,将特征图提取为局部位置特征向量,通过最大化局部位置特征向量与全局向量之间的平均互信息,加强局部位置特征与文本描述的相关性,得到更紧密的文本到图像的映射关系。在CUB数据集上的实验验证了该方法能有效地提高生成样本的多样性,同时在主观评价上能生成语义精确度更高的样本,更接近自然图像。

关 键 词:图像生成  互信息  生成对抗网络  局部位置特征向量  
收稿时间:2019-03-05

Text-to-image generation combined with mutual information maximization
MO Jianwen,XU Kailiang,LIN Leping,OUYANG Ning.Text-to-image generation combined with mutual information maximization[J].Journal of Xidian University,2019,46(5):180-188.
Authors:MO Jianwen  XU Kailiang  LIN Leping  OUYANG Ning
Affiliation:School of Information and Communication Engineering,Guilin University of Electronic Technology,Guilin 541004,China
Abstract:
Keywords:image generation  information  generative adversarial networks  local position feature vector  
点击此处可从《西安电子科技大学学报》浏览原始摘要信息
点击此处可从《西安电子科技大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号