基于Transformer交叉注意力的文本生成图像技术 Text-to-Image Generation Technology Based on Transformer Cross Attention期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于Transformer交叉注意力的文本生成图像技术

引用本文：	谈馨悦,何小海,王正勇,罗晓东,卿粼波.基于Transformer交叉注意力的文本生成图像技术[J].计算机科学,2022,49(2):107-115.

作者姓名：	谈馨悦何小海王正勇罗晓东卿粼波

作者单位：	四川大学电子信息学院成都610065

基金项目：	国家自然科学基金(61871278,U1836118)；;四川省科技计划项目(2018HH0143)~~；

摘要：	近年来,以生成对抗网络为基础的从文本生成图像方法的研究取得了一定的进展.文本生成图像技术的关键在于构建文本信息和视觉信息间的桥梁,促进网络模型生成与对应文本描述一致的逼真图像.目前,主流的方法是通过预训练文本编码器来完成对输入文本描述的编码,但这些方法在文本编码器中未考虑与对应图像的语义对齐问题,独立对输入文本进行编码...
关键词：	文本描述生成图像生成对抗网络交叉注意力编码图像生成计算机视觉
Text-to-Image Generation Technology Based on Transformer Cross Attention

TAN Xin-yue,HE Xiao-hai,WANG Zheng-yong,LUO Xiao-dong,QING Lin-bo.Text-to-Image Generation Technology Based on Transformer Cross Attention[J].Computer Science,2022,49(2):107-115.

Authors:	TAN Xin-yue HE Xiao-hai WANG Zheng-yong LUO Xiao-dong QING Lin-bo

Affiliation:	(College of Electronics and Information Engineering,Sichuan University,Chengdu 610065,China)

Abstract:

Keywords:	Text-to-Image generation Generative adversarial networks Cross-attention encoding Image generation Computer vision
本文献已被维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏