首页 | 本学科首页   官方微博 | 高级检索  
     

基于Transformer交叉注意力的文本生成图像技术
引用本文:谈馨悦,何小海,王正勇,罗晓东,卿粼波.基于Transformer交叉注意力的文本生成图像技术[J].计算机科学,2022,49(2):107-115.
作者姓名:谈馨悦  何小海  王正勇  罗晓东  卿粼波
作者单位:四川大学电子信息学院 成都610065
基金项目:国家自然科学基金(61871278,U1836118);;四川省科技计划项目(2018HH0143)~~;
摘    要:近年来,以生成对抗网络为基础的从文本生成图像方法的研究取得了一定的进展.文本生成图像技术的关键在于构建文本信息和视觉信息间的桥梁,促进网络模型生成与对应文本描述一致的逼真图像.目前,主流的方法是通过预训练文本编码器来完成对输入文本描述的编码,但这些方法在文本编码器中未考虑与对应图像的语义对齐问题,独立对输入文本进行编码...

关 键 词:文本描述生成图像  生成对抗网络  交叉注意力编码  图像生成  计算机视觉

Text-to-Image Generation Technology Based on Transformer Cross Attention
TAN Xin-yue,HE Xiao-hai,WANG Zheng-yong,LUO Xiao-dong,QING Lin-bo.Text-to-Image Generation Technology Based on Transformer Cross Attention[J].Computer Science,2022,49(2):107-115.
Authors:TAN Xin-yue  HE Xiao-hai  WANG Zheng-yong  LUO Xiao-dong  QING Lin-bo
Affiliation:(College of Electronics and Information Engineering,Sichuan University,Chengdu 610065,China)
Abstract:
Keywords:Text-to-Image generation  Generative adversarial networks  Cross-attention encoding  Image generation  Computer vision
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号