首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对视觉问答(VQA)任务中现存深度协同注意模型只考虑问题引导图像的单向注意方式,导致多模态学习交互性不足的问题,提出一种多模态双向导向注意力网络.该网络由多模态特征提取模块、双向导向注意力模块、特征融合模块以及分类器组成.将提取出的图像和问题特征分别经过层层注意后输出加权的注意特征;经过特征线性融合后送入softma...  相似文献   

2.
为解决视觉问答(Visual Question Answering,VQA)算法中问题与图像缺乏推理关系的难题,提出了增强问题有用信息的问题引导图像注意力机制(Question Guide Image Attention,QGIA)视觉问答算法.该算法在问题特征提取过程中对关键词进行筛选,加强对问题有效信息的关注,实现...  相似文献   

3.
随着深度学习的兴起和不断发展,视觉问答领域的研究取得了显著进展,当前较多视觉问答模型通过引入注意力机制和相关迭代操作来提取图像区域与高频疑问词对的相关性,但在获取图像与问题的空间语义关联方面的有效性较低,从而影响答案的准确性.为此,提出一种基于MobileNetV3网络及注意力特征融合的视觉问答模型,首先,为优化图像特...  相似文献   

4.
图像描述的任务是根据输入图像自动生成描述该图像的语句,属于计算机视觉与自然语言处理的交叉领域.针对传统注意力机制提取特征能力不足、模型复杂且训练困难等问题,本文提出了一种改进注意力机制的图像描述模型.在传统注意力机制的基础上引入高效通道注意模块,在提升特征提取效果的同时降低模型复杂度,在保证性能的同时提高模型效率,更好...  相似文献   

5.
针对低光照增强任务缺乏参考图像及现有算法存在的色彩失真、纹理丢失、细节模糊、真值图像获取难等问题,本文提出了一种基于Retinex理论与注意力机制的多尺度加权特征低光照图像增强算法。该算法通过基于Unet架构的特征提取模块对低光照图像进行多尺度的特征提取,生成高维度的多尺度特征图;建立注意力机制模块凸显对增强图像有利的不同尺度的特征信息,得到加权的高维特征图;最后反射估计模块中利用Retinex理论建立网络模型,通过高维特征图生成最终的增强图像。设计了一个端到端的网络架构并利用一组自正则损失函数对网络模型进行约束,摆脱了参考图像的约束,实现了无监督学习。最终实验结果表明本文算法在增强图像的对比度与清晰度的同时维持了较高的图像细节与纹理,具有良好的视觉效果,能够有效增强低光照图像,视觉质量得到较大改善;并与其他多种增强算法相比,客观指标PSNR和SSIM得到了提高。  相似文献   

6.
针对传统去雾算法容易依赖先验知识以及恢复出来的清晰图像会产生颜色失真等问题,本文提出一种基于双注意力机制的雾天图像清晰化算法。首先将雾图输入编码器,经过下采样后得到特征图像;特征提取模块将多个特征提取基本块联结在一起,每个基本块由局部残差学习和特征注意模块组成,提高图像质量以及图像特征信息的利用率,增加网络训练的稳定性;然后通过通道注意力与多尺度空间注意力并行的结构处理特征图像,使得网络更加关注细节特征,提取更多关键信息,同时提高网络效率;最后将融合后的特征图像输入解码器中,经过多级映射,得到与输入大小匹配的雾密度图。实验结果表明,不论是对合成雾天图像或者真实雾天图像,本文算法能够高效地进行去雾处理,得到更自然的清晰图像。  相似文献   

7.
杨浪  张奕 《激光杂志》2023,(6):108-113
针对图像中累积的雨水严重干扰高层视觉算法运行的问题,提出了一种高效的图像去雨方法。该方法利用注意力机制设计了一个多尺度特征融合去雨网络。首先用一个预处理模块提取出雨水的浅层特征,再将浅层特征送入多尺度特征融合模块获得深层次的特征,在多尺度特征融合模块中引入注意力机制将这些特征进行融合,提高模块中使用平滑扩张卷积减少伪影问题。实验结果表明,该方法在公开雨水数据集Rain100 H、Rain100 L和Rain12上获得的峰值信噪比(PSNR)和结构相似比(SSIM)指标相比其它方法分别平均提高了0.93 dB和1.43%,获得了更清晰的去雨结果。  相似文献   

8.
赵琰  赵凌君  匡纲要 《电子学报》2021,49(9):1665-1674
针对合成孔径雷达(Synthetic Aperture Radar,SAR)图像中飞机目标散射点离散化程度高,周围背景干扰复杂,现有算法对飞机浅层语义特征表征能力弱等问题,本文提出了基于注意力特征融合网络(Attention Feature Fu-sion Network,AFFN)的SAR图像飞机目标检测算法.通过引入瓶颈注意力模块(Bottleneck Attention Module,BAM),本文在AFFN中构建了包含注意力双向特征融合模块(Attention Bidirectional Feature Fusion Module,ABFFM)与注意力传输连接模块(Attention Transfer Connection Block,ATCB)的注意力特征融合策略并合理优化了网络结构,提升了算法对飞机离散化散射点浅层语义特征的提取与判别.基于自建的Gaofen-3与TerraSAR-X卫星图像混合飞机目标实测数据集,实验对AFFN与基于深度学习的通用目标检测以及SAR图像特定目标检测算法进行了比较,其结果验证了AFFN对SAR图像飞机目标检测的准确性与高效性.  相似文献   

9.
张弘  刘保洋  高月 《激光杂志》2023,(12):47-55
针对X光安检图像中存在背景信息复杂以及物体相互遮挡的情况,以YOLOv5m模型为基础,改进自注意力机制,提出新的视觉自注意力机制与卷积模型结合的叠加混合模型YOLOv5m-CRCS。该网络在视觉自注意力机制中,加入相对位置编码,引入高效变体卷积(TVConv)和动态归一化(DTN),增强图像特征中的全局语义信息和位置信息。在网络特征融合阶段将坐标注意力(CA)与改进后的自注意力机制结合,进一步加强输出特征中的位置关系信息,同时引入改进的双自注意力模块,将残差卷积模块(CSPLayer)与双自注意力叠加混合,使得每个输出在原有特征的基础上增加了全局特征的相关性。在X光安检数据集上的实验结果表明,与原始目标检测网络相比,所提出模型的识别精度提高了4.72%,明显降低了由于X光安检图像中的背景信息复杂、相互遮挡而出现的漏检情况。  相似文献   

10.
文渊博  高涛  陈婷  张千禧 《电子学报》2023,(10):2812-2820
现有基于自注意力网络Transformer的单图像去雨算法尽管在合成雨图上在取得良好效果,但却造成巨大的计算负担,且无法有效处理真实雨图.对此,本文提出一种频率引导的双稀疏自注意力单图像去雨算法(Frequency-guided Dual Sparse self-Attention TransFormer,FDSATFormer).首先,该算法利用空间稀疏因子和通道降维因子在提取准确全局信息的同时减少计算量,进而提出双稀疏自注意力特征学习网络(Dual Sparse self-attention Feature Leraning, DSFL)以解决Transformer在高分辨率雨图上难以表征自注意力的问题.其次,该算法通过探究图像去雨前后的频谱变化,提出频率引导的特征增强模块(Frequency-guided Feature Enhancer,FFE),其利用频域的全局信息指导特征编码阶段对空域特征的学习.此外,现有去雨网络的编解码结构采用相近的设计,这导致网络的整体计算负担倍增.对此,本文提出层级特征解码重建网络(Hierarchical Feature Decoding and ...  相似文献   

11.
诊所     
《数字通信》2005,(17):92-93
最近松下出了一款号称1677万色屏幕的手机,型号是VS3吧,不知道这1677万色的屏幕到底比26万色的要好多少呢?我可是对屏幕很在意的!  相似文献   

12.
杨思春  戴新宇  陈家骏 《电子学报》2015,43(8):1627-1636
开放域问答是当前自然语言处理和信息检索领域的研究热点,作为开放域问答系统的重要组成部分,问题分类可以缩小答案的搜索空间并决定答案的选择策略.近年来,基于机器学习的问题分类技术受到广泛的关注,相关研究表明问题分类的准确性直接影响问答系统的整体性能.本文从分类体系与数据集、特征提取、分类器设计、性能评测等层面,总结了问题分类技术近年的主要研究成果.重点分析了各种基于监督学习的问题分类方法的特点和不足,讨论了核方法、半监督学习、主动学习、迁移学习等在问题分类中的应用,同时对问题分类技术未来研究动向进行了展望.  相似文献   

13.
随着问答社区网站的兴起,越来越多的用户生成数据积累了起来。这些用户生成数据不仅具有海量的、多样性的等特点,还有着极高的质量和重用价值。为了高效地管理和利用这些数据,近年来研究人员基于这些数据进行了大量的研究和实践,而社区问答中的问题检索就是一个被广泛研究的课题。主要研究了面向大规模社区问答数据的问题检索方法。收集来自Yahoo!Answers等社区网站的超过1.3亿问题和10亿答案的大规模数据,与之前的基于百万量级的数据的问答社区相关研究工作相比有着明显的不同和极高的实用价值。在此数据的基础上,通过查询自动分类方法来提高每次查询效率和效果。在问题检索过程中,提出了应用查询问句和问题的结构信息和语义信息,结合排序学习算法来融合多种不同类别的特征的方法,通过应用训练数据生成排序模型来提高问题检索的相关性和词语不匹配等问题。实验表明,本文应用RankingSVM方法来训练的排序模型在不同数据集上,其准确率等评价指标上都相比以往的方法有着显著的提高。  相似文献   

14.
基于结构化问句实例的自动问答系统   总被引:2,自引:1,他引:1  
研究了一种基于结构化问句实例分析问句的方法,设计了应用该方法时的各种语义知识及其表示,用Xml文档来管理领域知识,在这种知识结构上设计了一种答案抽取的方法。在此基础上,开发了BAQS的原型系统。实验表明方法可行,准确率和召回率可分别达到82.05%和91.95%。对问答系统的设计具有借鉴意义和继续深入研究的价值。  相似文献   

15.
AV问答     
Q 问:我喜欢听甜美的人声和弦乐演奏,最近已配置了一台天进NO.2A3推挽胆机和一对金琅优闲5号书架式信箱3尚需购买一台CD机.  相似文献   

16.
AV问答     
《实用影音技术》2008,(4):88-89
我有一对惠威的M1书架箱.平时用于播放CD音乐:有时我也用这一套音响来播放DVD大片.但播放出来的低音效果很不理想。后来我又买来一个10英寸低音单元的无源“低音炮”.我也还有一台胆机和一台晶体管放大器.但不知用胆机还是晶体管机来推低音炮为好?我的放大器都没有超低音输出接口.不知如何将推动低音炮的放大器与系统连接起来播放低音?  相似文献   

17.
AV问答     
《实用影音技术》2011,(7):86-87
问:我是电脑影音爱好者,常常在电脑上观看网上的视频和电影.有时还播放APE音乐。我的电脑原配的音箱音质不太好.我想要另配一套音箱。不知我配一般的2.1电脑音箱好还是配高保真的2.0音箱好一些?  相似文献   

18.
AV问答     
Q 我是初入门的音响爱好者,前不久看到有发烧友在评论一款音箱时说:“声音速度快捷, 收放自如……”,有点不能理解。我一直认为声音的速度在一定条件下是一致的,不存在因为音箱的性能好坏而影响声音的速度问题。请问这位发烧友的说法是否合理? (甘肃魏频)  相似文献   

19.
AV问答     
问:我是贵刊的老读者,也是音响爱好者。最近看到《电子报》刊登的“普罗音响器材”听评的相关文章。其中的一款度高HDP-17SE型播放机,售价达到1600元,我认为售价已经不低,似乎和我印象中“普罗音响”器材应该是“低价位、高性价比”的要求不太符合。度高HDP-17SE型播放机有何特点?能否用于纯音乐欣赏?(四川梁科)答:据我理解,“普罗音响”并不是纯粹的“低价位”音响。在认定“普罗音响”的要求中,对销售价的要求是“一般不高于估算成本的130%”,也就是说销售价是在成本的基础上加30%的销售费用及少量的利润。也许有人会担心,如果厂家过…  相似文献   

20.
诊所     
《数字通信》2005,(19):92-93
老狼啊!最近我遇到一个特别郁闷的事,我和我朋友同时购买了行货索爱W800c手机,在进行电话簿的联系人查找时,我朋友的就能够使用首字声母进行查询,而我的W800c按照相同的方法却不能进行查询。这是怎么回事呢?而且两个手机的软件版本都是一样的,快帮帮我啊!  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号