首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
用卷积网络进行人体行为识别是毫米波雷达的一个热门研究方向。由于卷积网络结构的缺陷性,而且目前用于人体行为识别公开的雷达领域数据样本量过少,传统深度学习算法对雷达微多普勒图像的识别率不高,且在训练过程中容易出现过拟合的现象。针对上述问题,本文提出一种融合快照集成与迁移学习的雷达人体行为识别算法。首先,针对深度卷积网络无法提取图像全局特征的问题,该算法通过搭建Vision Transformer(VIT)模型引入注意力机制。其次,通过VIT模型在公开自然数据集上进行任务迁移和特征空间的迁移,解决微多普勒图像的识别过拟合的问题。最后,利用基于快照集成的投票机制算法,提升模型对复杂雷达微多普勒图像的识别能力。试验结果表明,在目标任务数据集样本量少、背景复杂的情况下,该算法能在不增加训练成本的前提下提升微多普勒图像的识别准确率,在VIT模型下该算法识别准确率达到了89.25%,优于经典卷积神经网络。  相似文献   

2.
针对小麦锈病识别率不高和病症难以判断问题,提出一种基于注意力机制(Attention Mechanism, AT)的残差网络模型(Residual Network, ResNet)。该模型利用ResNet网络能够抑制梯度弥散的优势,并引入注意力机制对小麦锈病特征因子赋予权重。对输入的小麦锈病图像进行通道注意力权重赋值,并提取图像空间细粒度特征完成小麦锈病检测。研究结果表明:该网络模型在Wheat-data数据集上平均识别精确率为95.20%,F1-score为96.35%;与非注意力ResNet网络模型相比其平均识别精确率和F1-score平均提高0.63%和1.03%。通过对网络模型参数和识别准确率分析,表明AT-ResNet100网络模型具有较好的性能。  相似文献   

3.
自从注意力机制在自然语言处理领域取得了巨大成功,其被引入了语音情感识别任务中,使各种语音情感识别模型的性能获得了提高。为了能在深度循环神经网络中更加高效地利用注意力机制,对传统的注意力机制进行了推广,提出了基于分段的注意力机制,并将其应用于深度循环神经网络中。在CASIA语音情感数据集上的实验结果证明,这一方法能够有效提高模型性能,并大幅提高模型训练速度。  相似文献   

4.
军事武器实体识别是军事领域本体构建的一项重要任务,基于深度学习方法实现自动军事武器实体识别能够提升军事情报信息检索的效率.为提升军事武器实体识别的精确率,面向网络公开非结构化军事新闻数据,提出了一种结合双层多头自注意力机制和BiLSTM-CRF模型的武器实体识别方法.在BiLSTM-CRF模型的基础上,采用双层自注意力...  相似文献   

5.
本文提出一种基于姿态估计模型与非局部注意力机制的遮挡行人重识别方法,利用姿态估计器获得图像中的非遮挡局部人体,并引入非局部注意力机制解决特征的长距离依赖问题,使得网络的关注度集中在非遮挡部分,实现遮挡场景下的精确行人重识别任务。通过实验验证了本文所提出方法在遮挡数据集上取得了先进的表现。  相似文献   

6.
图像描述的任务是根据输入图像自动生成描述该图像的语句,属于计算机视觉与自然语言处理的交叉领域.针对传统注意力机制提取特征能力不足、模型复杂且训练困难等问题,本文提出了一种改进注意力机制的图像描述模型.在传统注意力机制的基础上引入高效通道注意模块,在提升特征提取效果的同时降低模型复杂度,在保证性能的同时提高模型效率,更好...  相似文献   

7.
针对视觉问答任务中问题特征与图像特征缺乏交互推理关系的问题,提出了图像与问题双引导注意力机制视觉问答算法.模型结构主要由问题特征注意力模块、图像特征注意力模块、问题与图像双引导注意力模块、特征融合模块4部分构成.该算法先针对问题特征和图像特征分别使用自我注意力机制实现特征的自我加强,然后引入图像与问题双引导注意力机制,...  相似文献   

8.
目标识别是合成孔径雷达(Synthetic Aperture Radar,SAR)图像解译的重要步骤。鉴于卷积神经网络(Convolutional Neural Network, CNN)在自然图像分类领域表现优越,基于CNN的SAR图像目标识别方法成为了当前的研究热点。SAR图像目标的散射特征往往存在于多个尺度当中,且存在固有的噪声斑,含有冗余信息,因此,SAR图像目标智能识别成为了一项挑战。针对以上问题,本文提出一种多尺度注意力卷积神经网络,结合多尺度特征提取和注意力机制,设计了基于注意力的多尺度残差特征提取模块,实现了高精度的SAR遥感图像目标识别。该方法在MSTAR数据集10类目标识别任务中的总体准确率达到了99.84%,明显优于其他算法。在测试集加入4种型号变体后,10类目标识别任务中的总体准确率达到了99.28%,验证了该方法在复杂情况下的有效性。  相似文献   

9.
胡祥  李英娜 《电视技术》2021,45(5):125-130
在航拍影像中定位绝缘子爆裂的位置是一项艰巨的任务.针对绝缘子和绝缘子爆破位置在图像中占比过小、背景复杂以及拍摄图像角度和大小不一等问题,采用一种注意力机制与Faster R-CNN和U-net相结合的绝缘子识别模型,对某电力科学研究院提供的绝缘子航拍图像进行测试和对比试验,结果表明,该模型识别绝缘子的平均精度(Average Precision,AP)为92.1%,识别绝缘子爆裂故障的平均精度(AP)为91.9%.所提出的绝缘子自爆故障检测模型在绝缘子定位、爆裂位置判定等应用方面的效果优于部分经典方法.  相似文献   

10.
针对电路板温度数据诊断率不佳的问题,本文提出了基于红外的SSA CNN GRU电路板芯片故障诊断模型。首先,根据红外热像仪采集芯片温度数据,建立多维特征模型;然后,在故障诊断模型输入端和CNN GRU通道分别添加注意力机制,构建双注意力结构,自适应识别有效数据段和提取红外图像有效特征;接着,利用麻雀搜索算法优化注意力机制权值分配,获取全局最优超参数;最后搭建SSA CNN GRU故障诊断模型,实现芯片故障模式的高精度诊断。实验采用电源电路板进行可靠性分析,实验结果表明,本文算法在诊断精度可达9873,且稳定性、可靠性方面均优于对比算法。  相似文献   

11.
本文针对目前应用全局图像训练卷积神经网络可能会受到若干无关噪声区域的影响,易导致视网膜OCT图像黄斑病变识别或诊断错误等问题,提出了一种改进的注意力引导四分支卷积神经网络的视网膜OCT图像黄斑病变识别方法.采用改进注意力引导卷积神经网络框架,通过集成全局分支、局部分支和层分割分支构成融合分支,利用注意力热图对重要区域进行掩膜和训练,减少视网膜OCT图像噪声的干扰和黄斑病变识别错误率,通过与VGG16和IDL 2种方法在公开数据集上进行了实验验证比较.结果表明,文中方法在视网膜OCT图像数据集上对于识别准确度和识别性能的提升具有显著性的作用.  相似文献   

12.
针对资源受限、高动态复杂场景下的红外弱小目标检测识别问题,基于时序注意力机制提出了一种轻量化的智能检测识别通用算法框架,使其具备自动提取和学习目标时序变化信息的能力。所提出的算法框架主要在基于卷积神经网络模型的单帧检测识别算法基础上,结合了基于循环神经网络相关模型构造的时序注意力模块,从而使对应算法模型具有自动关联多帧之间目标特征信息变化的功能。在相关红外弱小目标图像数据集上,通过对算法框架与其他方法进行对比,结果表明所提出算法框架显著提升了对红外弱小目标的检测识别准确率。  相似文献   

13.
张弘  刘保洋  高月 《激光杂志》2023,(12):47-55
针对X光安检图像中存在背景信息复杂以及物体相互遮挡的情况,以YOLOv5m模型为基础,改进自注意力机制,提出新的视觉自注意力机制与卷积模型结合的叠加混合模型YOLOv5m-CRCS。该网络在视觉自注意力机制中,加入相对位置编码,引入高效变体卷积(TVConv)和动态归一化(DTN),增强图像特征中的全局语义信息和位置信息。在网络特征融合阶段将坐标注意力(CA)与改进后的自注意力机制结合,进一步加强输出特征中的位置关系信息,同时引入改进的双自注意力模块,将残差卷积模块(CSPLayer)与双自注意力叠加混合,使得每个输出在原有特征的基础上增加了全局特征的相关性。在X光安检数据集上的实验结果表明,与原始目标检测网络相比,所提出模型的识别精度提高了4.72%,明显降低了由于X光安检图像中的背景信息复杂、相互遮挡而出现的漏检情况。  相似文献   

14.
黄晨  裴继红  赵阳 《信号处理》2022,38(1):64-73
目前绝大多数的行人属性识别任务都是基于单张图像的,单张图像所含信息有限,而图像序列中包含丰富的有用信息和时序特征,利用序列信息是提高行人属性识别性能的一个重要途径.本文提出了结合时序注意力机制的多特征融合行人序列图像属性识别网络,该网络除了使用常见的空-时二次平均池化特征聚合和空-时平均最大池化特征聚合提取序列的特征外...  相似文献   

15.
针对苹果幼果与其背景相似度高的检测问题,图像处理方法被提出来增强目标的注意力机制,并通过YOLOV4目标检测框架进行目标检测任务。近年来,目标检测技术成功应用于人脸识别、自动驾驶等领域,该文针对在苹果幼果检测的近景阶段中,为了提高采集到的数据集中识别效果,提出通过BG方法和RTHTR方法提高幼果目标在图像中的特征值和目标的注意力机制。实验结果表明,经过BG图像处理过程得到的目标检测数据在YOLOV4网络结构中mAP值由YOLOV4网络原数据集的75.38%提升4.14%,经过RTHTR图像处理过程的目标检测数据的mAP值达到82.29%。  相似文献   

16.
自然场景图像中的阴影是直接或间接承接场景信息的载体,可以有效反映场景的环境信息,因此,阴影检测是图像处理领域中的一项重要研究任务。针对阴影检测任务存在的漏检、误检等问题,提出了一种应用于阴影检测任务的网络。引入多任务特征学习机制,利用阴影的边缘和数量信息分别实现特征学习的细节和全局约束,有效地定位阴影区域。此外还利用注意力机制增强特征信息,结合反馈机制通过迭代反馈的方式增强模型对阴影区域特征的学习,提高了模型性能,使模型能够准确区分阴影区域和非阴影区域。实验结果表明,该网络模型与其他经典方法相比在SBU数据集和ISTD数据集上取得了最低的平衡错误率指标,可以更加准确地检测单幅图像中存在的阴影区域且边缘划分准确,检测结果令人满意。  相似文献   

17.
针对无法对面部表情进行精确识别的问题,提出了基于ResNet50网络融合双线性混合注意力机制的网络模型。针对传统池化算法造成图像特征提取残缺、模糊等问题,提出了一种基于Average-Pooling算法的自适应池化权重算法,同时基于粒子群算法对卷积神经网络模型超参数进行自适应调节,从而进一步提升模型识别精度。基于改进的网络模型,设计了一款实时面部表情识别系统。经验证,在Fer2013数据集和CK+数据集上,改进的模型在测试集中的识别精度分别为73.51%和99.86%。  相似文献   

18.
针对低信噪比条件下的扩频与常规调制信号分类精度低的问题,该文提出一种基于生成式对抗网络(GAN)、卷积神经网络(CNN)和长短期记忆(LSTM)网络的多模态注意力机制信号调制识别方法。首先生成待识别信号的时频图像(TFIs),并利用GAN实现TFIs降噪处理;然后将信号的同相正交数据(I/Q data)与TFIs作为模型输入,并搭建基于CNN的TFIs识别支路和基于LSTM的I/Q数据识别支路;最后,在模型中添加注意力机制,增强I/Q数据和TFIs中重要特征对分类结果的决定作用。实验结果表明,该文所提方法相较于单模态识别模型以及其它基线模型,整体分类精度有效提升2%~7%,并在低信噪比条件下具备更强的特征表达能力和鲁棒性。  相似文献   

19.
图像描述生成任务的目的是生成语法准确、语义连贯的句子,以表达给定图像的内容,具有很好的实用价值. Transformer模型在完成该任务时获得显著优势.针对Transformer存在注意力复杂度高以及训练期间产生内部协变量偏移的问题,提出外部注意和二次层归一化的图像描述生成模型.一方面,在编码端使用外部注意力,通过可学习的外部共享记忆单元,将注意力机制的复杂度从二次幂降为一次幂,并学习到基于整个数据集的先验知识,挖掘了样本间的潜在相关性,使模型生成的文本描述内容更加准确.同时,分别对注意力图的行和列作归一化处理,消除输入特征大小对注意力的影响.另一方面,定义二次层归一化并用于Transformer模型中,在维持输入数据分布稳定的同时,提高了数据表达能力.在MS COCO数据集上进行的仿真实验表明,相对于Up-Down、SRT、M2等代表性模型,改进后的模型在METEOR、ROUGE、CIDEr和SPICE指标上分别取得了29.3、58.6、131.7和22.7的分数.实验结果表明,改进后模型的语义表达更加充分、描述更加准确,改进是有效的.  相似文献   

20.
张志昌  曾扬扬  庞雅丽 《电子学报》2000,48(11):2162-2169
文本蕴含识别旨在识别两个给定句子之间的逻辑关系.本文通过构造语义角色和自注意力机制融合模块,把句子的深层语义信息与Transformer模型的编码部分相结合,从而增强自注意力机制捕获句子语义的能力.针对中文文本蕴含识别在数据集上存在规模小和噪声大的问题,使用大规模预训练语言模型能够提升模型在小规模数据集上的识别性能.实验结果表明,提出的方法在第十七届中国计算语言学大会中文文本蕴含识别评测数据集CNLI上的准确率达到了80.28%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号