首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对乳腺钼靶图像中良恶性肿块难以诊断的问题,提出一种基于注意力机制与迁移学习的乳腺钼靶肿块分类方法,并用于医学影像中乳腺钼靶肿块的良恶性分类.首先,构建一种新的网络模型,该模型将注意力机制CBAM(Convolutional Block Attention Module)与残差网络ResNet50相结合,用于提高网络对...  相似文献   

2.
为解决卷积神经网络(CNN)和循环神经网络(RNN)处理文本分类任务时,由于文本特征稀疏造成的关键特征信息丢失、模型性能不高和分类效果不佳等问题.提出一种基于多通道注意力机制的文本分类模型,首先利用字词融合的形式进行向量表示,然后利用CNN和BiLSTM提取文本的局部特征和上下文关联信息,接着以注意力机制对各通道的输出...  相似文献   

3.
全卷积神经网络FCN-8S在进行多尺度特征融合时,由于未能考虑不同尺度特征各自的特点进行充分融合,导致分割结果精度较低,针对这一问题,文章提出了一种基于注意力机制的多尺度特征融合的全卷积神经网络模型.该模型基于注意力机制对FCN-8S中的不同尺度特征进行加权特征融合,以相互补充不同尺度特征包含的不同信息,进而提升网络的...  相似文献   

4.
针对红外和可见光目标检测方法存在的不足,将深度学习技术与多源目标检测相结合,提出了一种基于自适应注意力机制的目标检测方法。该方法首先以深度可分离卷积为核心构建双源特征提取结构,分别提取红外和可见光目标特征。其次,为充分互补目标多模态信息,设计了自适应注意力机制,以数据驱动的方式加权融合红外和可见光特征,保证特征充分融合的同时降低噪声干扰。最后,针对多尺度目标检测,将自适应注意力机制结合多尺度参数来提取并融合目标全局和局部特征,提升尺度不变性。通过实验表明,所提方法相较于同类型目标检测算法能够准确高效地在复杂场景下实现目标识别和定位,并且在实际变电站设备检测中,该方法也体现出更高的泛化性和鲁棒性,可以有效辅助机器人完成目标检测任务。  相似文献   

5.
针对基于机器学习的可见光室内定位方法存在的手工调参、定位精度低等问题,结合蛇优化(Snake Optimization, SO)算法的寻优能力与卷积神经网络(Convolutional Neural Network, CNN)处理复杂非线性问题的能力,提出了一种基于SO-CNN模型的可见光室内定位优化方法。在考虑多径效应影响的情况下,采集每个位置点处的信噪比和对应位置坐标构建指纹数据库,对SO-CNN模型进行训练和测试,以得到最佳定位模型。实验结果表明,在5 m×5 m×3 m的房间中,与未经优化的CNN相比,该方法的平均定位误差降低了35.13%;与反向传播神经网络(Back Propagation Neural Network, BPNN)、多层感知器(Multilayer Perceptron, MLP)、SO-MLP相比,该方法的平均定位误差分别降低了54.75%,48.08%,37.01%。  相似文献   

6.
7.
针对当前的在线协作讨论交互文本分类仅采用深度学习方法时,存在无法充分获取上下文语义关联以及忽略关键特征词,造成分类结果准确率下降的问题,文中提出一种结合注意力机制的深度学习网络模型—CNNBiLSTM-Attention,进一步强化文本的语义特征。利用该模型对在线协作讨论活动中产生的12000条交互文本进行分类,分类结果表明,CNN-BiLSTM-Attention的分类准确率整体上可达到82.40%,有效提升了文本分类的效果。  相似文献   

8.
本文提出一个基于卷积注意力机制的文本分类方法,该方法利用卷积神经网络抓取上下文信息,自适应生成注意力权重,并与LSTM模型相融合进行分类。在IMDB影评分类测试中,本文所提方法的分类准确率比基准模型高3.6%,证明了本文所提方法的有效性。  相似文献   

9.
可见光通信凭借频谱资源丰富、不易受电磁污染和绿色安全等优势有望成为6G的关键备选技术之一,也给高精度室内定位提供了新的思路。然而,在可用作锚点的LED数量不足或被严重遮挡等恶劣室内环境下,定位精度会大幅下降。为此,研究了一种基于多节点协作的鲁棒可见光智能定位方法,在考虑可见光非视距传播和用户终端朝向动态变化的情况下,通过建立用户终端之间的协作定位机制获取互信息增益,并设计一种卷积-循环神经网络,且对协作定位精度性能进行了理论分析。仿真结果表明,引入协作定位机制能有效提高恶劣条件下的定位性能。  相似文献   

10.
图像压缩是一个基础性的研究领域,许多压缩标准已经发展了几十年。最近,基于卷积神经网络的图像有损压缩逐渐取得一系列显著的进展。目前,最有效的基于学习的图像编解码器采用自动编码器的形式,采用了通道调节(CC)和潜在残差预测(LRP)来提高压缩性能,但图像仍然存在空间上的冗余,从而影响到率失真性能。为了使这一问题得到改善,文章提出使用RBAM注意力模块融入网络体系结构中,以提高性能。实验结果表明,用峰值信噪比(PSNR)作为评价指标,文章所提出的网络结构优于传统方法,达到了更好的率失真性能。  相似文献   

11.
本文针对人体行为识别模型中鉴别能力有限的问题,同时避免双流中计算光流的较大时间成本,提出基于通道注意力机制和三维卷积时空注意力模型的行为识别方法。首先,该卷积网络模型使用ResNeXt残差模块,利用三维卷积核有效地提取视频帧时空特征。然后,在此基础上给每个残差模块增加通道注意力机制学习不同特征图的权重,进而形成基于通道域的注意力权重,增强网络结构对人体行为的表征能力。最后,在UCF-101和HMDB-51数据集上,通过交叉熵损失函数训练不同网络深度的行为分类模型。实验结果表明,该模型可以有效提取视频中的时空特征,并在人体行为识别任务中有着较高效率和优秀的准确度。  相似文献   

12.
本文研究的图像语义分割是计算机视觉研究的重要部分,为提高场景图像语义分割的准确率,且考虑到基于全卷积神经网络的双重语义分割模型(Dual-Attention)存在边缘分割不均匀、正负样本不平衡的问题。本文采用边缘模块,增强边缘分割能力并且优化图像的边缘细节;采用一种基于样本距离的损失函数,来调节正负样本。在场景cityscapes数据集上进行了实验与验证,结果表明改进之后的模型单尺度平均交并比(MIoU)相比原算法相对提高2.96%。它能够更加精细地分割目标,较好地解决分割边界不精细,有效地抑制边界区域分割的不均匀问题。  相似文献   

13.
微表情是一种反映人真实情感的自发性面部变化。由于微表情变化微弱且持续时间短暂,传统的神经网络难以提取到类间差异极小的微表情特征。针对上述问题,提出了一种改进的ECANet34-DA网络,在残差网络的主干部分加入DA模块和不降维局部跨通道交互策略的高效通道注意力(Efficient Channel Attention, ECA),能够关注到更细微的表情变化。使用峰值帧附近序列组成中间帧序列作为输入图像,有效解决数据量有限问题。将宏表情数据集Fer2013的先验知识通过迁移学习应用到微表情识别。将ECANet34-DA网络模型在主流数据集CASME II,SMIC和SAMM上进行实验,使用留一人交叉验证方法表明此方法有效提高了识别精度,在CASME II数据集5类微表情识别中取得了85.44%的准确率和81.96%的未加权F1指数(UF1)。  相似文献   

14.
针对动态环境下基于接收信号强度的传统可见光定位方法定位精度低、稳定性差等问题,提出一种基于接收信号强度比的改进北方苍鹰算法(NGO)优化Elman神经网络(RNGO-Elman)的室内可见光定位系统。提出选择一个辅助参考点,将待测参考点与辅助参考点的接收信号强度比值和接收机的真实位置作为训练集数据,建立不受动态环境影响的指纹数据库。针对NGO算法收敛速度慢、容易陷入局部最优等问题,利用折射反向学习策略初始化种群,增加种群多样性,引入非线性权重因子来加快收敛速度,避免陷入局部最优。使用优化后的NGO算法来优化Elman神经网络的初始权值和阈值,构建RNGO-Elman动态定位预测模型。仿真结果表明,在4m×4m×3m的实验空间下,优化后的RNGO-Elman定位模型平均定位误差为1.34cm,定位精度相较于Elman定位算法、NGO-Elman定位算法分别提高了82%,21%。在LED发射功率波动时,基于RSSR的RNGO-Elman定位误差为1.29cm,1.38cm。所提可见光定位方法具有定位精度高、定位性能稳定等优点。  相似文献   

15.
戴妍妍  金赟  马勇  杨子秀  俞佳佳 《信号处理》2021,37(10):1835-1842
传统语音处理方式是把语音样本分割成固定长度的片段,但这种语音样本的切割会导致语音情感分类准确性下降。本文引入循环填充法处理可变长度的log-Mel谱图,该方法能够更好的利用时间动态信息,同时可以减少填充的无效数据对模型参数学习的干扰。由于人类的情感只能在语音中某些特定的时刻出现,为了寻找关键情感特征,本文构建了基于高效通道注意力机制的语音情感识别模型,其中高效通道注意力机制能够计算通道图的重要性,有选择的强调通道图,改进特定情感的表达。本文在交互式情感二元动作捕捉(IEMOCAP)数据库上进行相关实验,在IEMOCAP上采用循环填充法的加权精度(WA)和非加权精度(UA)分别达到73.2%和70.9%,采用本文提出模型的WA和UA分别达到76.0%和73.4%。   相似文献   

16.
为提高室内可见光定位系统性能,提出了基于遗传算法训练卷积神经网络(Genetic Algorithm Convolutional Neural Network, GACNN)的室内可见光指纹定位算法。该算法引入一维卷积神经网络学习模型,针对卷积神经网络的超参数设置,利用遗传算法对卷积神经网络进行训练,将超参数进行二进制编码后采用精英遗传算法对CNN进行训练,来解决卷积神经网络模型参数调节依靠经验和模糊最优化的过程。实验结果表明:在室内4 m×4 m×2.5 m的定位场景下,定位算法可以获得平均定位误差4.11 cm的定位精度。相较于卷积神经网络定位算法,平均定位误差降低了25%。对比分析了不同室内可见光定位算法的性能,验证了算法的技术优势。  相似文献   

17.
由于红外探测器感应波段与可见光不同,不依赖于大气光的反射传播,而是取决于环境中物体自身散发的辐射强度,所以其在雾霾、夜晚等可见度低的条件下往往比可见光具有更好的目标检测效果。针对红外场景中目标检测精度低、实行性差的问题,提出一种基于注意力机制的红外目标检测方法。首先,设计一种轻量化网络结构;其次,采用注意力机制提高网络的特征提取能力;然后,改进迭代特征金字塔结构提高对不同尺度目标的检测能力;最后,在训练过程中引入complete intersection over union(CIoU)损失函数和梯度均衡机制(GHM)损失函数改善正负样本不平衡问题。与其他算法的对比实验结果表明,所提算法的检测精度和速度显著提高。  相似文献   

18.
当前先进的图像检索方法中,存在着不能很好地分辨图像中不同区域和内容的重要性的问题,导致计算资源分配不合理、检索正确率较低等一系列结果.为了解决这些问题,提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)和注意力机制的图像检索方法.首先使用卷积神经网络提取特征,然后使用注意力机...  相似文献   

19.
王增强  张文强  张良 《信号处理》2020,36(8):1272-1279
现有的视频行为识别方法在特征提取过程中,存在忽略各个特征之间相互作用关系的问题,对近似动作的区分效果不理想。因此,提出引入高阶注意力机制的人体行为识别方法。在深度卷积神经网络中引入高阶注意力模块,通过注意力机制建模和利用复杂和高阶的统计信息,对训练过程中特征图各个部分的权重进行重新分配,从而关注局部细粒度信息,产生有区别性的关注建议,捕获行为之间的细微差异。在UCF101和HMDB51这两个人体行为数据集上的实验结果表明,与现有方法相比,识别率得到了一定的提升,验证了所提出方法的有效性和鲁棒性,提高了对近似行为的辨别能力。   相似文献   

20.
深度学习算法应用于SAR图像分类领域时存在模型训练时间较长且精度不够高等问题。对此,提出一种基于混合注意力机制的卷积神经网络模型,该模型基本模块分为主干分支和软分支。主干分支由残差收缩网络和改良之后的通道注意力机制组成,负责提取主要特征;软分支将下采样和上采样相结合,负责提取混合注意力权重,增强从输入到输出的映射能力。该模型在MSTAR数据集上取得了99.6%的识别率,且训练时间较短。噪声分析显示:该模型对椒盐噪声具有较强的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号