首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在日常生活中,存在着丰富的文本信息,对这些信息的提取,能够极大地提高人们的生活品质。但自然场景中文本信息表达形式丰富多样,文本形状各异,在检测过程中存在误检、文本区域定位不准问题。针对以上不足,本文提出了一种具有自校正与注意力机制相结合的文本检测方法。首先,在ResNet50骨干网络中嵌入自校正卷积(self-calibrated convolution, SConv)及高效通道注意力(efficient channel attention, ECA),使网络能够校正全局无关信息的干扰,并集中关注于文本区域,提取更加丰富的语义信息;其次,在特征融合后加入协调注意力(coordinate attention, CA),纠正不同尺度的特征图在融合过程中产生的位置偏差。最后,通过修正后的特征图预测得到多个不同尺度的文本实例,采用渐进尺度扩展算法,求出最终检测到的文本实例。实验结果表明,在任意方向数据集ICDAR2015以及弯曲文本数据集Total-Text、SCUT-CTW1500上,相比于改进前的ResNet50综合指标F值分别提升了1.0%、5.2%、5.4%,证明了本方法具有良好的检测能力。  相似文献   

2.
3.
4.
基于DeepLabV3+进行图像分割时,在特征提取阶段忽略了不同级别的特征图中存在的特征重要程度不同,丢失了大量的细节信息,致使分割效果不佳.针对该问题,提出了一种基于DeepLabV3+与注意力机制相结合的图像语义分割算法.在骨干网络Xception模型中提取两条低级特征作为解码器的输入特征,提高特征提取的准确性;采...  相似文献   

5.
问题生成是一项应用非常广泛的自然语言生成任务,现有的研究大多数是采用基于循环神经网络构建的序列到序列模型.由于循环神经网络自带的“长期依赖”问题,导致模型编码器在对输入语句建模表示时,无法有效地捕获到词语间的相互关系信息.此外,在解码阶段,模型解码器通常只利用编码器的单层输出或者顶层输出来计算全局注意力权重,无法充分利...  相似文献   

6.
为了充分利用评分的有效信息,并进一步研究评论的重要性,提出了一种融合评论文本特征和评分图卷积表示的推荐模型,利用图卷积编码学习用户和商品在评分上的特征表示,结合文本卷积特征,使用注意力机制来区分评论的重要性,然后通过隐因子模型把在评论和评分上学习到的特征表示融合产生推荐.在亚马逊公开数据集上的实验结果表明,提出的模型显...  相似文献   

7.
8.
针对杂乱场景下难以有效地提取行人关键信息和局部遮挡时全局特征方法失效的问题,提出了一种双金字塔结构引导的多粒度行人重识别(person re-identification,ReID)方法。首先在ResNet50中嵌入注意力金字塔,引导网络由粗到细依次挖掘不同粒度的特征,使网络更倾向于关注复杂环境中行人的显著区域;其次通过结构不对称的双重注意力特征金字塔分支(double attention feature pyramid branch,DFP branch)提取多尺度的行人特征,丰富特征的多样性,同时双重注意力机制可使分支从浅层信息中捕获高细粒度的局部特征;最后将粒度较粗的全局特征与多层级细粒度的局部特征融合,两种金字塔相互作用,以此获得更多具有鉴别性的多粒度特征,改善行人遮挡问题。在多个数据集上进行了实验,结果表明,各项评价指标均高于目前大多数主流模型,其中在DukeMTMC-reID数据集上,Rank-1、mAP和平均逆负处罚(mean inverse negative penalty,mINP)分别达到了91.6%、81.9%、48.1%。  相似文献   

9.
针对合成孔径雷达(Synthetic Aperture Radar, SAR)图像中飞机目标尺度多样性及背景强散射干扰的问题,提出了一种基于坐标注意力和自适应特征融合的YOLOv4 SAR图像飞机目标检测算法。该方法首先在主干网络引入坐标注意力机制,以增强对于飞机散射点组合结构的聚焦能力以及抗背景干扰能力。其次,在特征增强网络中引入自适应特征融合机制,提高了对不同大小飞机的特征提取能力,同时改善了YOLOv4算法召回率和精确率不平衡的问题。最后,通过改进的K-Means聚类针对飞机目标调整先验框的尺寸,提高了模型的定位精度。实验结果表明,改进算法召回率达到91.01%,精确率达到90.09%,AP0.5达到92.34%,分别较原YOLOv4算法提高2.49%,6.56%和3.62%。  相似文献   

10.
亚临床期圆锥角膜(subclinical keratoconus, subkc)发病隐匿,现有医疗设备诊断存在局限性,所以提出一种诊断亚临床期圆锥角膜的检测方法是十分必要的。有研究发现圆锥角膜(Keratoconus, kc)力学性能的改变早于形态学,因此从角膜生物力学的角度筛查亚临床期的圆锥角膜更加符合临床实际。本文运用角膜生物力学特征,以点云数据作为网络输入数据,将SO-Net (self-organizing network)和自注意力(self-attention, SA)机制结合构建SOANet,对圆锥角膜、亚临床期圆锥角膜和正常角膜进行分类。首先,利用可视化生物力学分析仪(corneal visualization Scheimpflug technology, Corvis ST)拍摄角膜受力形变视频,对其进行处理得到点云数据集,接着对点云数据进行增强处理,使3种类型的角膜数据量分布均衡。然后按照3∶1的比例划分训练集和测试集,分别对角膜进行二分类和三分类。最终模型在二分类和三分类测试集上的准确率分别达到98.3%和91.26%,即有效识别亚临床期圆锥角膜和圆锥角膜。实验...  相似文献   

11.
为了解决门控神经网络(Gated Recurrent Neural Network,GRU)不能很好地注意到关键词且训练速度较慢的问题,提出融合词嵌入和通道注意力机制的网络安全态势预测模型(E-SE-CNN)。首先,根据专家意见,采用正则表达式分割告警日志数据(网络安全设备捕捉到的Web攻击日志)构建多标签分类数据集;其次,利用Embedding进行词嵌入,获取词的分布式表示,使其能够充分地表示语义信息;再次,引入通道注意力机制(Squeeze and Excitation)和卷积神经网络(Convolutional Neural Networks,CNN),为不同的通道分配不同的权重,使得模型能够进一步获取文本的重要的语义信息;最后,将包含权重信息以及语义信息的特征图送入sigmoid层进行多标签的Web攻击分类。为了进一步验证E-SE-CNN模型的性能,设计了5组相关模型进行进一步验证。实验结果表明,在自建的Web攻击数据集上,在保证训练推理速度的同时,提出的模型在5种评估指标上均具有最佳的表现。  相似文献   

12.
人脸作为人体信息最为密集的部位,人脸图像在各个研究领域都有不可替代的作用。因此,研究如何将遮挡或模糊的人脸图像恢复成真实图像是非常有意义的。针对人脸图像修复技术的研究,提出基于扩散模型的人脸图像修复技术。在现有的人脸图像修复技术基础上,解决在修复大区域破损或遮挡的情况下,修复图像出现纹理模糊及结构扭曲等问题。所提出的方法基于边缘引导的扩散模型图像修复网络,主要包括两个阶段:首先训练基于U-Net结构的边缘修复模型生成较为真实的缺失区域的边缘信息,然后根据已修复好的边缘信息,训练内容生成模型填充缺失部分的内容信息。实验证明对于人脸图像修复具有较好的效果。  相似文献   

13.
大气 PM2:5 浓度是一种具有较强时序特征的数据, 故目前关于 PM2:5 浓度的预测多选择 RNN、 LSTM 等 序列模型进行。但由于 RNN、 LSTM 等模型对不同时刻输入的数据都采用相同的权重进行计算, 不符合类脑设 计, 造成 PM2:5 浓度预报准确率较低。针对以上问题, 提出一种基于 Adam 注意力机制的 PM2:5 预测方法 (AT-RNN 和AT-LSTM), 该方法首先通过 Adam 算法寻找 RNN 或 LSTM 的最优参数并在 Encoder 阶段引入注意力机制, 将 注意力权重分配给具有时间序列特征的输入, 再进行 Decoder 解析和预测。通过实验, 对比了 BP、 RNN、 LSTM 和AT-RNN、 AT-LSTM 预测合肥市 PM2:5 浓度的效果。结果表明, 基于 Adam 注意力模型的预测方法准确率优于其它 方法, 证明该方法在污染物预测中的有效性。  相似文献   

14.
提出了一种结合卷积神经网络和改进的Transformer Encoder网络的并联网络模型——ConEncoder。其中卷积支路结合了残差连接和SE模块用于提取信号的局部特征,Encoder支路去除传统的位置编码,用于提取信号的全局特征,最后融合二种特征,实现了在复杂的海底环境下对8种水声信号调制方式的高准确率识别,识别准确率可达98%以上。相较于基于专家特征进行识别的传统机器学习算法和常用的神经网络都具有更好的识别性能。  相似文献   

15.
吴繁  贺赛先 《激光杂志》2023,(1):109-114
利用深度学习的方法进行单视图三维重建时,网络中的外部辅助结构大幅提高了其重建效果,但也增加了网络的参数量和运算量。对此,在编码器中减少卷积层数量,并设计注意力模块。在注意力模块中,利用大核注意力为图像空间信息分配不同的权重。此外,利用向量融合保持空洞卷积过程中的空间信息关系。在重建过程中,编码器通过卷积层和注意力模块交替提取图像特征后,将编码向量直接输入到解码器,在解码器中上采样并输出重建模型,实现无需外部辅助结构的重建。在ShapeNet数据集上的对比实验表明网络在较低的模型参数量和运算量下具有更好的三维重建效果。  相似文献   

16.
合成孔径雷达(SAR)具有不受云层干扰、可全天时、全天候对地观测的特点,基于SAR图像的舰船检测已广泛用于海洋搜救、港口侦察、领海防御等民用或军用领域。然而,与大型舰船相比,像素点少、对比度低的小型舰船存在漏检率高的问题,并且速度和精度之间的平衡成为舰船检测算法天基应用的难点。针对以上问题,本文提出了一种基于YOLOv5s模型改进的舰船检测轻量化模型(ImShips)。首先,针对船体大小差异导致的漏检问题,采取在网络底部使用感受野较小的标准卷积,提升了模型对小规模舰船空间信息的获取能力。同时,在网络顶部设计了放大感受野的扩张卷积,保留了更多的语义特征,有利于大目标的特征提取。接着,提出将轻量级的通道注意力机制应用于YOLOv5的骨干网络和特征融合网络,通过对提取到的特征按重要性分配权重,实现纹理信息的筛选。最后,在下采样时采取深度可分离卷积代替标准卷积,减少了模型参数的数量,进一步提高了模型的推理速度。实验结果表明,在SAR舰船检测SSDD和ISSID数据集中,改进后的ImShips模型在保证精度的同时,所需的浮点计算数比YOLOv5s模型减少了45.61%,检测速度提高了8.31%。ImShips模型网络规模小、检测速度快,在实时天基舰船检测中具有较大的应用潜力。  相似文献   

17.
随着基于位置的社交网络(LBSN)技术的快速发展,为移动用户提供个性化服务的兴趣点(POI)推荐成为关注重点。由于POI推荐面临着数据稀疏、影响因素多和用户偏好复杂的挑战,因此传统的POI推荐往往只考虑签到频率以及签到时间和地点对用户的影响,而忽略了签到序列中用户前后行为的关联影响。为了解决上述问题,该文通过序列的表示考虑签到数据的时间影响和空间影响,建立了时空上下文信息的POI推荐模型(STCPR),为POI推荐提供了更精准的个性化偏好。该模型基于序列到序列的框架下,将用户信息、POI信息、类别信息和时空上下文信息进行向量化后嵌入GRU网络中,同时利用了时间注意力机制、全局和局部的空间注意力机制来综合考虑用户偏好与变化趋势,从而向用户推荐感兴趣的Top-N的POI。该文通过在两个真实的数据集上实验来验证模型的性能。实验的结果表明,该文所提出的方法在召回率(Recall)和归一化折损累计增益(NDCG)方面优于几种现有的方法。  相似文献   

18.
为了区分不同高阶交叉特征的重要程度并剔除冗余交叉特征,提高点击率的预估精度,提出了一种深度交叉注意力预估网络(deep cross attention prediction network, DAPN)模型。它将具有稀疏高维特征的输入信息表示为低维稠密向量后,分别送入因子分解机(factorization machine, FM)和深度交叉注意力层(deep cross attention, DCA)。FM通过一阶特征和二阶特征交叉挖掘训练数据中从未出现或者很少出现的低阶交叉特征。DCA层利用缩放点积注意力机制(dot-product attention,DP_Att)设计交叉注意力层,用于区分高阶交叉特征的重要度,并设计深度神经网络(deep neural network, DNN)实现对高阶交叉特征建模。仿真表明,DAPN在MovieLens-1m和Avazu等公开数据集上均具有良好的预估性能,它使用并行结构能同时有效地学习低阶和高阶交叉特征,提高预估精度。  相似文献   

19.
针对水下目标检测过程中由于水下成像模糊、目标物与背景对比度低等原因导致的水下图像特征提取与目标理解困难的问题,本文提出了一种基于频域注意力的水下目标检测算法。该方法首先将训练集图像变换到频域,并使用低频特征引导组件(low frequency feature guiding suite, LFGS)计算频率分量,然后该分量将作为参数被应用到低频特征提取模块(low frequency feature extraction model, LFM)来更好地提取图像的低频特征,融合了图像低频信息的特征经过进一步特征提取生成高层特征,最后将高层特征输入到检测头中进行检测。在URPC2021数据集上进行验证,平均精度均值达到了83.35%,验证了本文方法的有效性。  相似文献   

20.
针对CT图像中肺结节因边缘模糊、特征不明显造成的分类效果有偏差的问题,本文提出一种嵌入注意力机制的多模型融合方法(简称MSMA-Net)。该方法先将原始CT图像进行肺实质分割和裁剪操作后得到两种不同尺寸的图像,然后分别输入到空间注意力模型和通道注意力模型进行训练,其中,空间注意力模型着重于提取肺结节在CT图像中的空间位置信息,通道注意力模型着重于提取肺结节的细节特征。最后将两个模型提取的特征进行融合,用于得出良恶性分类结果。经过大量实验表明,这种多模型融合方法能很好地提取到肺结节在CT图像中的位置信息和自身的边缘特征,在LIDC数据集的基础上,该方法在准确率,敏感性,特异性分别达到了96.28%,96.72%,96.17%,相较于传统的网络模型取得了更好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号