首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 123 毫秒
1.
针对自然街景文本角度倾斜、形状弯曲、长度不定等特点,提出一种基于注意力机制的自然街景文本检测方法,通过利用注意力机制的优势,对主干网络提取的特征进行加权融合,从而提升整体网络的检测性能.首先,针对特征金字塔(FPN)横向连接中特征信息丢失的问题,引入注意力融合模块AFFM(Attention Feature Fusion Module),通过计算高维和低维特征的融合权重,来改进原FPN中简单直接相加的特征融合方式,从而减少FPN特征融合过程中文本信息丢失,增强网络的特征提取能力.其次,针对不同尺度特征图中的文本特征,引入一个子空间注意力模块SAM(Subspace Attention Module),通过将多尺度融合特征图按通道划分为数个子空间特征图,分别学习每个子空间中的文本特征权重,使得融合后的特征图包含更多不同尺度的文本特征,从而增强融合特征图对文本实例的表征能力,进而提升网络的检测效果.在公开数据集Total-Text上对模型进行评估,实验结果表明,该算法与目前快速高效的DBNet相比,准确率、召回率和F值分别提高了0.5%、0.4%和0.4%.  相似文献   

2.
本文提出了一种场景文本检测方法,用于应对复杂自然场景中文本检测的挑战。该方法采用了双重注意力和多尺度特征融合的策略,通过双重注意力融合机制增强了文本特征通道之间的关联性,提升了整体检测性能。在考虑到深层特征图上下采样可能引发的语义信息损失的基础上,提出了空洞卷积多尺度特征融合金字塔(dilated convolution multi-scale feature fusion pyramid structure, MFPN),它采用双融合机制来增强语义特征,有助于加强语义特征,克服尺度变化的影响。针对不同密度信息融合引发的语义冲突和多尺度特征表达受限问题,创新性地引入了多尺度特征融合模块(multi-scale feature fusion module, MFFM)。此外,针对容易被冲突信息掩盖的小文本问题,引入了特征细化模块(feature refinement module, FRM)。实验表明,本文的方法对复杂场景中文本检测有效,其F值在CTW1500、ICDAR2015和Total-Text 3个数据集上分别达到了85.6%、87.1%和86.3%。  相似文献   

3.
向思佳  曾凯 《通信技术》2022,(7):865-870
车道线检测是当前自动驾驶最具挑战性的任务之一。由于自动驾驶任务场景的复杂性,极易出现车道线模糊或被遮挡的情况。而目前的车道线检测算法在学习全局信息的能力上存在缺陷,同时缺少对道路场景与车道线之间关系的利用。针对上述问题,构建了空间特征信息增强网络(Spatial Feature Information Enhancement Network,SFE-Net),并提出了上下文信息感知模块(Context Perception Module,CPM),对CNN提取的特征进行上下文信息以及跨尺度信息的增强,补充了丰富的语境信息。基于此,提出了空间特征增强模块(Spatial Feature Enhancement Module,SPEM),对道路场景以及车道线进行关系建模,有效捕获跨行和列的空间关系,同时对每个通道上的权重进行显式建模,突出每个通道的重要程度。通过实验对比,结果表明该空间特征信息增强网络(SFE-Net)能实现特征的空间信息增强,提高车道线检测精度,在获得良好的性能同时,解决车道线遮挡性问题。  相似文献   

4.
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法.为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块相结合的方式进行多层的特征融合;另外针对深层特征图在降维的过程中可能造成语义丢失的现象,提出了空...  相似文献   

5.
赵琰  赵凌君  匡纲要 《电子学报》2021,49(9):1665-1674
针对合成孔径雷达(Synthetic Aperture Radar,SAR)图像中飞机目标散射点离散化程度高,周围背景干扰复杂,现有算法对飞机浅层语义特征表征能力弱等问题,本文提出了基于注意力特征融合网络(Attention Feature Fu-sion Network,AFFN)的SAR图像飞机目标检测算法.通过引入瓶颈注意力模块(Bottleneck Attention Module,BAM),本文在AFFN中构建了包含注意力双向特征融合模块(Attention Bidirectional Feature Fusion Module,ABFFM)与注意力传输连接模块(Attention Transfer Connection Block,ATCB)的注意力特征融合策略并合理优化了网络结构,提升了算法对飞机离散化散射点浅层语义特征的提取与判别.基于自建的Gaofen-3与TerraSAR-X卫星图像混合飞机目标实测数据集,实验对AFFN与基于深度学习的通用目标检测以及SAR图像特定目标检测算法进行了比较,其结果验证了AFFN对SAR图像飞机目标检测的准确性与高效性.  相似文献   

6.
行人检测中,小尺度行人时常被漏检、误检。为了提升小尺度行人的检测准确率并且降低其漏检率,该文提出一个特征增强模块。首先,考虑到小尺度行人随着网络加深特征逐渐减少的问题,特征融合策略突破特征金字塔层级结构的约束,融合深层、浅层特征图,保留了大量小尺度行人特征。然后,考虑到小尺度行人特征容易与背景信息发生混淆的问题,通过自注意力模块联合通道注意力模块建模特征图空间、通道关联性,利用小尺度行人上下文信息和通道信息,增强了小尺度行人特征并且抑制了背景信息。最后,基于特征增强模块构建了一个小尺度行人检测器。所提方法在CrowdHuman数据集中小尺度行人的检测准确率为19.8%,检测速度为22帧/s,在CityPersons数据集中小尺度行人的误检率为13.1%。结果表明该方法对于小尺度行人的检测效果优于其他对比算法且实现了较快的检测速度。  相似文献   

7.
本文针对背景干扰、特征信息不足以及尺度剧烈变化等问题,提出了一种基于多尺度及双注意力机制(Multi-Scale and Dual Attention,MSDA)的小尺寸人群计数网络.MSDA网络主要由空间一通道双注意力(Spatial Channel-dual Attention,SCA)模块和多尺度特征融合(Multi-scale Feature Fusion,MFF)模块构成.MFF模块将特征送入三列拥有不同卷积核的膨胀卷积来扩大小目标的空间尺度,再通过特征级联及卷积操作进行多尺度特征融合;SCA模块把特征送入通道注意力网络,使用空间注意力中的池化操作及逐像素相乘操作加强细节信息;最后将处理好的特征送入密度图生成模块,通过1 x 1卷积获得密度图.在Mall数据集和Shanghaitech数据集上进行了测试,取得了较好的准确率与鲁棒性.  相似文献   

8.
王文霞  张文  何凯 《激光与红外》2023,53(9):1364-1374
为提升目标检测算法在复杂环境下的精确性和实用性,将多源信息和深度学习技术相结合,提出了一种基于双模态特征增强的目标检测方法。该方法以红外和可见光图像作为输入,利用颜色空间转换、边缘提取、直方图均衡化等传统图像处理方法丰富图像信息,达到数据增强效果;特征提取部分采用卷积神经网络结构分别提取目标红外及可见光信息,并设计混合注意力机制分别从通道和空间位置角度提升有效特征权重;同时,针对目标双模态信息,引入了自适应交叉融合结构,提高特征多样性;最后,利用交替上下采样将目标全局和局部特征充分融合,并以自主选择方式提取目标相关特征实现检测。通过在标准数据集以及实际场景数据集上的实验结果表明,所提方法有效融合并增强了目标多模态特征,提升了目标检测效果,并能较好的应用于电网场景中,辅助机器人完成目标设备检测。  相似文献   

9.
目前采用U-Net结构的去模糊算法存在细节损失、图像质量欠佳等问题,因此对U-Net进行改进,提出一种基于多尺度优化和动态特征融合的图像去模糊方法。首先针对细节损失,提出一种精简且有效的多尺度残差注意力模块(Multi-Scale Residual Module, MSRM),通过增加特征尺度多样性来提取更精细的图像特征。此外,为了将更有利的特征传递到解码部分,在跳跃连接处设计动态特征融合模块(Dynamic Feature Fusion Module, DFFM),采用注意力加权的方式选择性融合不同阶段的编码特征。该算法采用多尺度内容损失和多尺度高频信息损失进行约束训练。在GoPro和RealBlur数据集上的实验结果表明,这种方法能有效改善图像质量,复原更丰富的细节信息。与现有去模糊算法相比,本文算法在主观视觉和客观评价等方面均具有一定优势。  相似文献   

10.
本文提出了基于可切换空洞卷积与注意力导向的特征金字塔网络(SwitchableDilatedConvolutionsand Attention-guidedFPN,SDA-FPN)模型,通过加入不同空洞率的可切换空洞卷积使模型能够根据任务选择不同感受野的特征图;引入注意力导向模块(Attention-guideModule,AM)增强特征语义信息且减少空洞卷积对文本边界信息的破坏。针对各尺度特征融合不充分导致语义信息丢失,提出了特征增强融合模块(FeatureEnhancementFusionModule,FEFM),通过结合注意力机制增强模型对尺度、空间、任务的感知能力。该方法在公开数据集ICDAR2015取得了较好的检测结果,且召回率有明显的提升。  相似文献   

11.
王宏勇  王青青 《电子科技》2012,25(12):141-143
有效提取人脸特征是人脸识别技术的关键组成部分。传统的二维图像容易受到光照、姿态及表情的影响,而三维数据被认为具有光照姿态不变性。文中从局部特征和整体特征两个角度,对三维人脸特征提取进行综述,对部分方法进行比较,并分析了方法的有效性,总结了三维人脸特征提取方法的优势和困难。  相似文献   

12.
针对传统的模板匹配法对汉字的识别率较低,文中提出一种基于SVM的多特征手写体汉字识别技术。在提取网格特征的基础上增加对汉字质心特征、笔划特征、特征点的提取,并采用SVM算法构造分类器,实现对手写体汉字的识别。实验结果表明,该方法的平均识别率为95.9%,高于传统的模板匹配法。  相似文献   

13.
个体特征选择和提取是辐射源个体识别的关键,直接决定分类识别性能的好坏。由于在实际工程应用中,利用暂态特征进行通信辐射源个体识别难以实现,本文从稳态特征出发,对通信辐射源个体特征提取技术进行了综述,对特征的产生机理、在信号传播过程中所受到的污染以及在实际工程应用中的可行性做了归纳与分析。最后,指出了目前通信辐射源个体特征提取技术存在的问题,展望了个体识别技术未来可能的研究方面。  相似文献   

14.
在Simmons的“囚犯问题”模型和Cachin的安全性理论模型下,如何提取并融合统计特征是隐密分析技术亟待解决的关键问题之一.基于对已有隐密分析技术及其所涉及的图像统计特征的分析,本文将隐密分析技术所涉及的统计特征定义为载体数据固有特征和隐密方法引入特征,并分别讨论了这两类特征的重要性.在阐述隐密分析技术的整体性研究方法的基础上,提出了一种基于整体性思想的特征提取及融合方法,并以研制的图像隐密分析系统(StegDetect)验证了此整体性特征提取及融合方法的有效性.  相似文献   

15.
Li ZHANG  Cong WANG 《通信学报》2018,39(5):111-122
Feature selection has played an important role in machine learning and artificial intelligence in the past decades.Many existing feature selection algorithm have chosen some redundant and irrelevant features,which is leading to overestimation of some features.Moreover,more features will significantly slow down the speed of machine learning and lead to classification over-fitting.Therefore,a new nonlinear feature selection algorithm based on forward search was proposed.The algorithm used the theory of mutual information and mutual information to find the optimal subset associated with multi-task labels and reduced the computational complexity.Compared with the experimental results of nine datasets and four different classifiers in UCI,the proposed algorithm is superior to the feature set selected by the original feature set and other feature selection algorithms.  相似文献   

16.
特征提取是辐射源个体识别技术的关键,也是实际应用中必须解决的首要问题.从接收信号的暂态和稳态两个方面对现有的个体特征提取技术进行了综述,指出各种特征提取技术的适用范围及关键问题.同时结合个体识别接收设备需要,对所提取的特征参量在工程应用中的测量条件及局限性进行了归纳分析与对比.最后,指出了目前辐射源个体特征提取技术存在...  相似文献   

17.
针对描述子的性能与维数相矛盾的问题,提出了一种顽健的图像局部特征区域的描述方法。首先按照像素排序将局部特征区域分割为若干个子区域,然后利用基于阈值的分段局部描述子设计方法计算描述子,并采用纹理谱加权方法累加局部描述子得到子区域描述子,最后连接各部分子区域描述子得到最终的特征描述子。该方法综合了全局信息和局部信息,在保证描述子维数较小时对噪声具有一定的顽健性。实验结果表明该方法不仅对单调强度变化和旋转变化具有不变性,而且对其他几何和光学变换具有较好的顽健性。  相似文献   

18.
针对传统外形特征表征方法描述行为动作能力有限和运动特征表征方法难以准确、稳定地捕捉目标运动特性等问题。提出运用人体外形特征和运动特征相结合的方法提取人体行为关键特征,利用谱聚类算法对特征进行降维,降低了数据维数,获得了最优的特征表征。仿真实验表明,该方法降低了样本维数,减少了数据冗余,并提高了训练精度,且保证了行为识别率。  相似文献   

19.
提出了一种融合图像颜色、纹理和形状特征的提取及归一化方法,并将其应用于基于内容的对象检索中,实验证明,融合颜色、纹理、和形状特征的对象检索比单一特征的对象检索效果要好。  相似文献   

20.
基于飞机目标分析了NM(I归一化转动惯量)、不变矩、轮廓矩三种图像特征的不变性,提出了目标NMI特征提取的新方法。实验表明,基于新方法提取的NMI特征与传统的NMI特征、不变矩提取算法相比,具有良好的平移、旋转、比例不变性,且提取方法简单,易于实现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号