首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 482 毫秒
1.
基于深度学习的航空对地小目标检测   总被引:1,自引:0,他引:1       下载免费PDF全文
梁华  宋玉龙  钱锋  宋策 《液晶与显示》2018,33(9):793-800
针对航拍图像中对地小目标识别率低、定位效果差的问题,提出了一种基于深度学习的目标检测算法。该算法利用VGG16网络作为微调网络,并添加部分深层网络,通过提取目标浅层特征与深层特征进行联合训练,克服检测过程中定位与识别相互矛盾的问题。提出把奇异值分解技术应用于卷积特征压缩处理,降低模型的计算与存储需求,并且采用多尺度训练方法以适应航空目标尺度的变化。实验结果表明,在通用数据集PASCAL上可以实现0.76mAP,检测速度达16fps,在专用航空目标数据集UCAS-AOD上可以实现0.63mAP,检测速度达18fps。基本满足对小目标检测精确度的要求,并且检测速度可以接近实时检测效果。  相似文献   

2.
许新征  李杉 《电子学报》2023,(2):355-364
本文从卷积神经网络模型的网络结构入手,利用特征复用的思想,设计了高效的特征膨胀卷积模块.该模块减少了标准卷积模块的输出通道数,引入了多分支结构.通过各个分支上的廉价操作对标准卷积操作的输出特征图进行变换和融合,产生新的特征图.模块的最终输出由各个分支上生成的特征图进行合并连接得到.特征膨胀卷积模块利用特征复用思想复用模型中的特征,在降低模型计算量的同时,丰富了特征图隐含的信息,提高了模型的性能.最后,将特征膨胀卷积模块代替标准卷积模块,设计了轻量化的VGG16(Visual Geometry Group 16-Layer)模型和残差结构,并且在CIFAR数据集和ILSVRC2012(ImageNet Large Scale Visual Recognition Challenge 2012)数据集上取得了较好的分类效果.  相似文献   

3.
随着安防监控、视频行为分析等领域的发展,人脸检测技术已经从基础的检测出人脸进一步发展到了获取人脸的相关特征。文中给出了一个基于卷积神经网络的检测人脸胡须与帽子特征的方法。首先利用主动形状模型(ASM)标记人脸关键点,之后进行仿射变换对齐人脸,输入卷积神经网络分类器。大量的仿真实验结果表明,卷积神经网络较基于传统特征模型的支持向量机(SVM)分类器更能够准确地区分出胡须与帽子两个关键的人脸特征,运算速度快,对于稍有模糊的人脸也具有一定的鲁棒性。  相似文献   

4.
5.
行人重识别的目的是在跨区域、跨场景的情况下,检索出特定目标行人.由于行人外观可能相似,以及存在姿态变化和遮挡的问题,因此要求行人重识别模型能够捕捉到足够的细节信息.基于此,提出了图像特征融合的行人重识别算法,融合图像的全局特征与局部特征进行目标行人的检索.该算法构建了特征融合的图像通道,由卷积神经网络提取图像的视觉信息...  相似文献   

6.
胡超  李春国  杨绿溪 《信号处理》2021,37(7):1153-1163
为了提高人脸特征提取网络的性能,进而提高人脸识别算法的准确率,本文对基于卷积神经网络的人脸特征提取网络进行研究,提出了SFRNet (Sparse Feature Reuse Network)。首先,基于稀疏特征重用、混合特征融合、中心-高斯池化三个创新点,给出了SFRNet的网络结构。然后,在图像分类数据集ImageNet和人脸识别数据集LFW (Labeled Faces in the Wild)、MegaFace上进行实验,分别验证了SFRNet在一般场景和人脸识别这一特定场景下的特征提取能力。实验表明本文所设计的SFRNet不仅计算量和参数量小,还能有效提取到人脸特征并且在一般场景中也有较强的泛化能力。   相似文献   

7.
针对遥感图像水体分割任务,提出了一种多尺度融合注意力模块改进的UNet网络——A-MSFAM-UNet,该方法在GF-2遥感图像水体分割任务中实现了端到端高分辨率遥感图像水体分割。首先,针对以往注意力模块全局池化操作带来的局部信息不敏感问题,设计了一种多尺度融合注意力模块(MSFAM),该模块使用点卷积融合通道全局信息、深度可分离卷积弥补全局池化造成的信息丢失。MSFAM用于UNet跳跃连接后的特征融合部分重新分配特征点权重以提高特征融合效率,增强网络获取不同尺度信息的能力。其次,空洞卷积用于VGG16主干网络扩展感受野,在不损失分辨率的情况下聚合全局信息。结果表明,A-MSFAM-UNet优于其他通道注意力(SENet、ECANet)改进的UNet,在GF-2水体分割数据集上平均交并比(MIoU)、平均像素精度(MPA)和准确率(Acc)分别达到了96.02%、97.98%和99.26%。  相似文献   

8.
针对短波信道多径传播的特点,采用卷积型滤波技术和复时谱分析方法,抗多径传播引起的信号衰落.研究结果表明,该方法能够更好的滤除干扰,改变传输信道质量.  相似文献   

9.
传统深层神经网络通常以跳跃连接等方式堆叠深层特征,这种方式容易造成信息冗余。为了提高深层特征信息的利用率,该文提出一种深层特征差异性网络(DFDN),并将其应用于单幅图像超分辨率重建。首先,提出相互投影融合模块(MPFB)提取多尺度深层特征差异性信息并融合,以减少网络传输中上下文信息的损失。第二,提出了差异性特征注意力机制,在扩大网络感受野的同时进一步学习深层特征的差异。第三,以递归的形式连接各模块,增加网络的深度,实现特征复用。将DIV2K数据集作为训练数据集,用4个超分辨率基准数据集对预训练的模型进行测试,并通过与流行算法比较重建的图像获得结果。广泛的实验表明,与现有算法相比,所提算法可以学习到更丰富的纹理信息,并且在主观视觉效果和量化评价指标上都取得最好的排名,再次证明了其鲁棒性和优越性。  相似文献   

10.
11.
李玉峰  顾曼璇  赵亮 《信号处理》2020,36(8):1363-1373
遥感图像目标检测能为军事和民用领域提供重要的可利用信息,成为近年来的研究热点。针对现有目标检测技术不能兼顾检测速度和精度的问题,本文对Faster R-CNN做了优化:将轻量化的深度可分离残差网络作为Faster R-CNN的基础网络,降低基础网络模型的参数数量;将基础网络中的多层卷积特征经局部响应归一化后进行融合,增强目标特征信息的完备性,改善小目标易漏检的问题;联合softmax损失函数和中心损失函数训练网络模型,增加类别之间的差异性,缩小类内变化,使网络模型能学习到更具差异性的目标特征。在VEDAI、NWPU VHR-10、DOTA三个数据集上对本文方法进行验证,与传统Faster R-CNN相比,本文方法的检测精度提高了约7.0%。   相似文献   

12.
康书宁  张良 《信号处理》2020,36(11):1897-1905
基于深度学习的人体动作识别近几年取得了良好的识别效果,尤其是二维卷积神经网络可以较充分的学习人体动作的空间特征,但在捕获长时间的运动信息上仍存在问题。针对此问题,提出了基于语义特征立方体切片的人体动作识别模型来联合地学习动作的表观和运动特征。该模型在时序分割网络(Temporal Segment Networks,TSN)的基础上,选取InceptionV4作为骨干网络提取人体动作的表观特征,将得到的三维特征图立方体分为二维的空间上和时间上的特征图切片。另外设计一个时空特征融合模块协同的学习多维度切片的权重分配,从而得到人体动作的时空特征,由此实现了网络的端到端训练。与TSN模型相比,该模型在UCF101和 HMDB51数据集上的准确率均有所提升。实验结果表明,该模型在不显著增加网络参数量的前提下,能够捕获更丰富的运动信息,使人体动作的识别结果提高。   相似文献   

13.
14.
15.
针对基于传统卷积神经网络模型的高光谱图像分类算法细节表现力不强及网络结构过于复杂的问题,设计了一种基于多尺度近端特征拼接网络的高光谱图像分类方法。通过引入多尺度滤波器和空洞卷积,在保持模型轻量化的同时可以获取更丰富的空间?光谱判别特征,并提出利用卷积神经网络近端特征间的相互联系进一步增强细节表现力。在3个基准高光谱图像数据集上的实验结果表明,所提方法优于其他分类模型。  相似文献   

16.
基于深度学习的目标检测器RetinaNet和Libra RetinaNet均是使用特征金字塔网络融合多尺度特征,但上述两个检测器存在特征融合不充分的问题。鉴于此,提出一种多尺度特征融合算法。该算法是在Libra RetinaNet的基础上进一步扩展,通过建立两条自底向上的路径构建两个独立的特征融合模块,并将两个模块产生的结果与原始预测特征融合,以此提高检测器的精度。将多尺度特征融合模块与Libra RetinaNet结合构建目标检测器并在不同的数据集上进行实验。实验结果表明,与Libra RetinaNet检测器相比,加入模块后的检测器在PASCAL VOC数据集和MSCOCO数据集上的平均精度分别提高2.2个百分点和1.3个百分点。  相似文献   

17.
18.
面部表情识别在计算机视觉任务中受到越来越多的关注,由于真实场景中的表情往往包含着大量由姿态、年龄、图像质量、标注等因素带来的噪声,大大增加了类内变化,给表情的分类任务带来了很大的困难。现有的基于此类问题的研究往往聚焦于数据本身,通过对数据进行筛选或者扩大模型接受的数据类型的形式提高识别能力,没有考虑到卷积网络本身对图像特征关注的局限性。针对该问题,提出了一种基于局部空间特征引导的卷积神经网络,对于特征图的某部分像素点进行强调,引导卷积网络的深层特征图能够关注到多个对分类有效的局部面部区域,同时使用对数据重标记的形式抑制由标签错误导致的噪声问题。经过在多个公开的表情识别数据集中测试,并与多个同类方法对比,所提方法具有较好的识别效果。  相似文献   

19.
20.
基于双网络级联卷积神经网络的设计   总被引:1,自引:0,他引:1  
传统的卷积神经网络通常采用单一的网络结构进行特征提取,但是单一网络结构提取的特征不够充分,导致图片分类的精度不高。针对这个问题提出了采用两种网络同时进行特征提取,再将两种网络级联在一起,得到两种网络的融合特征,使提取的特征更具有辨别性。双网络级联是采用两条支路进行特征提取,一条支路为传统的CNN,另一条支路为在传统的CNN基础上加上残差操作,在下一次特征图降维前通过级联操作将两条不同的网络支路结合在一起。本网络实验采用101_food和caltech256数据集进行测试,将级联后的网络和两条支路网络进行对比,实验最后表现出较好的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号