首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对行人检测的尺度变化问题,提出一种基于改进多尺度残差网络无锚检测算法(IMSNet)。将Res2Net残差模块中多尺度特征提取融入ResNeXt,将改进后的网络作为主干网络(Res2NeXt*),使主干网络包含不同数量、不同组合的感受野;利用多个较小卷积核等效替代单个较大卷积核,增加网络深度并减少网络参数量;对细化的多尺度卷积特征级联融合做卷积运算,将行人检测简化为中心点和尺度预测任务。实验结果表明,IMSNet对CityPersons和Caltech数据集Reasonable设置分别实现了10.6%和2.6%的平均漏检率,检测每张图像仅需0.28 s。  相似文献   

2.
3.
基于多尺度注意力机制的高分辨率网络人体姿态估计   总被引:1,自引:0,他引:1  
针对人体姿态估计中面对特征图尺度变化的挑战时难以预测人体的正确姿势,提出了一种基于多尺度注意力机制的高分辨率网络MSANet(multiscale-attention net)以提高人体姿态估计的检测精度。引入轻量级的金字塔卷积和注意力特征融合以更高效地完成多尺度信息的提取;在并行子网的融合中引用自转换器模块进行特征增强,获取全局特征;在输出阶段中将各层的特征使用自适应空间特征融合策略进行融合后作为最后的输出,更充分地获取高层特征的语义信息和底层特征的细粒度特征,以推断不可见点和被遮挡的关键点。在公开数据集 COCO2017上进行测试,实验结果表明,该方法比基础网络HRNet的估计精度提升了4.2%。  相似文献   

4.
针对目前点云补全网络只关注全局特征造成的语义信息丢失问题,提出了一个基于残差网络的多尺度特征提取的点云补全网络。网络采用端到端的思想,为避免单一特征不全面问题,将原始输入采样为三种不同尺度的点云;利用级联方式递归式融合不同方法提取的低分辨率点云的全局特征和原始点云的局部特征,形成特征向量并输入全连接网络,实现粗点云的预测;将拼接后的原始点云和粗点云送入精细重构单元,再在精细重构单元中融合注意力机制并利用残差网络进行由粗略到精细的补全;通过计算粗点云、稠密点云与真实点云之间的联合损失函数以提高补全性能。在ShapeNet数据集和KITTI数据集上的实验证明,无论是定性比较还是定量比较,提出的方法对残缺点云均具有较好的补全效果,同时也体现了该方法具有泛化能力。  相似文献   

5.
为有效地提升图像去模糊的效果,论文在残差网络的基础上加入多尺度结构,提出一种基于多尺度残差的图像去模糊算法。该算法由多尺度卷积单元级联而成,并采用残差学习策略提高网络性能。在伯克利数据集BSD500上进行训练,在Set5数据集上进行测试。实验结果表明,提出的这种基于多尺度残差的图像去模糊具有更强的复原能力,且对图像及其模糊类型、噪声水平等更具有稳健性,且能够获得更高的峰值信噪比(PSNR)和结构相似度(SSIM)。  相似文献   

6.
计算机科学中研究的图像是真实世界(即二维、三维欧式空间)到像平面的射影变换.平面射影变换(单应)估计是特征目标检测、注册、识别、三维重建等方面的关键步骤,但是如何鲁棒、精确地估计单应矩阵是一个没有很好解决的问题.在研究中发现,基于点与直线的直接的单应矩阵估计方法会导致出现较大误差的情况.针对这一情况,文中介绍了一种基于统计优化的单应矩阵估计方法,这种方法是通过单应矩阵的协方差张量的计算和优化来估计单应矩阵的.最后进行了简单的实验,比较了统计优化方法与进行归一化处理后的直接线性方法的估计结果,证明了基于优化统计的估计方法更加有效  相似文献   

7.
袁单飞  陈慈发  董方敏 《计算机工程》2022,48(5):258-262+271
深度卷积神经网络能够解决复杂的计算机视觉问题,被广泛应用于图像识别任务中。在基于深度卷积神经网络的图像识别过程中,增加网络的深度和宽度能够产生丰富的特征信息,使用多尺度分割方法能够有效减少冗余的特征信息。然而,增加网络的深度和进行多尺度分割都会影响识别速度。如何在保证精度的同时提高识别速度,成为设计高效网络的关键问题。通过增加网络宽度的方法对ResNet残差网络进行改进,在保证精度的基础上提升识别速度。使用ResNet-D中的残差结构并减少网络长度,得到长度只有7层的残差网络,同时对HS-ResNet中的多尺度分割方法进行优化,只保留最后一次连接合并操作,得到图像识别残差网络SSRNet。在CIFAR 10和CIFAR 100数据集上的实验结果显示,SSRNet速度最高较ResNet网络提升7倍多,同时错误率最高下降8.81%,表明缩短网络长度可大幅加快图像识别速度,同时结合多尺度分割方法能够有效提升识别精度。  相似文献   

8.
卷积神经网络在图像去噪方面取得了很好的效果,但是传统的压缩-解压缩结构的神经网络会不可避免地损坏原始图像信息.为了更有效地去除图像中的噪声,本文提出一种改进的多尺度特征融合并行稠密残差去噪神经网络框架,旨在更好地恢复图像边缘和纹理信息.首先使用并行网络结构以结合不同深度的图像信息,每个分支由一些残差稠密块构成,在此基础上加入残差块之间的远程跳跃连接以克服网络训练过程中出现的梯度消失和梯度弥散问题并提高网络训练性能.另外,在结合图像浅层信息与深层信息的基础上,在每个网络分支内部加入多尺度特征融合模块以获取不同深度下的多尺度图像特征信息.最后,采用残差学习的方式进一步提高网络性能.对比试验表明,本文方法在不同噪声强度下均取得了良好的效果,证明了所提出网络能够在抑制噪声的同时有效地保留原始图像的边缘和纹理信息.  相似文献   

9.
为了解决机械零配件点云处理中非均匀采样干扰、尖锐特征损失等难点,提出一种基于深度神经网络多尺度融合的点云法向量估计方法.该网络在不同邻域尺度下集成了采样点细节与点云块整体两种特征.为了使该多维回归输出网络的训练更稳定且能缓解梯度爆炸问题,重新设计了一个光滑的损失函数.实验结果表明,该方法性能优于传统的方法以及HoughCNN、PCPNet等方法,能够更准确地估计尖锐边缘的法向量,对点云各种噪声和采样方法鲁棒性都更强.  相似文献   

10.
11.
目的 近几年应用在单幅图像超分辨率重建上的深度学习算法都是使用单种尺度的卷积核提取低分辨率图像的特征信息,这样很容易造成细节信息的遗漏。另外,为了获得更好的图像超分辨率重建效果,网络模型也不断被加深,伴随而来的梯度消失问题会使得训练时间延长,难度加大。针对当前存在的超分辨率重建中的问题,本文结合GoogleNet思想、残差网络思想和密集型卷积网络思想,提出一种多尺度密集残差网络模型。方法 本文使用3种不同尺度卷积核对输入的低分辨率图像进行卷积处理,采集不同卷积核下的底层特征,这样可以较多地提取低分辨率图像中的细节信息,有利于图像恢复。再将采集的特征信息输入残差块中,每个残差块都包含了多个由卷积层和激活层构成的特征提取单元。另外,每个特征提取单元的输出都会通过短路径连接到下一个特征提取单元。短路径连接可以有效地缓解梯度消失现象,加强特征传播,促进特征再利用。接下来,融合3种卷积核提取的特征信息,经过降维处理后与3×3像素的卷积核提取的特征信息相加形成全局残差学习。最后经过重建层,得到清晰的高分辨率图像。整个训练过程中,一幅输入的低分辨率图像对应着一幅高分辨率图像标签,这种端到端的学习方法使得训练更加迅速。结果 本文使用两个客观评价标准PSNR(peak signal-to-noise ratio)和SSIM(structural similarity index)对实验的效果图进行测试,并与其他主流的方法进行对比。最终的结果显示,本文算法在Set5等多个测试数据集中的表现相比于插值法和SRCNN算法,在放大3倍时效果提升约3.4 dB和1.1 dB,在放大4倍时提升约3.5 dB和1.4 dB。结论 实验数据以及效果图证明本文算法能够较好地恢复低分辨率图像的边缘和纹理信息。  相似文献   

12.
王群  张敏情  柯彦  狄富强 《计算机应用研究》2021,38(8):2454-2457,2464
卷积神经网络在隐写分析领域取得了一系列进展,但现有网络结构大多都是专用隐写分析,只针对某一类隐写算法有效.为了提高模型的泛化能力,提出了一种基于新残差网络的图像隐写分析算法.构建了残差分组融合网络结构(W-R2 N),采用分组融合的方式来提高提取多尺度特征的能力,增大每层网络的感受野范围,并且增加每组卷积的对角相关性.相对于Xu-Net和SRNET在S-UNIWARD嵌入率为0.4 bpp情况下隐写分析准确率分别提高了17.13%和0.81%.实验结果表明,相对于现有卷积神经网络,该模型泛化能力更好,并且能够有效提高隐写分析的准确率.  相似文献   

13.
作为一个多任务的学习过程,目标检测相较于分类网络需要更好的特征.基于多尺度特征对不同尺度的目标进行预测的检测器性能已经大大超过了基于单一尺度特征的检测器.同时,特征金字塔结构被用于构建所有尺度的高级语义特征图,从而进一步提高了检测器的性能.但是,这样的特征图没有充分考虑到上下文信息对语义的补充作用.在SSD基准网络的基...  相似文献   

14.
韩建栋  李晓宇 《计算机应用》2021,41(10):2991-2996
针对行人重识别任务在特征提取时缺乏对行人特征尺度变化的考虑,导致其易受环境影响而具有低行人重识别准确率的问题,提出了一种基于多尺度特征融合的行人重识别方法。首先,在网络浅层通过混合池化操作来提取多尺度的行人特征,从而帮助网络提升特征提取能力;然后,在残差块内添加条形池化操作以分别提取水平和竖直方向的远程上下文信息,从而避免无关区域的干扰;最后,在残差网络之后利用不同尺度的空洞卷积进一步保留多尺度的特征,从而帮助模型灵活有效地解析场景结构。实验结果表明,在Market-1501数据集上,所提方法的Rank1达到95.9%,平均精度均值(mAP)为88.5%;在DukeMTMC-reID数据集上,该方法的Rank1达到90.1%,mAP为80.3%。可见所提方法能够较好地保留行人特征信息,从而提高行人重识别任务准确率。  相似文献   

15.
提出了一种基于特征点的单应矩阵鲁棒估计算法.在图像的尺度空间中提取特征点,并对特征点进行亚像素定位.同时赋予主方向.根据邻域信息计算得到特征向量后,利用最近邻特征点距离与次近邻特征点距离之比得到初始匹配点对.用RANSAC(Random Sample Consensus)算法匹配特征点对,同时计算得到两幅图像之间的单应...  相似文献   

16.
显著性实例分割是指分割出图像中最引人注目的实例对象。现有的显著性实例分割方法中存在 较小显著性实例不易检测分割,以及较大显著性实例分割精度不足等问题。针对这 2 个问题,提出了一种新的 显著性实例分割模型,即注意力残差多尺度特征增强网络(ARMFE)。模型 ARMFE 主要包括 2 个模块:注意力 残差网络模块和多尺度特征增强模块,注意力残差网络模块是在残差网络基础上引入注意力机制,分别从通道 和空间对特征进行选择增强;多尺度特征增强模块则是在特征金字塔基础上进一步增强尺度跨度较大的特征信 息融合。因此,ARMFE 模型通过注意力残差多尺度特征增强,充分利用多个尺度特征的互补信息,同时提升 较大显著性实例对象和较小显著性实例对象的分割效果。ARMFE 模型在显著性实例分割数据集 Salient Instance Saliency-1K (SIS-1K)上进行了实验,分割精度和速度都得到了提升,优于现有的显著性实例分割算法 MSRNet 和 S4Net。  相似文献   

17.
臂丛神经超声影像信噪比(SNR)低、边缘模糊且人工分割难度较大。现有的分割模型虽然取得了一些成果,但碍于臂丛神经结构目标区域小、形状不规则,分割效果欠佳。针对上述问题,设计基于多尺度特征融合的臂丛神经分割模型,即针对神经部位分割的特征金字塔网络(Ner-FPN)。在特征提取阶段,设计一种仿Xception的结构进行多尺度特征提取;在预测分割阶段,采用双向FPN结构进行特征融合预测。在Kaggle臂丛神经超声影像分割竞赛的BP数据集上的实验结果表明,Ner-FPN模型对臂丛神经分割的Dice相似系数(DSC)可达0.703,与主流的深度学习分割模型U-Net、SegNet相比,分别提高了10.7个百分点和14.5个百分点,对比相同数据集中的其他改进模型QU-Net和Efficient+U-Net,DSC分别提高了5.5个百分点和3.4个百分点,可见所提模型能够起到辅助诊断的效果。  相似文献   

18.
由于牧场牛只分布不均以及尺度变化大,传统的目标计数算法在畜牧领域计数精度不高,且用于研究的牛只数据集较少。针对这些问题创建了一个用于牛只密度估计的数据集,并提出了一种基于多尺度残差视觉信息融合的牧场牛只数量估计方法。该方法利用多个并列且空洞率不同的空洞卷积提取牛只目标的多尺度特征,并将残差结构与小空洞率卷积相结合,设计出更适合牛只活体计数的深度神经网络,从而缓解了由空洞卷积带来的“网格效应”的影响,同时能更好地适应牛只的多尺度变化。在牛只密度数据集中,该方法取得了最低的平均绝对误差(MAE)和均方根误差(RMSE)。此外,在密集人群数据集中,该方法的MAE和RMSE也属于最优或次优结果。实验结果表明,该方法不仅适用于牛只场景的数量估计,在人群密度估计中也有较高的准确性和鲁棒性。  相似文献   

19.
针对多尺度生成式对抗网络图像修复算法(MGANII)在修复图像过程中训练不稳定、修复图像的结构一致性差以及细节和纹理不足等问题,提出了一种基于多特征融合的多尺度生成对抗网络的图像修复算法。首先,针对结构一致性差以及细节和纹理不足的问题,在传统的生成器中引入多特征融合模块(MFFM),并且引入了一个基于感知的特征重构损失函数来提高扩张卷积网络的特征提取能力,从而改善修复图像的细节性和纹理特征;然后,在局部判别器中引入了一个基于感知的特征匹配损失函数来提升判别器的鉴别能力,从而增强了修复图像的结构一致性;最后,在对抗损失函数中引入风险惩罚项来满足利普希茨连续条件,使得网络在训练过程中能快速稳定地收敛。在CelebA数据集上,所提的多特征融合的图像修复算法与MANGII相比能快速收敛,同时所提算法所修复图像的峰值信噪比(PSNR)、结构相似性(SSIM)比基线算法所修复图像分别提高了0.45%~8.67%和0.88%~8.06%,而Frechet Inception距离得分(FID)比基线算法所修复图像降低了36.01%~46.97%。实验结果表明,所提算法的修复性能优于基线算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号