首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 625 毫秒
1.
动作识别是计算机视觉领域的一项重要任务,主要有基于RGB视频和人体骨架两种数据模态的领域,主流方法分别是3D卷积神经网络和图卷积神经网络。针对视频和人体骨架两种数据模态的不同特点,设计了双分支网络分别对两种数据模态进行建模。对于人体骨架数据,基于自注意力机制设计了图卷积神经网络,该算法能在基于骨架的动作识别任务中达到先进的性能。对于视频数据,采用3D卷积网络进行特征提取。同时,利用深监督方法对两种数据模态的中间特征进行监督,提高两种数据特征的耦合度,进一步提高网络效率。这种算法的网络结构简单,在NTU-RGBD60(CS)数据集上仅用3.37×107的参数量可达到95.6%的精度。  相似文献   

2.
针对深层卷积神经网络在电容层析成像图像重建过程中存在电容特征提取尺度单一、中间层特征利用率不高等问题, 提出了一种多尺度自适应特征聚合网络模型。 首先,利用堆叠的增强型选择核卷积模块设计了一种特征增强模块(FEM),并 通过串联多个 FEM 自适应地提取电容向量多个尺度的特征信息,极大地减少了使用普通卷积所带来的伪影现象;其次,引入了 一种特征聚合机制,采用长短残差连接加强了远近特征信息的相关性,解决了网络中间层特征利用不充分的问题。 实验结果表 明,与传统算法及卷积神经网络算法相比,所提方法在主观视觉效果和客观评价指标上都具有更好的性能,图像相关系数最高 达到 0. 962 9,图像相对误差降低至 0. 053 0。  相似文献   

3.
针对复杂场景中交通标志尺度变化大导致识别精度低的问题,提出了一种改进的YOLOv4算法。首先,设计了一个注意力驱动的尺度感知特征提取模块,通过构建类似残差结构的分层连接方式,增加每层的感受野范围,以获得更具细粒度的多尺度特征,并在注意力驱动下生成一对具有方向感知与位置敏感的注意力图,使网络能聚焦于更具鉴别力的关键区域;然后,构建一个特征对齐的金字塔卷积特征融合模块,即通过卷积计算相邻尺度特征图间的特征偏移量进行特征对齐;最后,通过金字塔卷积的方式使网络自适应学习最优的特征融合模式,并构建特征金字塔用于识别不同尺度的交通标志。实验结果表明,在TT100K数据集上改进算法比原YOLOv4算法的识别精度提高了5.4%,且优于其他对比识别算法,FPS达到33.17,可满足道路交通标志识别的精确性、实时性等要求。  相似文献   

4.
针对现有算法忽略点云数据全局单点特征和局部几何特征的深层关系,导致捕获的局部几何信息缺乏鉴别性且难以有效识别复杂形状的问题,提出基于自注意力特征融合组卷积神经网络的三维点云语义分割算法.首先,设计轻量化网络框架的代理点图卷积提取点云局部几何特征,并加入组卷积操作减少计算量和复杂度,以较少的冗余信息增强特征的丰富性;其次...  相似文献   

5.
三维目标识别和模型语义分割在自动驾驶、机器人导航、3D打印和智能交通等领域均有着广泛应用。针对PointNet++未能结合三维模型的上下文几何结构信息的问题,提出一种采用深度级联卷积神经网络的三维点云识别与分割方法。首先,通过构建深度动态图卷积神经网络捕捉点云的深层语义几何特征;其次,通过将深度动态图卷积神经网络作为深度级联卷积神经网络的子网络递归地应用于输入点集的嵌套分区,以充分挖掘三维模型的深层细粒度几何特征;最后,针对点集特征学习中的点云采样不均匀问题,构建一种密度自适应层,利用循环神经网络编码每个采样点的多尺度邻域特征以捕捉上下文细粒度几何特征。实验结果表明,本算法在三维目标识别数据集ModelNet40和MoelNet10上的识别准确率分别为91.9%和94.3%,在语义分割数据集ShapeNet Part,S3DIS和vKITTI上的平均交并比分别为85.6%,58.3%和38.6%。该算法能够提高三维点云目标识别和模型语义分割的准确率,且具有较高的鲁棒性。  相似文献   

6.
为提高监控视频中行人异常行为检测效率,提出了结合关键帧定位和时空图卷积的异常行为识别方法。该方法在人体骨架关键点检测的基础上,采用关键点运动特性定位视频中行人异常行为关键序列,利用时空图卷积网络可以提取行人时空特征的优点,在关键帧序列上构建人体骨架时空图,同时建立基于瓶颈残差模块的时空图卷积网络行为识别模型,实现对监控视频中行人异常行为的高效识别。采用自建数据集和公开数据集对该方法有效性进行检验,结果表明,该键帧定位算法可高效实现异常行为定位,结合基于瓶颈残差模块时空图卷积网络,在减少时空图卷积网络计算复杂度的同时提升了网络性能,能够有效判断行人异常行为。  相似文献   

7.
不同于普通图像压缩,多光谱图像压缩除了需要去除空间冗余同时还需要去除光谱间冗余,近年来研究表明端到端的卷积神经网络模型在图像压缩方面具有很好的性能,但对于多光谱图像压缩其编解码器并不能有效解决同时高效提取到多光谱图像空间和光谱间特征的问题,同时也会忽略图像局部特征信息。针对以上问题,本文提出了一种融合多尺度特征卷积神经网络的多光谱图像压缩方法。所提出网络在压缩模型的编解码器中嵌入了可以提取出不同尺度下空间和光谱间特征信息的多尺度特征提取模块,以及可以用来捕捉局部空间信息和光谱信息的空间光谱间非对称卷积模块。实验表明,与传统算法如JPEG2000和3D-SPIHT以及深度学习方法相比,在Landsat-8的7波段和Sentinel-2的8波段数据集上所提出模型的峰值信噪比(PSNR)指标高于传统算法1-2dB。在平均光谱角度(MSA)指标的衡量下,所提出的模型在Landsat-8数据集上优于传统算法约8×10-3 rad,在Sentinel-2数据集上优于传统算法约2×10-3 rad。满足了多光谱图像压缩对空间和光谱间特征提取以及局部特征提取...  相似文献   

8.
构建多尺度深度卷积神经网络行为识别模型   总被引:3,自引:0,他引:3  
为了减化传统人体行为识别方法中的特征提取过程,提高所提取特征的泛化性能,本文提出了一种基于深度卷积神经网络和多尺度信息的人体行为识别方法。该方法以深度视频为研究对象,通过构建基于卷积神经网络的深度结构,并融合粗粒度的全局行为模式与细粒度的局部手部动作等多尺度信息来研究人体行为的识别。MSRDailyActivity3D数据集上的实验得出该数据集上第11~16种行为的平均识别准确率为98%,所有行为的平均识别准确率为60.625%。结果表明,本方法能对人体行为进行有效识别,基本能准确识别运动较为明显的人体行为,对仅有手部局部运动的行为的识别准确率有所下降。  相似文献   

9.
针对现有动作分割算法中过分割问题导致预测错误、造成分割质量下降的现象,提出一种可调视频动作边界信息作为参考的多阶段参考网络,在基于多阶段时间卷积网络的主干网络中,为每个阶段独立引入视频动作边界信息作为参考.各阶段使用相同的边界信息会使模型固化,为使主干网络能够调整参与各阶段输出计算的边界值,对不同样本区分处理,提出多层...  相似文献   

10.
为更好地解决由于相机抖动、物体之间相对运动等因素引起的图像模糊问题,本文设计了一种多尺度交替连接残差网络用于图像去模糊,采用"从粗到细"的多尺度方式来逐渐恢复出清晰图像。首先,提出一种多尺度残差模块来拓展网络宽度,提取并融合不同尺度之间的特征信息;其次,提出一种基于扩张卷积的交替连接残差模块来逐渐恢复模糊图像的高频信息;最后,利用一层卷积来对特征图进行重建。实验结果表明:本文所提去模糊算法的峰值信噪比以及结构相似度分别为32.313 6 dB和0.942 5,均高于目前先进的图像去模糊技术。从评价指标和主观效果上均可看出本文所提去模糊方法具有更强的图像恢复能力,纹理细节更丰富,能够有效提升图像去模糊效果,具有更强的实用价值。  相似文献   

11.
根据车间人员操作监控的需要,文中研究了一种基于深度学习的新方法——时空图小波神经网络(ST-GWNN)。该算法对图小波卷积进行参数化,以降低每层图卷积层的参数复杂度,并采用一阶切比雪夫多项式逼近图小波卷积;分离多项式阶数 K 与邻接节点阶数之间的关系,固定多项式阶数,通过调整超参数 s 来改变邻域范围,从而识别更多复杂的手部动作。实验结果表明,文中提出的ST-GWNN在动作识别中的识别率优于目前常用的时空图卷积神经网络,并且能够充分利用动作的时空关联性。  相似文献   

12.
针对液膜密封状态监测领域无损监测开发不足、信号特征评估困难以及摩擦状态判别智能化特性缺乏的问题,提出一种基于声发射时频分析与卷积神经网络的液膜密封摩擦状态识别方法。该方法将声发射无损监测技术应用于液膜密封的摩擦状态监测,卷积神经网络作为液膜密封摩擦状态自主决策的实现手段,声发射信号的时频信息作为卷积神经网络的特征输入,分析短时傅立叶变换、 S变换以及小波变换3种时频分析方法对卷积神经网络识别性能的影响。结果表明:对于液膜密封的声发射信号,3种时频分析方法与卷积神经网络结合的优选顺序为:短时傅立叶变换、 S变换、小波变换;基于声发射时频分析与卷积神经网络的液膜密封摩擦状态识别方法准确率较高,相比其他识别方法取得了较好的识别效果。  相似文献   

13.
深度神经网络的管道泄漏孔径识别方法虽然识别率高,但因结构复杂造成参数量大、内存占用大,极大地限制了其在资源有限的工业环境及实时处理中的应用。提出一种优化卷积改进稠密块的轻量化神经网络用于管道泄漏孔径识别。首先将深度可分离卷积与异构卷积结合,构造了新的多卷积稠密块实现泄漏信号的特征提取;之后采用卷积注意力机制对特征进行权重划分,实现特征的重要性区分;最后通过分类器获取结果。实验结果表明,本文方法识别准确率达到了96.59%,参数量仅为781 KB。本文方法在保证高识别准确率的同时,参数量及浮点数大幅下降,训练时间也有所减少,改善了实时响应能力,对于实际工业监测应用有指导意义。  相似文献   

14.
针对传统双流网络无法捕捉视频序列中的时序关系从而导致对时序依赖较大的行为识别效果不理想的问题,提出一种基于改进双流时空网络的人体行为识别算法。首先利用时间移位思想,使卷积神经网络对视频中的时序关系建模,从而高效地捕捉视频中的时空信息;同时使用注意力机制改善由于通道信息在时间轴上移动导致的空间特征学习能力下降的问题;在此基础上构建了一个包含时空表观信息流和时空运动信息流的双流网络结构;最后,采用加权平均的方式融合双流网络,得到最终的识别结果。在UCF101和HMDB51数据集上分别进行了实验,识别准确率为96.3%和77.7%,实验结果表明,与传统双流网络方法相比,识别准确率得到了一定的提升,验证了本文算法能够有效捕捉视频中的时序关系,增强网络的特征表达能力,提高对时序依赖较大的行为和近似行为的辨识能力。  相似文献   

15.
电力企业智能招聘系统对电力企业招贤纳才,提高电力企业市场竞争力具有至关重要的作用。本文将卷积神经网络作用于智能招聘系统原始图像,采用K均值聚类算法对图像进行识别,同时对招聘系统的用户管理模块、信息检索模块、求职管理模块以及安全验证模块进行了设计与实现。将深度学习的经典算法卷积神经网络应用于智能招聘系统中使得智能招聘系统的安全性、智能性得到了很大程度的提升,对智能招聘系统的设计具有一定的实用价值。  相似文献   

16.
针对实际工程中因故障样本数据稀少而导致模型识别准确率不高的问题,提出了一种基于自校正卷积神经网络( SCCNN)的滚动轴承故障诊断模型,并将其应用于小样本条件下的故障识别研究。 首先,为减少不同信号的数据分布差异,在每个 卷积层后添加 BN 算法;其次,利用自校正卷积学习信号的多尺度特征,提高模型获取有用故障特征的能力;然后,引入通道自 注意力机制,建立通道特征信息之间的相关性,用于突出故障特征并抑制数据过拟合;再将少量训练样本输入到模型中进行学 习;最后,将各类不同条件下的故障信号输入到训练好的 SC-CNN 模型进行识别分类,并在两个数据集上进行实验验证。 结果 表明,所提模型在信噪比为-4 dB 的强噪声环境下,识别准确率分别为 98. 64% 和 99. 83% ,在变工况条件下,识别准确率分别为 94. 37% 和 99. 64% ,验证了 SC-CNN 模型在小样本条件下具有较强的鲁棒性和泛化性能。  相似文献   

17.
王鉴  张荣福 《光学仪器》2021,43(6):26-31
针对目前眼球定位追踪算法存在的眼球定位精准度不高问题,以及为了改进眼球追踪算法的精准度并保证一定的图片处理速度,将可变形卷积网络应用于YOLO网络,对特征分布提取层面进行改进。利用可变形卷积的形变建模能力对卷积核中的各个采样点的位置增加一定的偏移变量,从而从原始单帧图像中提取更具有表征特征的信息,并与先进眼球定位追踪检测网络进行了实验对比。研究表明,可变形卷积YOLO网络的精准度可以达到0.685,平均处理图片刷新率达42帧/s,优于原YOLO网络以及其他眼球定位追踪检测网络。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号