首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
构建多尺度深度卷积神经网络行为识别模型   总被引:3,自引:0,他引:3  
为了减化传统人体行为识别方法中的特征提取过程,提高所提取特征的泛化性能,本文提出了一种基于深度卷积神经网络和多尺度信息的人体行为识别方法。该方法以深度视频为研究对象,通过构建基于卷积神经网络的深度结构,并融合粗粒度的全局行为模式与细粒度的局部手部动作等多尺度信息来研究人体行为的识别。MSRDailyActivity3D数据集上的实验得出该数据集上第11~16种行为的平均识别准确率为98%,所有行为的平均识别准确率为60.625%。结果表明,本方法能对人体行为进行有效识别,基本能准确识别运动较为明显的人体行为,对仅有手部局部运动的行为的识别准确率有所下降。  相似文献   

2.
针对分心驾驶行为识别,提出基于ResNet18的多标签分心驾驶行为识别方法和基于迁移学习的多分类分心驾驶行为识别方法.首先基于ResNet18模型连接多个全连接层,对多种行为进行多标签识别;然后利用迁移学习,提出基于改进的ResNet34模型进行多分类识别.实验结果表明:文章提出的改进算法对分心驾驶行为识别的准确率最高...  相似文献   

3.
鉴于基于视频的人体行为识别中的视频流数据过于庞大,3D卷积核参数设置过多,存在训练时间较长,调参困难等问题,以3D卷积神经网络为基础,提出一种将3D卷积核拆分成空间域和时间域两种卷积核的神经网络结构。两种卷积核分别形成两个数据流进行交互,同时引入残差网络以优化网络结构,减少参数设置。将所提方法应用于两个行为识别数据集KTH和UCF101上进行训练验证,其行为识别准确率分别为96.2%和90.7%。结果表明,较改进前的神经网络框架,所提方法在保证动作识别准确度的前提下,训练速度提高了7.5%~7.8%。该方法可以有效降低深度学习进行行为识别的硬件要求,提高模型训练效率,并可以广泛应用于智能机器人领域。  相似文献   

4.
由于视频中的手工特征和主观情感之间的直接相关性很小,识别视频序列中的面部表情是一项很有挑战性的任务,为了克服这个缺陷,有效提高视频中的人脸表情识别性能。本方法采用两个深度卷积神经网络,即空间卷积神经网络和时间卷积神经网络,用于视频中的时空表情特征学习。其中,空间卷积神经网络用于提取视频中每一帧静态的表情图像的空间信息特征,而时间卷积神经网络用于从视频中多帧表情图像的光流信息中提取动态信息特征。然后,将这两个深度卷积神经网络学习到的时空特征进行基于深度信念网络(DBN)的特征层融合,输入到支持向量机实现视频中的人脸表情分类任务。在公共的RML和BAUM-1s视频情感数据集的测试结果表明,该方法分别取得了71.06%和52.18%的正确识别率,明显优于现有文献报导的结果。多模深度卷积神经网络的人脸表情识别方法能提高视频中人脸表情的识别性能。  相似文献   

5.
视觉里程计利用视频信息来估计相机运动的位姿参数,实现对智能体的定位。传统视觉里程计方法需要特征提取、特征匹配/跟踪、外点剔除、运动估计、优化等流程,解算非常复杂,因此,提出了基于卷积神经网络的方法来实现端对端的单目视觉里程计。借助卷积神经网络对彩色图片自动学习提取图像帧间变化的全局特征,将用于分类的卷积神经网络转化为帧间时序特征网络,通过三层全连接层输出相机的帧间相对位姿参数。在KITTI数据集上的实验结果表明,提出的Deep-CNN-VO模型可以较准确地估计车辆的运动轨迹,证明了方法的可行性。在简化了复杂模型的基础上,与传统的视觉里程计系统相比,该模型的精度也有所提高。  相似文献   

6.
通过对正电子探测成像技术获得的γ光子图像进行分类识别,有利于后续有针对性地快速获取图像所包含的有效信息。在MatConvNet上利用迁移学习的方法搭建深度卷积神经网络,通过对其参数的调整进一步提高网络分类识别的性能。为了验证网络性能,设计了10组不同形状的管材模型,利用仿真得到的扫描时间为1s的γ光子图像样本集对网络进行训练后,将其应用于扫描时间为0.1 s的γ光子图像样本进行分类识别,发现分类准确率在图像质量偏差、扫描时间为0.1 s的γ光子图像样本上仍然达到了94.72%。可见所搭建的深度卷积神经网络对γ光子图像具有很好的分类识别性能。  相似文献   

7.
8.
基于四元数时空卷积神经网络的人体行为识别   总被引:1,自引:0,他引:1       下载免费PDF全文
孟勃  刘雪君  王晓霖 《仪器仪表学报》2017,38(11):2643-2650
传统卷积神经网络(CNN)只适用于灰度图像或彩色图像分通道的特征提取,忽视了通道间的空间依赖性,破坏了真实环境的颜色特征,从而影响人体行为识别的准确率。为了解决上述问题,提出一种基于四元数时空卷积神经网络(QST-CNN)的人体行为识别方法。首先,采用码本算法预处理样本集所有图像,提取图像中人体运动的关键区域;然后将彩色图像的四元数矩阵形式作为网络的输入,并将CNN的空间卷积层扩展为四元数空间卷积层,将彩色图像的红、绿、蓝通道看作一个整体进行动作空间特征的提取,并在时间卷积层提取相邻帧的动态信息;最后,比较QST-CNN、灰度单通道CNN(Gray-CNN)和RGB 3通道CNN(3Channel-CNN)3种方法的识别率。实验结果表明,所提方法优于其他流行方法,在Weizmann和UCF sports数据集分别取得了85.34%和80.2%的识别率。  相似文献   

9.
增值税发票信息在金融领域至关重要,自动识别发票信息可以节约人工成本和时间成本.因此,文中提出设计一种基于改进LeNet-5卷积神经网络的发票自动识别方法,将改进LeNet-5卷积神经网络算法应用于发票识别后,经验证表明,应用改进LeNet-5卷积神经网络算法的发票信息识别率得到了提高.  相似文献   

10.
由于钣金件在加工过程中受力变形弯曲,使压铆圆孔图像识别困难及分类错误,影响了机器视觉的识别效率与准确度.据此,依次使用基于卷积神经网络的圆孔分类和基于霍夫变换的圆检测算法,设计了一种自动压铆对位系统.检测结果表明:1)在经过1 5000次神经网络迭代训练后,交叉熵损失处于0.58以下,平均分类准确率达97%;2)铆接点...  相似文献   

11.
针对传统故障识别方法不仅过分依赖专家经验对故障特征进行提取且识别准确率不高的问题,在深度学习理论基础上,提出了一种将一维卷积神经网络与SVM分类器相结合的改进深度卷积神经网络,实现调压器“端到端”的故障识别。首先,介绍了传统卷积神经网络结构;其次,将改进后的一维卷积神经网络与SVM相结合,提出了基于1-MsCNN-SVM算法的调压器故障识别模型,并对模型的组成部分进行了介绍;然后,通过对比实验确定了模型的卷积核长度和卷积层组数;最后,为验证模型的有效性,基于燃气调压器故障数据集,开展了燃气调压器故障识别研究。研究结果表明,改进后的1-MsCNN-SVM算法故障识别准确率高达99.20%,模型具有较好的分类准确率。  相似文献   

12.
13.
作为计算机视觉中的基本视觉识别问题,目标检测在过去的几十年中得到了广泛地研究。目标检测旨在给定图像中找到具有准确定位的特定对象,并为每个对象分配一个对应的标签。近年来,深度卷积神经网络DCNN(Deep Convolutional Neural Networks)凭借其特征学习和迁移学习的强大能力在图像分类方面取得了一系列突破,在目标检测方面,它越来越受到人们的重视。因此,如何将CNN应用于目标检测并获得更好的性能是一项重要的研究。首先回顾和介绍了几类经典的目标检测算法;然后将深度学习算法的产生过程作为切入点,以系统的方式全面概述了各种目标检测方法;最后针对目标检测和深度学习算法面临的重大挑战,讨论了一些未来的方向,以促进深度学习对目标检测的研究。  相似文献   

14.
三维目标识别和模型语义分割在自动驾驶、机器人导航、3D打印和智能交通等领域均有着广泛应用。针对PointNet++未能结合三维模型的上下文几何结构信息的问题,提出一种采用深度级联卷积神经网络的三维点云识别与分割方法。首先,通过构建深度动态图卷积神经网络捕捉点云的深层语义几何特征;其次,通过将深度动态图卷积神经网络作为深度级联卷积神经网络的子网络递归地应用于输入点集的嵌套分区,以充分挖掘三维模型的深层细粒度几何特征;最后,针对点集特征学习中的点云采样不均匀问题,构建一种密度自适应层,利用循环神经网络编码每个采样点的多尺度邻域特征以捕捉上下文细粒度几何特征。实验结果表明,本算法在三维目标识别数据集ModelNet40和MoelNet10上的识别准确率分别为91.9%和94.3%,在语义分割数据集ShapeNet Part,S3DIS和vKITTI上的平均交并比分别为85.6%,58.3%和38.6%。该算法能够提高三维点云目标识别和模型语义分割的准确率,且具有较高的鲁棒性。  相似文献   

15.
针对传统的计算机磨粒识别方法对相似度高的严重滑动磨粒和疲劳磨粒存在识别过程复杂、识别准确率低等问题,提出利用卷积神经网络(Convolution Neural Network,CNN)自动提取铁谱磨粒图像的特征,再将提取到的特征传入全局平均池化层和新的全连接层进行训练分类的铁谱磨粒智能识别方法。试验显示,基于卷积神经网络模型Inception-v3+1FCL和迁移学习方法可以有效地对严重滑动磨粒和疲劳磨粒进行分类识别,准确率高达89. 35%。  相似文献   

16.
17.
在机器人自动化焊接中,精准高效的焊缝识别是实现高质量焊接的关键。针对现有视觉检测方法效率低、精度差的问题,提出了一种基于全卷积神经网络的焊缝识别方法。该方法首先采集数据对全卷积神经网络进行训练,得到最佳的网络参数;然后采用训练好的全卷积神经网络和最佳网络参数对焊缝图片进行语义分割,将焊缝所在区域与背景进行分离;然后对分割出的焊缝区域,进行骨架提取,得到接近单像素宽度的焊缝;之后根据自定义的直线度参数对焊缝形状进行判定,确定该焊缝是否为直线,用最小二乘法进行直线或曲线拟合,得到最终的焊缝轨迹。实验结果表明,所提方法能够快速准确地识别出焊缝位置和形状,可以作为自动焊接机器人轨迹自主规划和控制的技术基础。  相似文献   

18.
摘键要:在玻璃瓶的生产中,玻璃瓶制品的质量检测显得尤为重要。随着计算机硬件的更新进步和不同视觉检测算法提出,在工业中机器视觉产品检测逐渐代替人工检测。针对玻璃瓶口的缺陷检测,对玻璃瓶口进行图像采集及预处理,采用预处理的缺陷图作为数据集,利用嵌套残差神经网络的图像识别模型对玻璃瓶口进行缺陷检测并分类。实验结果表明,该方法能够有效提高玻璃瓶口缺陷分类的正确率,验证了该方法的有效性。  相似文献   

19.
人体动作识别是智能监控、人机交互、机器人等领域的一项重要技术,基于人体骨架序列的动作识别方法在面对复杂背景以及人体尺度、视角和运动速度等变化时具有先天优势。时空图卷积神经网络模型(ST-GCN)在人体行为识别中具有卓越的识别性能,针对ST-GCN网络模型中的分区策略只关注局部动作的问题,设计了一种新的分区策略,通过关联根节点与更远节点,加强身体各部分信息联系和局部运动之间的联系,将根节点的相邻区域划分为根节点本身、向心群、远向心群、离心群和远离心群等5个区域,同时为各区域赋予不同的权重,提升了模型对整体动作的感知能力。最后,分别在公开数据集和真实场景下进行实验测试,结果表明,在大规模数据集Kinetics-skeleton上获得了31.1%的Top-1分类准确率,相比原模型提升了0.4%;在NTU-RGB+D的两个子数据集上分别获得了83.7%和91.6%的Top-1性能指标,相比原模型提升了2.3%和3.3%;在真实场景下,所提模型对动作变化明显且区别大的动作如俯卧撑和慢跑识别率高,对局部运动和动作变化相近的动作如鼓掌和摇头识别率偏低,尚有进一步提高的空间。  相似文献   

20.
李德华  刘献礼 《工具技术》2019,53(12):82-87
刀具状态检测可以有效降低加工过程中刀具的不确定性,提高数控加工质量和效率,降低加工成本。在小批量制造模式下的复杂零件制造过程中,零件的几何形状和加工参数不断变化,刀具所受外力也在不断改变,进而导致刀具磨损速率持续变化。传统的固定切削时间更换刀具的方法只能采取更加保守的切削时间更换刀具,给加工过程增加了很多的不确定性,并造成严重的刀具浪费。本文针对以上问题提出了一种刀具磨损在线测量方法,通过电子显微镜在线拍摄刀具照片,经小波滤波降噪处理后的图片由卷积神经网络进行处理,并自动计算出刀具磨损量。该方法可以有效地提取出刀具磨损量,测量误差不超过0.02mm。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号