首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 211 毫秒
1.
针对基于特征提取的手势识别算法准确率低和速度慢的问题,提出了一种基于改进YOLOV4的手势交互算法.利用数据增强的方法解决了手势数据较少的问题,同时优化YOLOV4的网络模型,改变原特征图分辨率使其能够检测到更完整的手势特征,通过K-means算法重新计算先验框的尺寸以提高对不同大小手势的识别率.将该方法与原始的YOL...  相似文献   

2.
针对现有的草莓检测算法模型参数量大、准确率低、实时性差等问题,提出一种改进型YOLOv5草莓检测算法。算法基于YOLOv5模型,骨干网络引入GhostConv和C3Ghost模块进行参数量压缩,构造轻量化模型;加入Cutout增强数据,增加训练样本的多样性,进而提高模型的泛化能力和抗干扰能力;通过引入Gather-Excite和Transformer注意力机制加强对草莓图像重要特征的关注,从而提升检测算法在复杂环境下的识别能力。实验显示,所提算法的平均精度均值1和平均精度均值2分别为97.7%和83.5%,参数量缩减为4.01 M,推理时间为26.3 ms。改进后的算法相比原算法具有识别速度快、定位准度高以及占用内存少的优势,在满足精准采摘工作要求的前提下可以提高采摘效率。  相似文献   

3.
基于加速度识别的姿态交互研究   总被引:1,自引:0,他引:1  
手势识别作为人机交互的一种重要实现技术一直是模式识别领域的研究热点之一.提出一种基于加速度的手势识别方法.首先为每个手势动作建立隐马尔可夫模型,通过采集到的手势动作的加速度值对模型进行优化,再利用优化的模型对加速度序列进行分类,根据加速度的不同对手势进行识别.该方法在手持移动设备上有良好的识别效果,对手持移动设备的交互研究具有重要意义.  相似文献   

4.
网络透视中延迟推理算法的研究和改进   总被引:1,自引:0,他引:1  
针对许多情况下网络参数不能直接测量的问题,网络透视方法将网络测量与统计推理相结合,间接得到网络中的链路性能参数.针对链路延迟的测量,介绍了网络透视中的基本EM算法,在减小矢量搜索空间,减少在一个时间窗口内调用EM算法次数,利用前面时间窗口的计算结果来避免当前时间窗口的重复EM计算等3个方面提出了降低EM算法计算复杂性的方法,并综合这些方法得出了改进的EM算法.实验表明,使用改进后的算法得到的推理结果能很好地逼近真实结果,并且在效率上有明显的提高.  相似文献   

5.
为了解决双流融合网络对动态手势关键帧及手部轮廓特征检测不足的问题,提出一种手势时空特征与通道注意力融合的动态手势识别方法.首先,在双流融合网络中引入有效通道注意力(eficient channel attention,ECA)增强双流识别算法对手势关键帧的关注度,并利用双流中的空间卷积网络和时间卷积网络分别提取动态手势中的空间和时序特征;其次,通过ECA在空间流中选取最高关注度的手势帧,利用单发多框检测器技术(single shot multibox detector,SSD)提取相应手部轮廓特征;最后,将手部轮廓特征与双流中提取的人体姿态特征、时序特征融合后分类识别手势.该方法在Chalearn 2013多模态手语识别数据集上进行了验证,准确率为66.23%,相比之前在该数据集上仅使用RGB信息进行双流识别的方法获得了更好的手势识别效果.  相似文献   

6.
基于积分图运算的阈值分割将图像二值化,使用仿射变换完成文本字段图像的方向校正,从而实现文本行的定位.在原始卷积循环神经网络(CRNN)的基础上,将骨干网络替换成MobileNet-V3结构,在2层LSTM之间加入注意力机制,同时引入中心损失函数.利用改进的CRNN实现文本行字符的识别.将改进后的CRNN在40 510张芯片文本行图像上进行测试.通过小样本数据集进行模型微调训练得到多个子模型,从而实现集成推理,使用3个模型的综合识别准确率稳定在99.97%左右,单张芯片图像的总识别时间小于60 ms.实验结果表明,改进的CRNN算法的准确率比原始CRNN提升了大约27.48%,多模型集成推理的方法可以实现更高的准确率.  相似文献   

7.
针对输送带纵向撕裂目标检测维度单一、模型复杂度高等问题,提出一种高效的MobileNetv3及YOLOv4集成网络输送带纵向撕裂多维度实时检测方法.基于YOLOv4目标识别算法,通过将轻量化网络MobileNetv3代替CSPDarknet53作为骨干网络,结合高效通道域ECA模块和空间域注意力机制(STNet)构建混合域注意力网络(ECSNet),改进了MobileNetv3嵌入ECSNet,并且提升了模型对空间和通道的关注度.引入深度可分离卷积块代替网络中3*3卷积,并将YOLOv4的检测头(Prediction Heads)缩减为2种尺度,轻量化模型降低网络复杂度和训练难度,完成ECSMv3_YOLOv4模型的搭建,使用K-means聚类6个Anchors预测目标框高宽,提高网络对表面撕裂的检测性能.研制带式输送机多维度智能巡检样机,采集制作输送带多维度面的纵向撕裂数据集,开展网络模型的训练、测试、识别和定位实验.结果表明,提出算法在测试集中的平均识别准确率为97.8%,识别速度为37帧/s,模型的计算量和参数量为4.882 G和8.851 M,通过试验不同的网络模型效果和改变光...  相似文献   

8.
为了解决基于计算机视觉的人类手势识别问题,提出一种名为层次化Bag-of-Features(BoF)的模型.该模型通过对人手区域进行划分和对图像特征分别向水平和垂直轴投影来提取图像特征的空间分布信息.为了准确快速地实现手势识别,构建一种基于直方图交叉核的手势识别分类算法.该算法结构简单、运行效率高,而且充分利用层次化BoF模型的结构特点.为了进一步提高在复杂背景下手势识别准确率和运行效率,采用一种基于谱和直方图交叉核的背景特征点过滤算法.实验结果显示,所提算法对于简单背景下的手势识别准确率可达99.79%,而对于复杂背景下的识别准确率为80.01%.  相似文献   

9.
手势识别作为人机交互的有效手段,成为当前研究的热点话题.针对动态手势识别存在时空多变性、特征复杂性等问题,本文提出了一种基于三维骨骼信息的动态手势识别方法.动态手势具有时间上的差异性和复杂性,极大地影响了动态手势识别的准确率.因此,本文设计了一种动态手势关键帧提取算法,该算法可以提取动态手势关键部分,用于进一步的特征提...  相似文献   

10.
针对移动自组织网络中基于位置信息的路由算法在空洞存在时仅能生成非优化路径的问题,提出了利用空洞广播来构造优化路径的算法.在利用空洞检测技术收集网络中空洞的边界节点集信息后,将空洞信息进行广播.为减小网络开销,仅将边界节点集的凸包进行广播,并将广播限制在计算出的广播域内.当传输数据包到达广播区域内后,节点匹配目标位置与空洞边界节点集凸包的关系,并以此构造出通过空洞的优化路径.仿真结果表明该算法在存在空洞网络中通过构造优化路径,相对于GOAFR+算法最多降低25ms的传输时延.最后,对该算法在实际应用中的适用条件进行了分析.该算法适用于网络拓扑变化率较低,数据传输率较高的网络.  相似文献   

11.
在自动驾驶场景下,针对语义分割模型在车载硬件设备中部署时内存受限且算力不足的问题,需要设计一种较好权衡效率和精度的语义分割模型。采用单分支网络结构,设计了一个轻量级多尺度双向注意力网络。为了实现高效的特征提取,设计了一种轻量级卷积单元来构成网络的特征提取骨干。为了较好地定位和分割道路场景中尺度差异较大的物体,提出了一种多尺度双向注意力模块。它具有全局多尺度感受野,并且在沿一个方向编码通道注意力的同时保留了另一个方向的空间位置信息。基于该注意力模块,设计了跳跃注意力连接模块和特征注意力融合模块,使得输出特征兼具细节信息和语义信息。模型在Cityscapes数据集上以0.9M的参数量,取得了71.86%的平均交并比,同时在单个RTX2080Ti GPU下实现了88FPS的推理速度。实验结果表明,该模型能够实现较高的分割精度,适用于车载硬件下的部署和应用,具有一定的实用价值。  相似文献   

12.
针对现有的垃圾图像分类模型实时性能差和分类精度低的问题,提出基于改进MobileNet v2的垃圾图像分类方法,构建以MobileNet v2为核心的轻量级特征提取网络. 通过调整宽度因子降低模型的参数量;在模型中嵌入通道和空间注意力模块,增强网络对特征的细化能力;设计多尺度特征融合结构,增强网络对尺度的适应性;利用迁移学习的方式优化模型参数,进一步提高模型精度. 实验结果表明,算法在自建数据集上的平均准确率为94.6%,分别高于MobileNet v2、VGG16、GoogleNet、ResNet50、ResNet101模型2.0%、3.4%、3.2%、2.3%、1.2%;所提算法在2种公共图像分类数据集CIFAR-100和tiny-ImageNet中均取得不错表现;模型参数量仅为0.83 M,体积约为基础模型的2/5,在边缘设备JETSON TX2上的单次推理耗时68 ms,实现了推理速度和预测准确率的提升.  相似文献   

13.
为了提高手写体数字识别的准确率,设计并提出了一种基于连续非对称卷积结构的手写体数字识别的深度学习算法.以连续非对称卷积结构为基础,结合极限学习机和MSRA初始化设计网络结构.在识别输入图像时,利用CUDA并行计算与Cudnn神经网络GPU加速库对手写体数字识别进行加速.在MNIST手写体数字数据库上进行实验,提出的网络结构识别准确率达到99.62%,单张图像识别速度为0.005 8 s.经实验结果对比表明,该网络结构在识别准确率和识别速度上得到有效提升.  相似文献   

14.
为了解决三维裸手手势识别算法识别率低、易受类肤色物体干扰的问题,提出一种利用双目视觉视频的三维裸手手势识别算法.首先依据双目视觉原理推导出三维空间内手势深度与手势面积的关系,基于此关系对三维手势进行快速识别.为进一步降低算法复杂度,根据极线约束规则提出一种只计算手势质心匹配点的立体匹配算法.实验结果表明,与现有算法相比,所提算法性能在处理速度、识别准确率、鲁棒性方面均有明显提高.同时,提出的算法具有较强的开放性,可进一步根据需求定义、添加需识别的三维手势.  相似文献   

15.
针对现有车辆车型视觉识别技术中的检测精度不高、难以适应天气环境变化、难以从视频图像中准确提取出用于识别的车辆图像、难以对车辆车型子类进行识别分类、难以兼顾识别精度和检测效率等不足,将深度卷积神经网络引入车辆目标定位、识别和分类(子类)问题中.利用深度卷积神经网络自动完成车型的深度特征学习,在特征图上进行逻辑回归,从道路复杂背景中提取出感兴趣区域;利用softmax分类器训练特征实现车型识别;为了优化softmax在深度卷积神经网络分类过程中出现的类内间距大的问题,引入中心损失函数对softmax损失函数进行优化,提高类间分散性与类内紧密性.在BIT-Vehicle车型数据集中的实验结果显示,提出方法的平均精度为89.67%,检测和识别时间为159 ms;与传统的分类方法相比,识别精度提高约20%,效率提高10倍以上,检测鲁棒性有明显提升;与未改进前的深度卷积神经网络相比,检测精度提高0.6%,速度提高0.29倍.  相似文献   

16.
针对现有动态手势识别方法环境适应性低、计算复杂的问题,提出了一种基于视频数据特性的动态手势识别方法.使用基于密度的聚类算法DBSCAN直接从视频编码数据中的运动矢量提取出运动趋势特征,再通过随机森林分类运动趋势,结合卷积神经网络(CNN)提取的手型特征识别动态手势.实验结果表明,该方法对剑桥大学和美国西北大学数据集中动态手势的平均识别率分别达到94.22%和94.48%,并且与CNN结合长短期记忆网络的识别方法相比,手势识别时间减少了85%.在背景图像复杂且光照条件不足时,该方法仍然能够维持较高的识别率,表现出较好的鲁棒性.  相似文献   

17.
为了降低特征冗余,提高移动用户行为识别的准确率,提出一种基于蚁群算法的移动用户行为识别加速度信号特征优选方法。首先对样本数据进行预处理,根据特征对不同行为的分类敏感度进行初次优选,降低特征搜索空间的维度;然后利用蚁群算法结合神经网络分类器,以特征的分类准确度为评价准则对特征集合进行了二次优选。实验结果表明,该方法优选出的特征集具有较好的识别性能。  相似文献   

18.
设计了一种软硬结合的多模态情感识别系统,使用语音和面部表情两个模态,通过梅尔频率倒谱系数与卷积神经网络对情感进行识别和分类,同时将语音情感识别迁移到神经网络计算棒以降低环境负载. 在模态融合时,采用决策层融合的方式来提高识别准确率. 实验结果表明,系统拥有较高的识别准确率,且能够在性能较差的运行环境中保持运行速度.  相似文献   

19.
听力障碍者在全世界残疾人群体中占有较大的比重.他们能通过手语与健全人交流,但因手语不被大众所掌握,导致彼此交流存在较大障碍.为此提出了一种基于滑动窗口分割(SSW)的连续中国手语识别系统来实现手语自动识别.SSW系统将通过滑动窗口选取出来的手语信号平均分割,依次删去其中一组数据,从而得到新的数据,输入手语识别神经网络进行训练,得出单个手语单词手势预测值,最后运用基于阈值的多投票策略对识别出的预测值进行判断,得出识别结果.SSW系统在对20名志愿者采集的30条手语语句上进行训练,结果显示,所提SSW系统自动识别手语的平均准确率在测试集上达到83.9%,较长短期记忆网络模型提高了16.7%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号