首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 468 毫秒
1.
为了实现手语视频中手语字母的准确识别,提出一种基于DI_CamShift(depth image CamShift)和手语视觉单词(sign language visual word,SLVW)特征结合的算法.首先,采用Kinect获取手语字母手势视频及其深度信息;其次,通过计算获得深度图像中手语手势的主轴方向角和质心位置,计算搜索窗口对手势跟踪;再次,使用基于深度积分图像的大津法(OTSU)分割手势并提取其尺寸不变特征转换(scale invariant feature transform,SIFT)特征和Gabor特征,并通过典型相关分析(canonical correlation analysis,CCA)方法进行特征融合;最后,构建SLVW词包并用支持向量机(support vector machine,SVM)进行识别,单个手语字母最高识别率为99.89%,平均识别率为96.34%.  相似文献   

2.
目前,非特定人手语识别与特定人系统相比还有较大的差距.手语数据差异性使得非特定人手语识别中提取手语数据有效的共同特征非常困难,因而,手语数据差异性在一定程度上影响了非特定人手语识别的识别效果.本文从手语数据存在差异性这一角度入手,利用流形概念的学习和推理能力并在流形允许变化的范围内进行有效建模.在建模的过程中,从范函求极值的角度出发,给出了一个让人容易理解且直观化的推导过程.进而应用流形概念中的切向量来改进手语识别的统计模型(TV/HMM)并应用于大词汇量非特定人手语识别,以解决手语数据的差异性对大词汇量非特定人手语识别所造成的影响.实验表明,改进后的TV/HMM识别系统在大词汇量非注册的易混词集上识别率高明显.  相似文献   

3.
在手语识别研究中,非特定人手语识别参数训练的样本缺乏影响了非特定人手语识别的识别率.区分性训练可以很好的弥补由于训练样本的缺乏对识别系统所造成的影响,能够提高非特定人手语识别的识别率.对区分性训练(DT)所改进的HMM参数训练模型(DT/HMM)做了全新的推导,获得了与HMM相一致齐全的DT/HMM的参数模型.在特定人识别系统上应用可区分性训练的h准则获取了h参数,将该齐全的DT/HMM的参数训练模型和h参数,应用于大词汇量的非特定人手语识别当中,加入主观经验后的非注册易混词集EXP 与MLE和EBW的非注册易混词集相比,平均识别率分别提高了10.65%和9.55%.  相似文献   

4.
针对海量图像数据中目标的分割及识别问题,提出了一种自适应控制下图像分割及并行挖掘算法.采用隶属度函数窗口宽度在图像直方图控制下自适应调整模糊阈值图像分割方法对图像进行分割,提取出感兴趣的潜在目标区域,基于共轭梯度法改进的BP神经网络算法对潜在的目标区域进行训练和识别,识别算法基于OpenMP并行处理模型开发来提高执行效率.结果表明:本文算法相对于基于偏移场的模糊C均值、灰度波动变换自适应阈值和自适应最小误差阈值具有更高的分割准确率,与传统神经网络算法的识别结果相比,平均识别率提高了8%,运行时间减少了2. 5 s.  相似文献   

5.
针对音乐分割中预训练模型和待分割信号间的不匹配问题,提出基于置信测度的自适应模型更新算法.在基于预训练模型的识别结果中,通过置信测度选择可靠的数据进行高斯混合模型在线自适应更新,获得与待分割音乐信号更匹配的声乐/非声乐模型.通过对识别结果进行平滑处理,进一步去除瞬时突变错误.实验表明,与初始模型和采用全部数据进行模型更新相比,该算法可获得与待分割信号更匹配的高斯混合模型,分割效果更佳.  相似文献   

6.
针对基于多传感器的交互性人体活动识别任务,提出了一种基于窗口预处理和分组残差联合空间学习的多传感器交互性活动识别算法。首先,针对多传感器交互性活动数据预处理过程中的滑动窗口处理方式对人体活动识别的影响进行了实验分析和实验对比,包括不同滑动窗口大小和覆盖率等;其次,基于多传感器的交互性活动识别的窗口预处理结论,利用分组残差联合空间学习进行活动识别与分类,并设计多组对比实验,分别对网络模型、损失函数和分类器等进行了优化;最后,在Opportunity活动数据集上进行对比试验,该算法性能超过了现有的大部分其他活动识别算法。实验结果验证了基于窗口预处理和分组残差联合空间学习的多传感器人体活动识别算法的有效性。  相似文献   

7.
岩石薄片图像的分析往往依赖于专业人员在显微镜下观察并给出鉴定结果,不但费时费力,并且受设备限制影响较大。近些年,针对于薄片图像的自动识别方法已经被提出,然而这些方法大多采用监督学习与深度学习相结合的方式,进而受限于大量人工标注,为方法的推广与应用带来了巨大困难。此外模型在不同的地层、岩性等目标应用时,其泛化性也因此受到极大限制。本文针对该问题提出了一种超像素算法SLIC与半监督自训练结合的方法,仅依靠6%的人工标注便能够实现岩石图像的自动化分割与组分识别,极大的增强该方法在实际应用中的价值。该方法首先使用超像素算法SLIC对岩石图像进行预分割,随后基于分割片的颜色特征进行粗合并,并根据最小外接矩形进行切割;切割下来的岩石组分分割图像作为后续处理的基础数据集,这里仅需要人工标注6%的岩石组分数据;随后这些数据通过一个改进的半监督自训练方法,以改进的VGG16模型作为主模型、ResNet18模型作为评判模型,不断生成高置信度的伪标签,利用迭代优化调整,将其扩展到整个数据集,最终获得一个具有较高的稳定性、准确性以及一致性的组分识别模型。通过实际数据的测试与分析,本文所提出SLIC和半监督自训练结合的方法,对6类岩石组分的识别准确率可达到96%。该方法能够在数据差异不大的条件下,帮助用户基本实现自动化的组分识别。而当数据集产生较大差异时,仅需标注少量部分样品即可实现自动的组分识别。通过理论验证与实际数据测试,本方法具有较高的泛化性和可靠性,能够在实际应用提供足够的准确性与便利性。  相似文献   

8.
为了更好地揭示多模态过程的运行状态和数据分布变化规律,提高后续建模精度,提出基于最大均值差异(MMD)的多模态过程的过渡模态识别方法. 引入滑动窗口对数据进行切割,使用最大均值差异对多模态过程数据的分布差异进行度量,通过与稳定模态阈值α比较区分过程数据的稳定模态和过渡模态. 在过渡模态段内减小滑动窗口窗宽,利用过渡模态阈值β识别出过渡子模态. 数值仿真实验的模态识别结果表明,所提方法可以准确检测出输入变量期望值的阶跃变化,实现对模态的准确识别. 田纳西伊斯曼(TE)过程仿真数据实验表明,所提方法可以有效地划分出合理的模态,进而选择出分布最相近的历史模态建模,提高多模态过程的软测量建模精度.  相似文献   

9.
心律失常表现为不规则的心跳,心律失常类型的判断是心血管疾病早期预防和诊断的关键.为提高心律失常分类的准确率和速度,实现心律失常类型的自动识别,研究并提出了一种以卷积神经网络(convolutional neural network, CNN)为核心的7层混合模型结构.为保持心拍的完整性,根据R-R间期对心电信号进行动态分割得到不同长度的心拍.通过卷积层卷积核的滑动提取心拍的局部特征,平均池化层进行下采样,降低特征的维度.空间金字塔池化(spatial pyramid pooling, SPP)层以不同的池化步长二次提取心拍特征,不同长度的输入特征经过SPP层的特征融合后得到相同长度的输出特征.利用极限学习机(extreme learning machine, ELM)作为分类器可以提高分类的速度,缩短训练时间.使用MIT-BIH数据集和十折交叉验证方法验证心律失常4分类模型的有效性,最终得出在测试集上分类总体准确率为99.16%,灵敏度为99.85%,特异性为98.89%,精度为99.85%.在相同软件环境下验证混合模型与单个模型的准确率与训练时间,实验结果表明:混合模型能以更少的训练时间获得更高的准确率,为快速准确地识别心律失常类型提供了一种可行方案.  相似文献   

10.
为实现对城市轨道交通突发大客流的及时预警,提出一种基于自动售检票数据的客流异常状态识别方法.首先,确定符合客流时变特性的滑动时间窗口长度以适应动态的数据环境;其次,建立深度置信网络模型以提取窗口内待检样本的客流特征,并实现样本特征模式的自适应划分;最后,将待检样本和相同模式的历史样本映射至多维特征空间,进行基于局部异常因子的客流异常状态识别.通过广州地铁的案例分析,结果表明:该方法的模式划分精度为92.5%,异常识别误检率和准确率分别为3.98%和91.9%,识别效果与异常的形式和程度相关,且受识别合格判定条件中反应时效要求的影响,整体上能够在保证较低误检率的情况下,实现对各类客流异常状态的灵敏识别.  相似文献   

11.
0INTRODUCTION~CChineseSignlangUage(CSL)isavisual-gesturallangUage,whichis"naturallangUage"usedbyChinesedeallmutestocornmtinicatewitheachother.It'sverymeaningfultosrnthesizcCSLoncomputer.Firstly,itcanincreasedataexpressionwa}'tocomputerinordertoprovideamoreaccessibleinterfacetohumanusers,notonlysoundhtunanusershutalsohearingimpairedhumanusers.Secondly,itcanbeacomputeraidteachingtoolforbothdeafchildrenandsoundPeoplewhowanttolearnsignlanguage.Fulthermoreitcanheattachedtoacnewsandotherse…  相似文献   

12.
SignLanguageSynthesisinMulti┐functionPerceptionMachineXULinGAOWen(徐琳)(高文)(Dept.ofComputerScienceandEngineering,HarbinInstitut...  相似文献   

13.
基于DSP的语音识别系统的设计与实现   总被引:2,自引:0,他引:2  
一种基于定点数字信号处理器TMS320VC5402的实时语音识别系统。能够实现非特定人、小词汇表、孤立词的语音识别。系统以线性预测倒谱参数为特征参数,采用动态时间归整识别模型,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人情况下正识率在93%以上。  相似文献   

14.
本文介绍一个新的阶层单调识别技术。它立足于应用动态规划匹配法时匹配距离的收敛性。在第一阶段用窄窗孔匹配选出候补单词,在第二阶段用宽窗孔匹配,从其中选出正解单词。它不需要为两个阶段分别计算特征参量。与非阶层式相比,它可以节省约78%的识别时间。第一阶段取10%的候补单词时可做到无遗漏,保持了非阶层式的识别精度。在这一点上,它优于用粗分帧平均特征的阶层式单词识别法。  相似文献   

15.
针对基于智能手机的汽车无钥匙进入和启动系统(PEPS)车内外高精度辨识技术需求,设计基于双终端的差分K近邻定位算法. 通过改进的Dempster-Shafer证据理论,将双终端算法与典型单终端算法的辨识结果进行融合,提升识别算法的鲁棒性与准确性. 与传统的K近邻和概率分布法相比,融合算法在实验场景中对终端车内外状态的辨识准确率提升10%. 在传统定位算法易出现误判的车窗附近范围内,将误差距离从距车窗20 cm缩小到距车窗5 cm.  相似文献   

16.
为实现边缘端人体行为识别需满足低功耗、低延时的目标,本文设计了一种以卷积神经网络(CNN)为基础、基于可穿戴传感器的快速识别系统.首先通过传感器采集数据,制作人体行为识别数据集,在PC端预训练基于CNN的行为识别模型,在测试集达到93.61%的准确率.然后,通过数据定点化、卷积核复用、并行处理数据和流水线等方法实现硬件加速.最后在FPGA上部署识别模型,并将采集到的传感器数据输入到系统中,实现边缘端的人体行为识别.整个系统基于Ultra96-V2进行软硬件联合开发,实验结果表明,输入时钟为200 M的情况下,系统在FPGA上运行准确率达到91.80%的同时,识别速度高于CPU,功耗仅为CPU的1/10,能耗比相对于GPU提升了91%,达到了低功耗、低延时的设计要求.  相似文献   

17.
该文建设性地提出基于分布式组件技术(DCOM)构建多层网络化机器人远程控制系统,利用分布式组件技术实现了机器人的远程控制和网络共享。通过对语音识别技术的研究,在引进IBM ViaVoice语音识别的基础上,使语音识别技术与机器人控制系统有机结合实现机器人语音识别与控制。结合DCOM和IBM ViaVoice两者技术可以实现语音远程控制,使声音通过网络加以延伸,使控制者离开机器人嘈杂的操作环境,对远距离的机器人进行语音控制,使语音识别率得到很大的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号