首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
论文旨在研究基于MATLAB平台的特定人孤立词小词汇量的语音识别系统的实现。文章分别对语音信号的预处理过程、语音信号的特征提取及语音信号的识别算法等方面进行深入研究和分析在端点检测过程中,使用短时能量和过零率双门限进行检测,应用识别率较高的MFCC作为特征参数,针对传统DTW算法在语音识别中测试语音与参考语音模板匹配所需时间较长的问题,提出搜索路径改进算法,使得算法的运算速度有所提升。为了提升DTW的识别率,提出改进的模板匹配方法——多模板匹配方法。实验结果证明,采用改进算法的语音识别系统有效地降低了识别时间,提高了系统的识别率。  相似文献   

2.
针对语音识别中动态时间规整(DTW)对语音端点检测精确性过度依赖、识别时间长及识别效率低等问题.为提高语音识别精度和效率,采用改进型的蚁群算法来处理动态时间规划间题,核心是对基本蚁群算法采用自适应的挥发系数,动态信息素更新策略.用新的状态转移规则以及最优的蚂蚁参数选择等改进方法,使能在较短的时间内能寻找到最佳路径,提高执行效率.仿真实验分别测试了传统DTW算法和基于改进蚁群算法的DTW算法的识别率,结果表明,新算法的全局搜索能力、准确性都优于传统的DTW算法,能有效的提高语音识别系统的效率.  相似文献   

3.
解本铭  韩明明  张攀  张威 《计算机应用》2018,38(6):1771-1776
为研究飞机牵引车智能语音控制,实现机场环境下牵引车对飞行员语音命令的精确、高效识别,同时针对传统动态时间规整(DTW)算法计算量大、时间复杂度高、算法识别效率低的问题,提出了一种车辆语音识别的六边形弯曲窗口约束DTW优化算法。首先,从DTW算法原理、牵引车指令的语音特性和机场环境三方面,分析了弯曲窗口对DTW算法识别精度、效率的影响;然后,在Itakura Parallelogram菱形弯曲窗口约束DTW优化算法的基础上,进一步提出了六边形弯曲窗口约束的DTW全局优化算法;最后,通过改变优化系数,实现了最优六边形弯曲窗口约束的DTW算法方案。基于孤立词识别的实验结果表明,所提最优算法与传统DTW算法、菱形弯曲窗口约束的DTW算法相比,识别错误率分别降低77.14%和69.27%,识别效率分别提高48.92%和27.90%。该最优算法更具鲁棒性、时效性,可以作为飞机牵引车智能控制的理想指令输入端口。  相似文献   

4.
为实现基于Kinect的手语识别,提出了一种利用有限状态机及动态时间规整(DTW)的动态手语识别方法。首先,利用Kinect技术得到人体深度图像和骨骼特征信息;然后利用手部分割算法得到手部深度图像,再选取识别正确率高的梯度方向直方图(HOG)特征算子来提取手部特征;最后加入有限状态机和DTW算法实现动态手语识别。实验结果表明:该方法能够实现对常用手语单词、句子的识别,识别准确率可达95%。  相似文献   

5.
针对当前图书馆智能机器人步态识别准确率低,导致异常状态检测效果差的问题,提出基于步态触觉信息的图书馆智能机器人异常状态检测和分类。采用基于局部空间信息加权的K-means算法对静态步态图像进行分割处理,分别构建基于改进K-means的CNN网络模型和基于时域注意力的3D残差网络模型,通过这两个模型对静态、动态步态进行特征提取和识别。实验结果表明,对比于SVM分类器,改进K-means算法的CNN网络模型静态步态识别准确率高达98.7%;3D-CNN模型的动态步态分类准确率为99.72%,均高于其他分类模型。最后结合两种算法进行异常状态检测发现,本算法的分类准确率、敏感度和特异性分别为95.42%、95.53%、94.37%。综合分析可知,提出的算法能够实现静态动态的准确识别和异常状态检测,具有一定有效性。  相似文献   

6.
基于动态时间规整的手势加速度信号识别   总被引:1,自引:0,他引:1  
为了提高基于加速度传感器的动态手势识别算法的性能,本文采用了动态时间规整(DTW)识别算法。通过该算法计算测试模板和参考模板的相似度,从而得出识别结果。为了验证该方法,建立了一套手势加速度无线采集系统,并采集了41个志愿者的手势信息。实验结果表明,该方法手势平均识别率在97%以上。与HMM识别算法相比,DTW识别算法在识别的准确率上比HMM识别算法更具优势。  相似文献   

7.
无线传感器网络中,异常时间序列的研究具有十分重要的意义。针对传统研究在海量数据环境中时间效率低下的问题,提出了基于Hadoop的异常时间序列检测算法。首先对时间序列进行预处理,然后在Hadoop的MapReduce操作中调用动态时间弯曲距离计算算法,实现了DTW距离计算的并行化,从而大大提高检测速度。同时针对传统DTW算法计算复杂度瓶颈问题以及传统约束方法准确率较低问题,提出了基于显著特征匹配的局部约束算法,对弯曲路径进行局部限制,在确保准确性的同时进一步降低了时间、空间复杂度。Hadoop平台下实验结果表明,该方法既提高了检测速度,又保证了检测准确率。  相似文献   

8.
针对乐谱跟随中动态时间规整算法(DTW)时间精确度不高并且无法检测偏差音符的不足,提出一种基于端点检测与DTW算法的乐谱跟随系统。其前端结合端点检测算法,提取基于恒Q变换(CQT)的色度特征值,再将两个音频信号进行比较,最终利用DTW算法实现演奏音频与乐谱对齐功能,确定演奏音频每一时刻具体演奏内容。实验结果表明,提出的算法在时间精确度上较传统方法提高7.64%,并且不受节拍变化的影响,能够检测出演奏音频中是否有偏差音符。  相似文献   

9.
王璐 《计算机仿真》2020,(4):393-396
当前社区智能识别防盗报警系统采用广角视频人工识别异常行为,不能实时对社区异常行为进行监控和报警,存在报警误报率较高、报警延时较长、准确率较低等问题。针对上述问题,提出基于社区异常行为智能识别防盗报警系统,介绍了智能识别防盗报警系统的总体架构,包括图像采集模块、异常行为检测模块、远程监控模块、防盗报警模块四部分组成,并结合运动目标颜色特征的粒子滤波算法实现了对社区异常行为实时监控和实时报警。实验结果表明,所设计的智能识别防盗报警系统,报警误报率较低、报警延时较短、准确率较高。  相似文献   

10.
FPGA和NiosII软核的语音识别系统的研究   总被引:1,自引:0,他引:1       下载免费PDF全文
嵌入式语音识别的应用还是比较少,主要还是通过DSP实现,而且准确率还不是太高。提出一种基于FPGA和NiosII软核处理器的嵌入式语音识别系统的设计方案。系统以EP2C35 Cyclone II芯片和NiosII处理器为基础,采用软硬件结合的设计方式,共同完成语音识别的设计。系统结合改进的端点检测方法,提取线性预测倒谱系数(LPCC)的音频信号特征,采用IP核硬件实现动态时间规整(DTW)的识别算法,能达到较高的识别准确率。  相似文献   

11.
基于智能监控的中小人群异常行为检测   总被引:1,自引:0,他引:1  
针对人群异常行为检测实时性较差、分类算法识别率不高、特征量较少的问题,提出一种基于智能监控的中小人群异常行为检测算法。首先,利用快速群体密度检测算法,提取人群数量变化信息;其次,利用改进的Lucas-Kanande光流法提取视频中人群的平均动能、人群方向熵、人群距离势能;最后,利用极限学习机(ELM)算法对人群行为进行分类。使用UMN公共数据集进行测试,ELM算法对中小人群异常行为分析比中高密度人群异常行为检测算法和基于KOD能量特征的群体异常行为检测算法识别率分别高出7.13个百分点和5.89个百分点,并且人数密度估计部分平均每帧图像处理耗时相比中高密度人群异常行为检测算法减少了106 ms(近1/3)。实验结果表明:基于智能监控的中小人群异常行为检测算法能有效提高异常帧识别率和实时性。  相似文献   

12.
现今关于驾驶员路怒情绪识别方法中语音特性分析相对较少,该研究以路怒情绪为研究对象,利用模拟驾驶系统建立数据集,通过分析驾驶员语音的频谱特征,将时域中短时能量及短时过零率特征参数和改进Mel频率倒谱系数(Mel frequency cepstral coefficients,MFCC)特征参数融合构成特征参数向量,利用萤火虫算法(firefly algorithm,FA)优化PNN神经网络(probabilistic neural networks)并构建识别模型,实现驾驶员路怒情绪的识别。实验结果表明,在相同神经网络下,改进MFCC融合特征提取方法相比传统MFCC特征提取方法具有更好的抗噪性。同时,FA-PNN模型的识别准确率为93.0%,相比传统PNN模型提高了11个百分点;F1-Score值为0.932 8,提高了0.104 7。该研究论证了语音信号处理技术对驾驶员路怒情绪识别的可行性,为汽车主动安全驾驶预警研究提供了新方法。  相似文献   

13.
为了实现对环境音频信号及其相关数据的自动分析,提出了一种环境音频数据分类方法。分类过程中,首先用短时平均幅度对音频数据进行有效分段;然后,计算分段音频数据的长度和平均过零率;最后,计算并生成一个分段音频数据的Mel频率倒谱系数(MFCC)和一阶差分Mel频率倒谱系数(△MFCC)特征参数。分类操作上,根据有效分段的长度和平均过零率确定分类搜索的范围,并在局部范围内采用DTW(Dynamic Time Warping,动态时间规整)分类算法。实验结果验证了该方法对各种环境音频数据分类的有效性。  相似文献   

14.
科学评估飞行训练质量,对提高飞行员的飞行驾驶技术以及保障飞行安全具有重要意义。动作识别是飞行评估的一项基本内容,许多评估内容都是建立在获取动作序列的基础上的。在动态时间规整(DTW)的基础上提出了一种多元动态时间规整算法(MDTW),通过多维融合的方法进行多元时间序列相似性运算。经实际应用验证,该算法有效提升了传统DTW动作识别的效率和准确性。  相似文献   

15.
提出一种基于特定人的内窥镜自动定位语音识别系统,通过识别特定医生的语音控制口令实现内窥镜的定位,为手持内窥镜操作提供更加智能化的解决方案。在识别算法上提出了参考模板归一化平均的动态时间规划(Normalized Average-Dynamic Time Warping,NA-DTW)算法,可获得更高的识别率,系统以片上Windows?CE操作系统和ARM作为系统的软硬件平台。实验通过对10个不同测试人的共1 250组测试数据进行识别检测,NA-DTW算法与传统DTW算法相比,识别率从96.6%提高到99.76%,运算时间从469 ms缩短到241 ms。验证了NA-DTW算法可以完成基于特定人、孤立词的语音识别功能,并满足嵌入式系统中的实时检测条件。  相似文献   

16.
目前智能视频监控对视频目标跟踪算法的实时性、准确性和鲁棒性都提出了很高的要求,而已有算法无法完全满足应用需求。在TLD(Tracking Learning Detector)框架下,提出一种基于视觉背景提取(Visual Background extractor,ViBe)的前景分类算法,提高了TLD算法检测目标的速度;用核相关滤波器(Kernelized Correlation Filters,KCF)实现了TLD框架中的跟踪器,提高了算法的精度及鲁棒性。采用OTB-2013评估基准中针对视频监控的视频序列进行测试,并与其他4种具有代表性跟踪算法进行了对比。测试结果表明:该算法的鲁棒性和准确性均优于对比算法,处理速度可达到40帧/s;相比于标准TLD算法,跟踪距离精度提高了1.52倍,成功率提高了1.2倍;相比于KCF算法,虽然跟踪速度有所下降,但跟踪距离精度提高了2.7倍,成功率提高了2.04倍。  相似文献   

17.
随着公共安全需求的快速增长,监控摄像头数量不断增多,视频监控数据呈爆炸式增长;传统的视频监控系统难以对如此海量的数据进行理解分析,因此智能视频监控系统应运而生;作为一个跨学科的研究领域,智能视频监控系统异常行为检测技术迎来重大机遇的同时也面临不少挑战;为了更好地研究智能视频监控系统异常行为检测算法,梳理了相关研究并从原理上对不同算法进行分类,对基于能量、基于聚类、基于重构、基于推断以及基于深度学习几个不同依据的算法进行对比分析,归纳了各类算法的分支研究方向,接着简要介绍了异常行为检测常用的公开数据集,最后讨论了目前异常行为检测算法所面临的挑战并针对性地提出了未来智能视频监控系统异常行为检测算法的可行研究方向。  相似文献   

18.
语音信号转换到频域后维数较高,流行学习方法可以自主发现高维数据中潜在低维结构的规律性,提出采用流形学习的方法对高维数据降维来进行汉语数字语音识别。采用流形学习中的局部线性嵌入算法提取语音频域上高维数据的低维流形结构特征,再将低维数据输入动态时间规整识别器进行识别。仿真实验结果表明,采用局部线性嵌入算法的汉语数字语音识别相较于常用声学特征MFCC维数要少,识别率提高了1.2%,有效提高了识别速度。  相似文献   

19.
为了提高肌电信号手势识别算法的准确度,增强实时性,提出了一种基于动态时间规整(DTW)算法的手势识别方法,该方法利用肌电信号(EMG)对个体间的手势进行识别。首先,采用滑动平均能量的方法对原始的EMG信号进行数据分割,探测有效动作;其次,对于分割的数据段使用平均绝对值(MAV)来提取信号特征;最后,用DTW算法将8维的EMG信号融合并计算测试样本和模版的相似度,其中采用了DTW算法寻找规整路径的方法进行了模板制作,实现了个体间的手势识别。实验结果表明,使用DTW算法对肌电信号进行手势识别,其动作识别的准确率达到96.09%,该方法计算速度快,实时性强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号