共查询到18条相似文献,搜索用时 156 毫秒
1.
2.
利用隐马尔可夫模型(HMM)的动态时间序列建模能力及神经网络的模式分类能力,构成混合语音识别模型,同时考虑到语音信号的非平稳性,采用小波分析方法提取语音特征向量。通过时间规整方法,将所有具有可变长度的语音特征向量转换为相同维数的特征向量,从而简化了神经网络的结构。仿真结果表明,采用混合语音识别模型以及时间规整方法,不仅可提高识别率,同时大大缩减了训练时间,获得了很好的识别效果。 相似文献
3.
提出一种基于动态时间规整(DTW)和改进的学习矢量量化(LoPLVQ)的神经网络的语音识别方法.该方法用动态时间规整算法先对语音信号进行时间规整,然后通过改进的学习矢量量化神经网络进行语音的分类识别.实验表明,新系统在大规模语音识别方面不仅能缩短训练时间,而且具有较高的识别率. 相似文献
4.
动态时间规整算法是结合了动态时间规整(DTW)技术和距离测度计算技术的一种非线性规整算法,在语音识别模板匹配中有重要的应用。为此提出一种改进的高效动态时间规整算法,其能有效加快搜索路径的寻找。基于Matlab实现了隐马尔科夫算法、高效动态时间规整算法和改进的高效动态时间规整算法的语音识别系统,同时进行了算法的仿真实验。实验结果表明,基于改进高效动态时间规整算法的训练速度远大于基于隐马尔可夫算法和高效动态时间规整算法的训练速度,而识别率下降很小,对于小词汇量非连续语音识别中高效动态时间规整算法的识别率为97.56%,隐马尔可夫算法的识别率为97.14%,改进高效动态时间规整算法的识别率为96.43%。 相似文献
5.
《信息技术》2019,(6):91-95
随着中国经济高速发展以及全球一体化的进程,英语成为了人们日常交流必不可少的工具,然而对于初学者来说,能够通过语音识别技术将语音信号转化成文本的格式,更有利于快速掌握英语。而且语音识别技术经过多年的发展依然具有巨大的挖掘潜力,面对移动互联网的快速发展,通过对实时通信工具的大数据量的需求爆发,英语语音识别的实时性和系统稳定性越来越受到关注,文中分析了常用的传统语音识别技术,例如动态时间规整、神经网络模型和隐马尔可夫模型等,运用隐马尔可夫模型对语音信号进行处理和识别,提取出特征参数,与经过训练的模型体系进行匹配,找出最优的识别序列。然后在PC平台上,利用MATLAB建模仿真,基本实现了英语语音短句的识别,对于后续的硬件产品实现打下了良好的基础,具有积极的现实意义。 相似文献
6.
语音识别是近年来十分活跃的一个研究领域,被广泛应用于工业控制、智能家居、医疗、高端家电等多个领域。根据识别的对象不同,语音识别可分为孤立词识别、关键词识别和连续语音识别。目前用于语音识别的方法有基于动态时间规整(DTW)技术的模板匹配法、基于概率统计的HMM法和基于人工神经网络的最优搜索法。 相似文献
7.
提出了一种基于脉冲耦合神经网络(PCNN)和动态时间规整(DTW)的语音识别方法。首先利用改进后的PCNN提取语谱图图像特征作为语音的特征参数,然后通过DTW来进行语音分类识别。实验表明,论文中所提出的方法与传统的LPCC和MFCC方法相比,所需特征参数量减少约40%,并能达到87.5%识别率,利于系统的硬件实现。 相似文献
8.
9.
10.
11.
语音识别中的神经网络DTW结构 总被引:1,自引:0,他引:1
本文介绍语音识别中一种基于动态规划技术的时间规正算法DTW的神经网络实现方法.DTW是语音识别中最为有效的方法之一,它具有较强的鲁棒性且为语音识别系统提供了可能的最高识别率.但由于其计算量太大,除非用专门的硬件,DTW算法在实现时受到了限制.在本文中,所有的计算是由两个循环神经子网和一记忆层来完成的,该方法展示了算法的硬接线结构,(hard-wiring)的优越性,这为DTW的硬件实现提供了一种新的实施策略. 相似文献
12.
语音识别可实现人机交互和语音控制,在工业控制、消费电子等领域都有广泛应用。结合人发音的生理结构的特点,使用LPMCC(LPC倒谱美尔变换)作为特征向量,采用动态规划算法作为核心识别算法,在TMS320VC5402芯片上实现了特定人、孤立词的高性能实时识别系统。 相似文献
13.
基于耦合的混沌神经网络建模方法 总被引:3,自引:0,他引:3
混沌状态下神经网络行为的研究是神经网络理论的一个新内容,由于它可能揭示脑活动的深层机制而广受重视,但是混沌网络信息处理能力进行大量和深入研究却遇到许多障碍,其问题之一是难以为网络系统选择适当的非线性参数。本文提出一种建立混沌神经网络模型的简单耦合方法,解决了选择参数的困难,计算机模拟结果表明,用该模型研究混沌状态下网络动态行为是有效的。 相似文献
14.
This paper introduces a practical and easy-to-understand network for signal processing called the modified probabilistic neural network (MPNN). It begins with a short introduction to the application of artificial neural networks to signal processing followed by a background and review of the MPNN theory. The MPNN is a regression technique similar to Specht's (1991) general regression neural network, which is based on a single radial basis function kernel whose bandwidth is related to the noise statistics. It has advantages in application to time and spatial series signal processing problems because it is constructed directly and simply from the training signal waveform characteristics or features. An illustrative example involving noisy Doppler-shifted swept frequency sonar signal detection compares the effectiveness of the first- and second-order Volterra, multilayer perceptron neural network, radial basis function neural network, general regression neural network and MPNN filters, demonstrating some features of the MPNN for practical design 相似文献
15.
为了准确、快速地进行缺陷识别,介绍了一种新型的前馈神经网络模型,即径向基概率神经网络。与以往的算法相比,该方法具有分类识别精度高且速度快的优点。仿真获得了很好的结果。 相似文献
16.
复杂空战背景下的抗红外诱饵干扰技术是红外空空导弹的核心技术之一。针对传统静态贝叶斯网络不能表达序列图像中特征变量在时序上动态变化关系,提出了一种符合人类视觉推理识别过程的时空关联推理网络抗干扰识别算法。首先,提出的时空关联推理网络在考虑特征空间约束关系的基础上,引入了特征变量时间约束的先验知识,建立表达特征时空关联的目标推理网络识别模型,从而增强了序列图像目标识别的稳定性;其次,通过仿真数据构建样本集,离线训练学习时空关联推理网络结构及特征跳转概率参数,确定概率推理网络识别离线模型;最后,依据测试数据,结合推理识别网络模型进行概率推理,实现对目标的识别分类。实验结果表明,在伴随红外诱饵干扰投放的条件下,基于时空关联推理网络的抗干扰识别率达到94%,比静态贝叶斯网络抗干扰识别算法高3%,有效提升了目标识别的稳定性。 相似文献
17.
18.
A modular neural network classifier has been applied to the problem of automatic target recognition using forward-looking infrared (FLIR) imagery. The classifier consists of several independently trained neural networks. Each neural network makes a decision based on local features extracted from a specific portion of a target image. The classification decisions of the individual networks are combined to determine the final classification. Experiments show that decomposition of the input features results in performance superior to a fully connected network in terms of both network complexity and probability of classification. Performance of the classifier is further improved by the use of multiresolution features and by the introduction of a higher level neural network on the top of the individual networks, a method known as stacked generalization. In addition to feature decomposition, we implemented a data-decomposition classifier network and demonstrated improved performance. Experimental results are reported on a large set of real FLIR images. 相似文献