共查询到20条相似文献,搜索用时 79 毫秒
1.
基于信号递归度分析的语音端点检测方法 总被引:1,自引:0,他引:1
针对低信噪比、非平稳噪声环境下的语音端点检测,提出了一种基于语音/噪声的信源系统动力学特性差异,通过分析信号递归度变化,设定双门限判定语音端点的方法。和传统的能量法、倒谱距离测度法比较,准确率较高。为语音特征提取和识别研究提供了新的途径。 相似文献
2.
针对实时语音采集系统应用到工业行业中所面对的增加有效记录时间和提高噪声环境下的录音回放效果问题,研究了端点检测方法和语音增强方法。端点检测方法基于有限状态机模型,引入通信中AMR-WB标准的激活检测算法作为语音帧或噪声帧判据,端点检测可达到良好的实时性和准确性,并对于低幅度信号增加了过零率判据可进一步降低检测算法对语音的漏报率。语音增强方法以参数可配置的低频带阻滤波结合维纳滤波来增强语音采集系统对多种环境噪声的消除能力。实际使用表明该端点检测方法和语音增强方法对于提高工业领域应用中实时语音采集系统的记录长度和回放效果具有很强的实用性。 相似文献
3.
在孤立字识别中,精确地判别语言信号的起始点和终止点是相当重要的。确定出语音信号范围的方案可以用来减少大量非实时系统的计算和提高识别精确度。本文在利用语音的某些特征参数——短时平均幅度或能量和短时平均过零率的基础上,提出了利用上述特征参数进行语音端点检测的IBM/PC机实现程序。 相似文献
4.
5.
MFCC是语音识别中常用的特征参数,根据MFCC分量对语音端点的敏感性,提出利用平常舍去的识别特征参数分量MFCC0作为语音端点检测的参量.接着根据MFCC0的特性设计了一种新的端点检测方法,该方法简单且无需增加额外的计算量.实验结果表明,基于该方法的语音识别系统不仅可以通过端点检测大大压缩数据量,而且提高了系统的识别率. 相似文献
6.
7.
9.
10.
一种语音段起止端点检测新方法 总被引:21,自引:0,他引:21
本文在讨论传统语音段起止端点检测方法及其不足的基础上 ,提出了一种新的端点检测方法 ,称为频带方差检测法。实验证明 ,该方法有效提高了语音段起止端点检测的精确度和可靠性。 相似文献
11.
小波神经网络在语音识别系统中的应用 总被引:2,自引:0,他引:2
宋弘 《微电子学与计算机》2010,27(4)
文中设计了以"MCU+DSP"的双CPU结构为核心的语音识别系统,利用MCU实现语音识别系统的控制,DSP实现语音识别系统的预处理、特征提取和模式识别.针对语音识别系统各个阶段,分别引入小波变换和神经网络对传统的实现方法进行改进,有效地降低了系统中的噪声,减少了系统中不必要的数据量,提高了系统的语音识别性能.实验数据验证了该方法的可行性和有效性. 相似文献
12.
13.
14.
利用隐马尔可夫模型(HMM)的动态时间序列建模能力及神经网络的模式分类能力,构成混合语音识别模型,同时考虑到语音信号的非平稳性,采用小波分析方法提取语音特征向量。通过时间规整方法,将所有具有可变长度的语音特征向量转换为相同维数的特征向量,从而简化了神经网络的结构。仿真结果表明,采用混合语音识别模型以及时间规整方法,不仅可提高识别率,同时大大缩减了训练时间,获得了很好的识别效果。 相似文献
15.
通常采用具有前向连接权的连接网络便可实现静态输入输出模式对的联想,但是为了使网络记忆序列信息状态,必须考虑引入反馈连接权。本文构造一个具有动态神经元的多层网络结构,动态神经元带有多时延的局部反馈。此网络结构用于记忆时间序列信息,同时,相应地我们推导一种更有效、更便于实现的网络学习算法。最后,为了测试所提出网络学习动态时变数据的能力,选择几个不同参数的动态神经元模型,进行了一系列实验。 相似文献
16.
17.
18.
本文提出了一种改进的混合蛙跳算法,利用混沌运动的遍历性改善初始个体的质量和引入高斯变异,提高了算法的全局搜索能力,同时将改进算法与人工神经网络结合,并把它应用到语音情感识别系统中.依据情感的维度空间模型.分别提取了情感语音的韵律特征与音质特征,研究了谐波噪声比特征随情感类别的变化特性.利用本文所提的蛙跳算法(SFLA)训练随机产生的初始数据,优化神经网络的连接权值,能快速地实现网络的收敛.在实验中比较了BP神经网络、RBF神经网络与改进SFLA神经网络分别用于语音情感以别的识别性能,结果表明基于改进SFLA的神经网络的平均识别率高于BP神经网络9.2个百分点,高于RBF神经网络7.9个百分点.因此本文所提的蛙跳神经网络用于语音情感识别能获得明显的识别性能的提升. 相似文献
19.
本文主要研究连续语音中单词音节的神经网络建模问题.采用了一种富有特色的特征提取方法,并依据高维空间点覆盖理论,对实际连续数字语音的各不同数字音节,以人工切自连续数字语音中的2640个单字音节,构建连续语音中各不同数字音节的特征空间覆盖区,并使用7308个自连续数字语音中切分出的单字音节,利用仿生模式识别原理,进行了建模正确性验证.验证结果正确率达到97%以上,对同样数量的少量建模样本,识别率优于SVM方法. 相似文献