首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
张晓辉  李辉 《电子技术》2010,47(7):27-29
本文介绍了一种基于ZCPA特征参数的口令识别系统。重点描述了ZCPA特征参数的提取。该参数模拟人类耳蜗中神经放电的方式,通过语音信号过零点获得频率信息,检测振幅峰值以及对其进行非线性压缩获得强度信息,并将此特征参数与HMM结合应用到口令识别系统中。实验结果可以证明ZCPA与MFCC相比较具有更好的鲁棒性。  相似文献   

2.
语音识别指利用计算机识别语音信号所表达的内容,其目的是要准确地理解语音所蕴含的含义。本文着重研究了语音识别实现过程的特征提取,针对特征提取的多种方法,选用LPC倒谱系数作为特征参数提取,较彻底地去除了语音信号产生过程的激励信息,主要反映了声道模型,而且只需十几个倒谱系数就较好地描述了语音的共振峰特性。通过对语音信号进行预加重、分帧、加窗、自相关分析,而后提取出LPC倒谱系数。根据流程编写VC程序,对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,从而获得用于语音识别的重要信息。  相似文献   

3.
在信噪比依赖的非均匀谱压缩(SNSC)鲁棒语音特征提取技术和VTS算法的基础上,该文提出了一种新的MC-SNSC模型补偿算法。SNSC技术是一种根据人类听觉对声音强度-响度感知转化关系的谱幅度变化操作和噪声抑制技术。基于对数谱域的噪声以及SNSC特征提取对语音信号特征所产生的失配函数,推导出了MC-SNSC模型补偿算法。实验证明使用这一新算法,识别率比当前较理想的VTS和PMC算法有很明显的提升,算法的复杂度较VTS等算法仅有轻微的增加。  相似文献   

4.
一种基于ARMA 和NGARCH 过程的海杂波建模方法   总被引:1,自引:0,他引:1  
使用自回归滑动平均(ARMA)和广义自回归条件异方差(GARCH)过程对金融数据建模是经济学常用手段。文中结合ARMA 过程和GARCH 过程的非线性化扩展模型,将其扩展到复数域,适合于海杂波建模应用。相比传统的海杂波模型及原始的GARCH 模型,文中提出的模型在概率密度函数拟合上具有明显的优势。此外,新模型还可准确地捕获相邻海杂波中存在的强相关性。实际雷达海杂波数据验证了该模型的准确性和有效性。  相似文献   

5.
本文给出了12种自回归模型在同方差和异方差条件下的预选条件.  相似文献   

6.
马治飞  徐望  王炳锡  王兴斌 《信号处理》2005,21(Z1):192-195
本文详细给出了概率模型中引入倒谱预测值的动态相关性来进行特征补偿的方法.该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度、在倒谱域对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度.不同噪声环境和不同信噪比下的实验结果表明,本文方法能有效提高噪声环境下的中文连续语音识别的正确率.  相似文献   

7.
针对传统频谱占用度自回归移动平均(ARMA)模型由于未考虑序列的条件二阶矩,导致无法准确描述频谱占用状态的非线性时变特性问题,该文提出一种基于指数广义自回归条件异方差(EGARCH)过程的频谱占用状态时间序列建模方法。首先通过对ARMA模型的剩余残差进行条件异方差性检验,表明频谱占用时间序列存在明显的时域波动集聚性;其次基于EGARCH过程构建频谱占用度时间序列模型以及对实测数据的分析,表明该模型相较ARMA模型对频谱占用度的拟合与预测精度更高;最后由EGARCH模型参数存在杠杆效应系数,表明频谱占用状态变化对电磁环境波动的影响具有非对称性。研究结果表明EGARCH模型能够量化反映频谱占用状态的复杂非线性时变过程。  相似文献   

8.
基于相对相关序列MFCC特征的模型补偿技术   总被引:4,自引:0,他引:4  
张军  韦岗 《信号处理》2003,19(3):284-286
提出了基于相对自相关序列(Relative Autocorrelation Sequences,RAS)MFCC特征的模型补偿技术,并给出其理论推导及分析。实验结果表明,本文提出的补偿技术可以在不同信噪比下提高RAS-MFCC的性能,使基于RAS-MFCC的识别系统在低信噪比时仍能保持较高的识别率,并且在低信噪比时其性能明显优于经过相同补偿处理的MFCC识别系统。  相似文献   

9.
从GAR模型参数提取特征的数字调制识别新方法   总被引:3,自引:0,他引:3  
本文提出了一种从观察序列的广义自回归(GAR)模型参数提取待识别信号的伪瞬时中心频率和伪瞬时3dB带宽特征,并利用神经网络分类器的数字调制识别新方法。这种方法充分利用了GAR模型良好的抗噪声能力和神经网络优异的模式分类能力,能有效地改善低SNR条件下的调制识别性能。计算机模拟结果证实了该方法具有很高的识别率和良好的稳健性。  相似文献   

10.
语音识别技术作为信息社会朝着智能化和自动化方向发展的关键技术之一,具有重要的研究意义和使用意义。本文基于语音信号的数字信号处理理论,通过分析语音信号的时域特征,解释语音信号识别系统中信号特征提取的原理。并使用MATLAB软件的仿真功能对语音信号进行线性预测分析,求取语音信号的线性预测系数。  相似文献   

11.
通过对Bark频带和Mel频标之间关系的研究,得到一个BarkMel临界带表,在此基础上详细介绍了一种基于人耳听觉掩蔽特性的MFCC计算方法.实验表明,该方法可使掩蔽特性在MFCC参数提取中达到最优化,提高识别率,具有一定的鲁棒性.  相似文献   

12.
视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提出了一利利用语音识别结果进行LDA训练数据自动标注的方法。这种方法免去了繁重的人工标注工作,避免了标注错误。实验表明,将'VisemicLDA视觉特征引入到听视觉语音识别中,可以大大地提高噪声条件下语音识别系统的识别率;将这种视觉特征与多数据流HMM结合之后,在信噪比为10dB的强噪声情况下,识别率仍可以达到80%以上。  相似文献   

13.
孙暐  吴镇扬 《信号处理》2006,22(4):559-563
根据Flether等人的研究,基于感知独立性假设的子带识别方法被用于抗噪声鲁棒语音识别。本文拓展子带方法,采用基于噪声污染假定的多带框架来减少噪声影响。论文不仅从理论上分析了噪声污染假定多带框架在识别性能上的潜在优势,而且提出了多带环境下的鲁棒语音识别算法。研究表明:多带框架不仅回避了独立感知假设要求,而且与子带方法相比,多带方法能更好的减少噪声影响,提高系统识别性能。  相似文献   

14.
训练环境和测试环境的不匹配是造成实际情况下语音识别性能下降的主要原因。在深入研究语音识别的噪声环境和Mel域倒谱系数(MFCC)流程的基础上,基于累计分布函数匹配思想,给出了3种通过减小训练环境和测试环境的不匹配度来提高系统在不同环境下适应性的鲁棒性特征提取方法,分析了它们的理论基础、基本算法,并在Aurora2.0数据库上进行了实现,验证了方法的有效性,为实际应用中如何选择语音识别系统提供了参考。  相似文献   

15.
汉语语音正弦模型特征分析和听觉辨识   总被引:1,自引:0,他引:1  
张毅楠  肖熙 《电声技术》2011,35(8):38-41
为了研究汉语语音的声学特征,将语音信号的正弦模型应用于语音的特征提取和分析,通过对语音的模型参数应用峰值匹配算法,得到了基于正弦模型的语谱图.该语谱图能直观地反映出语音信号中基音频率及共振峰的细节及其变化规律,为语音信号的分析提供了可视化的工具.在此基础上,对汉语单韵母音节的前两个共振峰进行了分析,在控制使用少数几个主...  相似文献   

16.
基于改进语音特征提取方法的语音识别   总被引:1,自引:1,他引:0  
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值.  相似文献   

17.
与桌面环境相比,电话网络环境下的语音识别率仍然还比较低,为了推动电话语音识别在实际中的应用,提高其识别率成了当务之急.先前的研究表明,电话语音识别率明显下降通常是因为测试和训练环境的电话通道不同引起数据失配造成的,因此该文提出基于统计模型的动态通道补偿算法(SMDC)减少它们之间的差异,采用贝叶斯估计算法动态地跟踪电话通道的时变特性.实验结果表明,大词汇量连续语音识别的字误识率(CER)相对降低约27%,孤立词的词误识率(WER)相对降低约30%.同时,算法的结构时延和计算复杂度也比较小.平均时延约200ms.可以很好地嵌入到实际电话语音识别应用中.  相似文献   

18.
基于鲁棒听觉特征的说话人识别   总被引:3,自引:0,他引:3  
林琳  陈虹  陈建 《电子学报》2013,41(3):619-624
 为了提高噪声环境中说话人识别系统的性能,本文提出了一种鲁棒听觉特征提取的算法,并将其应用到说话人识别系统中.运用自适应压缩Gammachirp滤波器组模拟人耳耳蜗的听觉特性,对输入的语音信号进行频域子带滤波,将得到的对数子带能量作为听觉特征参数.分别运用离散余弦变换和核主成分分析方法,对提取的特征参数进行特征变换,降低特征参数的维数,提高特征参数的噪声鲁棒性和个性表现力.实验结果表明,将提取的新听觉特征参数应用到说话人识别系统中,新特征参数在鲁棒性和识别性能上均优于梅尔倒谱系数和基于Gammatone的听觉特征参数.  相似文献   

19.
根据混沌编码具有联想记忆的特点,本文提出了一种基于混沌编码的语音识别新方法,该方法首先解决了语音特征矢量维数不固定难于进行混沌编码的难题,其次提出了多样本下语音信号特征的选取原则。实验结果表明,新方法对语音的缺损和噪声干扰具有较好的容错能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号