首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
一种基于噪声对消与倒谱均值相减的鲁棒语音识别方法   总被引:1,自引:0,他引:1  
提出一种基于语音增强算法的噪声鲁棒语音识别方法.在语音识别预处理阶段,通过噪声对消语音增强法来抑制噪声提高信噪比.然后对增强语音提取Mel频段倒谱特征参数,并在倒谱域应用倒谱均值相减处理来补偿增强语音中的失真成分和剩余噪声.实验结果表明,在低信噪比(-12—0 dB)条件下,该方法对于数字语音识别具有较好的识别率,其性能明显优于基本的Mel频段倒谱参数识别器、传统的谱减法和噪声对消语音增强法.  相似文献   

2.
基于混沌调制DFRFT旋转因子的语音加密   总被引:1,自引:0,他引:1       下载免费PDF全文
将分数阶傅里叶变换(FRFT)和混沌密码学相结合,提出一种新的变换域加密算法——混沌密钥调制FRFT旋转因子,用于实现语音信号的实时加解密。采用特征分解型离散FRFT算法,使语音实时加密系统在语音信号解密过程中具备良好的还原特性。理论分析和测试结果表明,该算法安全性较高,优于单纯混沌加密或单纯分数阶傅里叶变换的加密方法。  相似文献   

3.
本文基于短时傅立叶变换,用分帧伪倒谱相减100算法使语音和噪声在伪倒谱域中得到更好的分离。文章给出了算法原理与实现过程,并就其中帧分割与重构、窗函数选择与构造(SH窗)等部分详细论述。实验结果表明了该算法的合理性。  相似文献   

4.
针对带噪面罩语音识别率低的问题,结合语音增强算法,对面罩语音进行噪声抑制处理,提高信噪比,在语音增强中提出了一种改进的维纳滤波法,通过谱熵法检测有话帧和无话帧来更新噪声功率谱,同时引入参数控制增益函数;提取面罩语音信号的Mel频率倒谱系数(MFCC)作为特征参数;通过卷积神经网络(CNN)进行训练和识别,并在每个池化层后经局部响应归一化(LRN)进行优化.实验结果表明:该识别系统能够在很大程度上提高带噪面罩语音的识别率.  相似文献   

5.
基于频谱方差和谱减法的语音端点检测新算法   总被引:1,自引:0,他引:1  
针对低信噪比情况下频谱方差法对语音信号进行端点检测时准确率降低的问题,提出了一种结合频谱方差和谱减法的语音端点检测新算法。算法采用改进的谱减法对语音信号进行动态降噪处理,并依据得到的降噪后信号的频谱方差设置双门限值进行端点检测。仿真实验表明,该方法具有抗噪性好、自适应性强等优点,在低信噪比情况下检测的准确率与普通的频谱方差法相比有很大的提高。  相似文献   

6.
语音倒谱特征的研究   总被引:24,自引:1,他引:24  
语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。识别实验验证了MFCC参数的鲁棒性优于LPCC参数。  相似文献   

7.
参数音频编码中的正弦波参数提取   总被引:1,自引:0,他引:1  
研究了语音编码中基于倒谱的基音检测算法,并把它应用到参数音频编码中,提出了基于倒谱的正弦波参数提取法。本文根据倒谱的特性,结合音频信号的特征,利用前后帧的相关性和各次谐波的能量,有效保证了基频及其各次谐波在较大频率范围内的正确提取。另外结合谐波和单谱线提取,提高了算法效率。  相似文献   

8.
语音/音乐区分是音频高效编码、音频检索、自动语音识别等音频处理和分析的重要步骤。本文提出一种新颖的语音/音乐分割与分类方法,首先根据相邻帧间的均方能量差异检测音频的变化点,实现分割;然后对音频段提取低带能量方差比、倒谱能量调制、熵调制等八维特征,用人工神经网络做分类。实验结果显示,本文算法和特征具有很高的分割准确率和分类正确率。  相似文献   

9.
语音信号端点检测的实验研究   总被引:1,自引:0,他引:1  
徐刚  徐华中 《福建电脑》2006,(1):77-77,53
端点检测是语音识别中的一项关键技术,端点检测的准确性对语音识别的性能有很大影响,特别是对端点检测比较敏感的语音识别算法。本文通过实验证明采用LPCMFCC的带噪声端点检测改进方法在白噪声低信噪比下性能明显优于基于能量和常规倒谱距离的检测方法。它消除了噪声的影响,具有很好的鲁棒性,且具有较强的实际应用价值。  相似文献   

10.
根据汉语语音的特点,提出了一种无端点检测的语音识别算法。在识别过程中,该算法无需确定语音信号起止点位置,而是从寂静段开始,直接按帧提取特征(帧长20ms,帧间重叠50%),特征向量由15阶倒谱系数和帧平均能量组成。在动态时间规整(DTW)和隐马尔可夫(HMM)统一模型(DHUM)中,引进寂静段自环,并用DHUM实现了该算法。对99个相似汉语单字的识别实验表明:无端点检测的识别器正识率为94.95%,正识率下降很少,但不作端点检测却降低了算法的复杂程度。该算法中,若特征向量采用一种听觉模型特征,识别器具有更好的鲁棒性,识别率会略有提高。  相似文献   

11.
胡峰松  张璇 《计算机应用》2012,32(9):2542-2544
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。  相似文献   

12.
基于VQ/CDHMM的噪声环境下汉语口令识别研究   总被引:2,自引:0,他引:2  
黄玲  潘孟贤 《计算机工程与应用》2003,39(28):106-108,161
该文研究了基于改进VQ/HMM模型的语音识别方法,设计实现了基于该模型的汉语口令识别系统;研究了鲁棒性特征参数问题,提出了一些新的基于MFCC和LPCC的高维动态参数;分别进行了纯净语音和不同信噪比语音的识别实验,分析比较了不同类型特征参数、训练状态数和高斯混合度对该系统识别性能的影响。在此基础上得出了以下结论:在加性白噪声的情况下,使用高维动态参数明显提高了系统的鲁棒性;在汉语两字组的短语音(口令)识别中,状态数取4,混合度取3时实验结果较好;利用不同特征参数的优势,进行信息融合,是提高系统性能的一个很好选择。  相似文献   

13.
In this paper, hum of a person (instead of normal speech) is used to design a voice biometric system for person recognition. In addition, a recently proposed static feature set, viz., Variable length Teager energy based Mel Frequency Cepstral Coefficients (VTMFCC), is found to capture source-like information of a hum signal. Effectiveness of VTMFCC over linear prediction (LP) residual to capture the complementary information than MFCC is demonstrated in a hum signal. Person recognition performance is found to be better when a score-level fusion is used by combining evidences from static and dynamic features for MFCC (system) and VTMFCC (source-like) features than MFCC alone. Experiments are validated on two types of dynamic features, viz., delta cepstrum and shifted delta cepstrum. In addition, for score-level fusion using static and dynamic features % identification rate and % Equal Error Rate are observed to outperform by 7.9?% and 0.27?%, respectively than MFCC alone. Furthermore, we have observed that person recognition system gives better performance for larger frame duration 69.6?ms as opposed to traditional 10–30?ms frame duration.  相似文献   

14.
基于特征加权的应力影响下顽健语音识别方法   总被引:1,自引:0,他引:1  
通过对应力影响下语音数据的分析,发现不同的特征维对变异的敏感程度不同。一般低维特征对变异比较敏感,相应的高维特征敏感程度差些。在此基础上,提出一种新的基于特征加权的变异语音识别方法。该方法通过对不同维特征加不同的权值来消除变异因素对语音特征的影响,从而提高系统的识别性能。文中提出对线性权值用最大相对熵估计方法获得权值。对航空模拟飞行器中采集的特定话者小词表孤立词的实验,最大相对熵估计方法的识别率可达到89.9% ,与多重风格训练方法相比,识别率提高了13.1%。  相似文献   

15.
本文主要论述了一种小词表语音识别系统的硬、软件设计方法。系统以DSP5416为硬件平台,采用非线性美尔刻度倒谱参数(MFCC)为特征参数提取算法,动态时间规整(DTW)作为识别算法,实现了语音识别系统的设计。实验结果表明平均语音识别率不低于90%,取得良好的识别效果。  相似文献   

16.
本文主要论述了一种小词表语音识别系统的硬、软件设计方法。系统以DSP5416为硬件平台,采用非线性美尔刻度倒谱参数(MFCC)特征参数提取算法,动态时间规整(DTW)作为识别算法,实现了语音识别系统的设计。实验结果表明平均语音识别率不低于90%,取得良好的识别效果。  相似文献   

17.
基于小波变分辨率频谱特征的静音检测   总被引:1,自引:0,他引:1  
薛卫  都思丹  叶迎宪 《计算机工程》2009,35(13):232-233
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。  相似文献   

18.
基于子带信息的鲁棒语音特征提取框架   总被引:2,自引:1,他引:2  
本文提出一种鲁棒语音特征提取框架。通过使用一种基于子带能量分布的噪声估计方法,无需静音段,就可以估计出带噪语音的子带噪声,同时提出结合谱减和谱加权方法对特征进行处理,最终生成具有较高鲁棒性的特征。 实验证明,在语音识别系统中,这种特征可以有效提高语音识别的鲁棒性,在噪声较强(信噪比0dB到15dB)的情况下,识别率可以提高20%以上;并且,在干净语音的情况下又能保证识别率没有大的下降;同时,这种特征上的处理方法对各种噪声的适应能力都很强,无需对噪声进行预先分类即可得到很好的抗噪效果。  相似文献   

19.
基于动静态组合特征参数的语音识别   总被引:1,自引:0,他引:1  
基于语音信号的时变特性,本文提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC(Mel-Frequency Cepstrum Coefficient)参数的提取方法,用小波包变换代替傅立叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC(Discrete Wavelet Packet Transform Mel-Frequency Coefficient),然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数,通过试验和仿真,此参数具有很高的识别率,是一种很好的语音特征参数.并且把混沌特性引入到神经元,构成混沌神经网络,把这种神经网络用于语音识别,并与常用的BP神经网络识别方法进行了比较.试验结果表明,混沌神经网络的平均识别率要高于同等条件下常用的神经网络方法的识别率.  相似文献   

20.
针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人员语音样本比较时的得分模型,以获得能反映说话人自身变化性的统计模型。基于目前最新的法庭证据评估的似然比证据强度评估体系,使用MFCC(Mel Frequency Cepstral Coefficients)和GFCC(Gammatone Frequency Cepstral Coefficients)特征对该方法的有效性进行了验证,并对上述特征进行了特征级和决策级融合。实验结果表明:该方法在纯净语音环境和噪声环境下都具有很高的识别率和稳定性,并且特征级融合能进一步提高识别系统的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号