首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 194 毫秒
1.
该文提出了一种基于能量分布和共振峰结构的汉语鼻音检测方法,该方法首先基于Seneff听觉谱提取了一组描述音段能量分布和共振峰结构的特征参数,然后采用支持向量机模型进行检测和分类,得到候选的鼻音,最后根据音段持续时间、前端韵母能量、高低频能量差、中低频能量比等特征对候选的鼻音进行后处理,去除插入错误,提高鼻音检测的准确率。实验结果表明,干净语音鼻音检测准确率可以达到90.4%,信噪比10dB的语音鼻音检测准确率可达到84.4%以上。  相似文献   

2.
张连海  陈斌  屈丹 《计算机科学》2012,39(9):211-214
提出了一种基于发音特性的摩擦音和塞擦音分类方法,该方法首先基于Seneff听觉谱提取一组描述音段能量分布特性和谱统计量的特征参数,刻画两者在发音过程上的差异,然后采用支持向量机模型实现摩擦音和塞擦音的分类。实验结果表明,其干净语音分类准确率可以达到90.08%,信噪比为5dB的语音分类准确率可达到80.4%,与传统的基于时频能量分布特征的摩擦音和塞擦音分类方法相比,较大地提高了低信噪比下的性能。  相似文献   

3.
端点检测是语音识别系统的一个重要组成,尤其是在噪声环境中,其准确性对语音识别系统性能有直接影响。提出了一种基于小波子带倒谱系数(SBC)的语音信号端点检测方法,利用小波变换对频带进行尺度划分,采用小波子带倒谱能量检测语音端点。通过与MFCC的仿真对比以及大量实验分析,小波子带倒谱特征在语音端点检测中具有更好的识别性能。  相似文献   

4.
《计算机科学与探索》2019,(9):1534-1542
语音端点检测是语音信号处理的基础,为了提高在低信噪比及非平稳噪声下语音端点检测的准确性,提出了一种基于长时信号功率谱变化的语音特征,利用阈值判决法验证了这一特征在语音端点检测中的应用前景。该方法首先统计信号在长时段下功率谱的变化量;然后进行阈值判决,在初始化后可依据每次的判决结果自适应更新阈值;最后通过投票决策机制来判定当前是否为语音帧。仿真结果表明,与两种经典的基于长时特征(长时段信号变化率和长时段信号谱平坦度)的语音端点检测方法相比,所提方法在不同噪声环境及信噪比下,均具有更高的检测准确率,尤其在非平稳噪声条件下的检测效果提升明显,例如在机枪噪声环境下,平均检测准确率提高超过10%。  相似文献   

5.
在分析语音信号与噪声在高低频带的能量谱表现特征基础上,提出一种低信噪比条件下采用高低频带对数能量谱比贝叶斯决策的语音端点检测方法.首先根据样本计算语音信号和背景噪声在高低两个不同频带的对数能量谱比值,依据最大似然估计得到两类信号对数能量谱比的统计分布,并基于贝叶斯决策准则推导最佳判决阈值.信号输入时,逐帧计算高低频带对数能量谱比并与判决阈值进行比较来进行语音和背景噪声的分类判决,从而实现语音信号的端点检测.实验结果表明,与传统的双门限检测法和谱熵检测法相比,提出的方法在较低信噪比条件下能更加准确地检测语音端点,明显提高了端点检测的准确率和速度.  相似文献   

6.
针对使用语音变换技术的语音篡改,提出一种自动检测方法。在分析语音变换基本模型和变换语音失真的基础上,提取语音信号的声道参数以及相关的信号统计量,并通过支持向量机递归特征消除法,选择出对语音变换比较敏感的特征作为分类特征,使用支持向量机进行语音变换检测和变换语音的说话人性别判别。对于一种语音变换软件的实验结果表明,该方法具有较高的检测准确率,其中语音变换检测的平均准确率为94.90%,变换语音的说话人性别判别平均准确率为92.09%。  相似文献   

7.
范影乐  俞祁焰  李轶  庞全 《传感技术学报》2007,20(10):2288-2293
应用Hilbert-Huang变换方法对语音特征进行分析,提高低信噪比语音端点检测的正确率.对语音信号进行Hilbert-Huang变换,得到语音信号在时域和频域上的能量分布,建立语音信号的时间–频率–振幅的三维Hilbert谱分布以及边际谱分布进行特征分析,最后通过语音端点检测验证Hilbert-Huang变换分析含噪语音特征及降噪的有效性.通过语音端点检测的结果表明,经过 Hilbert-Huang变换对含噪语音分析降噪后,检测准确率有显著提高.Hilbert-Huang变换方法能够真实描述语音信号的非线性以及非平稳特性,具有广泛的应用前景.  相似文献   

8.
基于改进型离散小波变换的语音激活检测   总被引:1,自引:1,他引:0  
陈明义  孙冬梅  黎华 《计算机仿真》2009,26(11):324-326
在语音信号处理系统中,语音激活检测是一个非常重要的方面.为了提高在噪声环境下语音激活检测的性能,提出了一种基于改进型离散小波变换的语音激活检测(VAD)的方法.算法将语音信号进行离散小波变换,然后通过Teager能量算子(TEO),提取能量比值和能量差值两个参数,最后进行门限判决.在MATLAB平台上,对语音信号进行激活检测仿真,实验结果表明在噪声环境中,提出的算法能够有效克服低信噪比环境的影响,并且优于倒谱距离和谱熵检测算法.  相似文献   

9.
为提高复杂噪声环境下语音信号端点检测的准确率,提出一种基于梅尔频谱倒谱系数(MFCC)距离的多维特征语音信号端点检测算法。通过计算语音信号的MFCC距离,结合短时能量和短时过零率对特征距离进行修正,并更新其阈值,建立自适应噪声模型,实现复杂噪声中语音信号端点的准确检测。实验结果表明,与基于双门限能量和基于倒谱距离的2种经典检测算法相比,在计算效率相同的条件下,该算法的检测准确率更高。  相似文献   

10.
端点检测是语音识别过程中的一个重要的环节,因此改善端点检测的效果一直是语音识别领域的一个重要课题。为了提高在背景噪声下语音信号端点检测的准确率,提出了一种基于小波包的谱熵端点检测方法。该方法对语音信号进行小波包变换,将每帧信号分解成多个子带,在此基础上计算每帧信号的子带能量,通过子带能量所占比例求出每帧信号的谱熵,最后确定新的门限值。仿真实验表明,该方法比传统方法更有效、更优越,能够比较准确地检测语音信号。  相似文献   

11.
提出基于短时能量和过零率的简化语音信号双门限端点检测算法,搭建Matlab的算法仿真平台,实验结果表明,基于短时能量和过零率的双门限端点检测算法在保证检测率的前提下,运算复杂度和运算量均优于倒谱、分形、加权门限端点检测方法。采用Verilog语言完成了该模块的设计和仿真,并成功应用于孤立词语音识别系统中。该语音识别系统采用定点数设计方式,语音信号的采样频率为8kHz,每次采样的数据为8bits,晶片内部稳定工作频率为20MHz。实验结果表明,在200个词源的条件下,平均可以达到90%以上的识别效果。  相似文献   

12.
端点检测是语音识别中一个重要的环节。当信噪比较低时,传统的基于短时能量和短时过零率的端点检测方法不能有效地工作。由于Teager能量算子TEO(Teager Energy Operator)和差分算法可以有效地抑制噪声,因此,提出了一种基于TEO和差分算法的端点检测方法。实验证明,该算法在信噪比较低的情况下,能够随着环境自适应门限,准确地检测出语音信号。通过对两种不同的端点检测算法的比较,证明了基于差分和Teager能量算子的算法的检测正确率较高。  相似文献   

13.
语音有声/无声检测是影响语音增强和识别性能的一个关键因素,提出一种鲁棒的基于四阶统计量的语音有声/无声检测技术。利用语音信号的振幅谱是超高斯分布的特性,对每一帧语音信号的振幅谱,计算其四阶统计量,用来度量其超高斯性。结合该帧语音信号的能量,使用一个简单的阈值分类器,实现语音“无声”和“有声”期的检测。所提出的语音有声/无声检测技术,经实验证明具有很好的效果。  相似文献   

14.
为了提高低信噪比环境下语音增强的效果、算法的鲁棒性.在基于维纳滤波算法的基础上,结合基于频域特征的语音端点检查算法,提出了一种新的语音增强算法.端点检测算法使用小波包ERB子带的谱熵和改进的频域能量的能熵比法.其中,小波包ERB子带的谱熵考虑了人耳听觉掩蔽模型和语音与噪声信号之间的频率分布之间的不同;频域能量利用了有语音帧和无语音帧的能量不同.维纳滤波算法实时采集语音数据并使用新的参数来区别无语音段和有语音段,并在无语音段平滑更新噪声谱.实验结果表明,该端点检测算法能够很好的区分有语音段和无语音段,这就使得在低信噪比的情况下语音增强效果得到了提升,同时算法的鲁棒性和实时性也得到了保障.在与其他两种算法对比中,得到了更好的语音增强效果.  相似文献   

15.
基于发音特征的声效相关鲁棒语音识别算法   总被引:1,自引:0,他引:1  
晁浩  宋成  彭维平 《计算机应用》2015,35(1):257-261
针对声效(VE)相关的语音识别鲁棒性问题,提出了基于多模型框架的语音识别算法.首先,分析了不同声效模式下语音信号的声学特性以及声效变化对语音识别精度的影响;然后,提出了基于高斯混合模型(GMM)的声效模式检测方法;最后,根据声效检测的结果,训练专门的声学模型用于耳语音识别,而将发音特征与传统的谱特征一起用于其余4种声效模式的语音识别.基于孤立词识别的实验结果显示,采用所提方法后语音识别准确率有了明显的提高:与基线系统相比,所提方法5种声效的平均字错误率降低了26.69%;与声学模型混合语料训练方法相比,平均字错误率降低了14.51%;与最大似然线性回归(MLLR)自适应方法相比,平均字错误率降低了15.30%.实验结果表明:与传统谱特征相比发音特征对于声效变化更具鲁棒性,而多模型框架是解决声效相关的语音识别鲁棒性问题的有效方法.  相似文献   

16.
一种新的基于信息熵的带噪语音端点检测方法   总被引:5,自引:0,他引:5  
严剑峰  付宇卓 《计算机仿真》2005,22(11):117-120
在自动语音识别和变速率语音编码技术中,语音端点检测是前端处理的一个重要环节.而在实际的噪声环境下,一些传统的端点检测方法已不适用.该文提出了一种新的基于信息熵的语音端点检测方法,该方法通过对语音信号的短时功率谱进行谱分析,由此构造熵函数作为端点检测的特征参数.实验结果表明,该方法在噪声环境下性能优于传统的基于能量的端点检测方法.而且相对于基于频谱谱熵的算法,在低信噪比(SNR〈0dB)情况下,该文方法有更好的鲁棒性,可使平均检测精确度进一步提高约5%.  相似文献   

17.
Multiband Modulation Energy Tracking for Noisy Speech Detection   总被引:1,自引:0,他引:1  
The ability to accurately locate the boundaries of speech activity is an important attribute of any modern speech recognition, processing, or transmission system. The effort in this paper is the development of efficient, sophisticated features for speech detection in noisy environments, using ideas and techniques from recent advances in speech modeling and analysis, like presence of modulations in speech formants, energy separation and multiband filtering. First we present a method, conceptually based on a classic speech–silence discrimination procedure, that uses some newly developed, short-time signal analysis tools and provide for it a detection theoretic motivation. The new energy and spectral content representations are derived through filtering the signal in various frequency bands, estimating the Teager–Kaiser Energy for each and demodulating the most active one in order to derive the signal's dominant AM–FM components. This modulation approach demonstrated an improved robustness in noise over the classic algorithm, reaching an average error reduction of 33.5% under 5–30-dB noise. Second, by incorporating alternative modulation energy features in voice activity detection, improvement in overall misclassification error of a high hit rate detector reached 7.5% and 9.5% on different benchmarks.  相似文献   

18.
在低信噪比和非平稳噪声干扰下,语音信号的清浊音检测是语音信号处理中的一个重要研究问题。论文基于语音正弦模型,提出了一种清浊音分类和浊音谐波提取算法。该方法在分析了语音的三阶累积量谱后,用子谐波-谐波方法取得基音,并计算出谐波参数和高低频能量比值。它利用谱包络估计器得到谱包络及尖峰信号,结合最小均方估计准则下的迭代算法计算语音谐波的信噪比;通过对上面各计算结果的综合评价得出语音帧的浊音度,从而得到语音清浊音的分类和浊音谐波数。仿真结果表明,该算法在复杂噪声背景下,能有效进行语音分类,准确得到浊音度。同时该算法还具有实时性好、语音参数分析精度高的特点。  相似文献   

19.
In general, speech is made with sequences of consonants (fricatives, nasals and stops), vowels and glides. The classification of the stop consonants remains one of the most challenging problems in speech recognition. In this paper, we propose a new approach based on the normalized energy in frequency bands in the release and closure phases in order to characterize and classify the Arabic stop consonants (/b/, /d/, /t/, /k/ and /q/) and to recognize the CV syllable. Classification experiments were performed using decision algorithms on stop consonants C and CV syllables extracted from an Arabic corpus. The results yielded to an overall stop consonants classification of 90.27% and syllables CV recognition upper than 90% for all stops.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号