首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 280 毫秒
1.
基于DCT分带谱熵与信号分解的高精度基音检测算法   总被引:2,自引:0,他引:2       下载免费PDF全文
本文就低速率WI语音编码中的基音检测技术进行研究,针对基音检测在不同噪声与信噪比下容易发生清浊误判的问题,在基音检测前端引入基于DCT分带谱熵的语音检测算法划分语音段与非语音段;为了向基音检测算法提供更能准确反映基音周期实际变化的输入语音,基于谐波-噪声模型提出了一种改进的DCT域语音分解算法.然后,根据变形的MCAMDF(Modified Circular Average Magnitude Difference Function)与NCCF(Normalized Cross-Correlation Function)的峰值共性,结合上述两项基音检测前端处理技术,提出了MCAMDF-NCCF基音检测组合算法.为了满足不同环境下WI编码器对基音检测高精度的要求,在合成端更准确地恢复相位轨迹,本文又基于MCAMDF-NCCF算法提出了高精度MCAMDF-NCCF-FRAC基音检测算法以计算分数基音.将算法应用与2kb/s WI编码器,主观A/B听力测试结果表明,本文提出的基音检测算法在低信噪比下明显抑制了基音加倍减半及清浊误判现象的发生,得到了优异的基音检测结果,合成语音质量完全满足低速率WI编码器对基音检测技术的要求.  相似文献   

2.
一种高精度改进型SHR基音检测算法   总被引:2,自引:0,他引:2  
应娜  赵晓晖 《通信学报》2005,26(12):86-92
利用正弦语音模型中浊音存在的谐波与子谐波,在SHR(subharninctoharmonicratio)算法的基础上,提出了一种改进型高精度基音检测算法ISHR(improvingsubharninctoharmonicratio)。根据幅度调制和频率调制在语音分析中的特性、频域中幅度值和自相关频率比值,该方法采用基于正弦模型的均方误差对语音进行检测,提取出准确基音。仿真结果表明此种算法在基音提取中具有高精度及高可靠性。  相似文献   

3.
基于混合幅度差函数的基音提取算法   总被引:11,自引:0,他引:11  
刘建  郑方  邓菁  吴文虎 《电子学报》2006,34(10):1925-1928
为了减少基音周期提取中的倍频和半频错误,进行更准确的基音周期估计,提出一种基于混合幅度差函数的基音周期提取方法.分析比较了不同幅度差和自相关函数估计基音周期错误率的分布,结合两类典型幅度差函数的优点定义了混合幅度差函数;进而基于混合幅度差函数,给出了使用历史信息进行校正的后处理方法.分析表明,所提方法可提高基音周期估计准确率,接近实时地确定基音周期,减少了传统基音周期估计因平滑处理而带来的误差或者动态规划处理带来的延迟.大量实验表明本文提出的基音周期提取方法比传统方法的错误率降低了13.8%.  相似文献   

4.
基于扩展谱相减的RCAF基音周期检测算法   总被引:1,自引:0,他引:1  
针对传统基音检测算法在信噪比低的情况下提取的基音周期错误率较高,该文提出了一种基于RCAF (Reverse CAMDF Autocorrelation Function)搜索试探平滑的基音轨迹提取方法。采用自适应判决准则的扩展谱相减进行语音增强,在语音段实现了对噪声信号的估计。应用RCAF算法提取基音周期,通过搜索试探平滑算法对提取出的基音周期进行平滑处理。该算法降低了误判率,提高了提取精度。仿真结果表明,该算法在-10dB信噪比情况下,其性能优于传统的CAMDF和AWAC等方法。  相似文献   

5.
一种改进的自相关函数基音检测算法   总被引:3,自引:0,他引:3  
提出了一种改进的自相关函数基音检测算法:首先利用清浊音自相关函数幅度值的不同性质进行清浊音判决,然后仅对浊音段检测基音周期。在基音检测前用带通滤波、中心削波和数值滤波等方法进行预处理,去除共振峰和高频噪声的影响;在基音检测过程的后端用搜索平滑方法进行后处理,平滑掉半、倍频点和随机错误点。实验结果表明,改进算法的效果优于传统自相关算法,而且在信噪比低至5 dB时仍有良好的清浊音判决和基音检测性能。  相似文献   

6.
噪声环境下语音信号的基音检测   总被引:1,自引:1,他引:0  
赵静  罗兴国  蔡文涛 《电声技术》2007,31(3):54-56,62
研究和改进了一种基于归一化互相关系数的基音检测方法(NCCFPDA)。NCCFPDA算法利用归一化互相关系数、短时归一化能量和自适应门限来区分清/浊音和选取基音周期,计算量小,精度高。在NCCFPDA算法的基础上,采用动态规划的方法对检测出的基音周期进行平滑,并在噪声环境下与自相关法检测基音周期的检测结果进行了比较。实验表明NCCFPDA算法在基音轨迹的平滑和清/浊判别方面都具有令人满意的效果,能实现基音周期的鲁棒性检测。  相似文献   

7.
循环AMDF及其语音基音周期估计算法   总被引:21,自引:2,他引:21       下载免费PDF全文
张文耀  许刚  王裕国 《电子学报》2003,31(6):886-890
基音周期是语音压缩、合成以及识别中的一个重要参数.传统的基于AMDF的基音估计算法容易导致估计的基音周期加倍.本文针对该现象,分析了AMDF函数的特性及其用于基音检测时存在的不足,提出了新的CAMDF函数.CAMDF有效地克服了AMDF函数的不足,简化了基音检测过程.在此基础上,本文给出了新的基于CAMDF的基音检测算法.该算法不仅简化了基音检测过程,而且降低了误判率,提高了估计精度.大量实验表明其性能优于其它AMDF或LVAMDF的方法.  相似文献   

8.
低信噪比环境下的基音检测颇具难度却极有现实意义,传统基音检测在此背景下效果不佳。因此,提出一种基于多分类支持向量机的基音检测算法。该算法使用语音信号的静态帧级特征对多分类支持向量机进行监督训练,计算出各帧语音可能的几个基音大小,作为对应的基音候选值,并使用主体延伸法对得到的候选基音状态进行处理,结合帧与帧之间的时序信息,在候选基音中选取合适值连接起来得到被测语音的基音状态估计曲线。将该算法与相关方法进行比较,实验结果表明,该方法有效提升了低信噪比环境下的基音检测率,在不同强度的噪声干扰下仍能保持良好的鲁棒性。  相似文献   

9.
基于归一化互相关函数的基音检测算法   总被引:34,自引:2,他引:32  
鲍长春  樊昌信 《通信学报》1998,19(10):27-31
本文提出了一种归一化互相关函数基音检测算法(NCCFPDA——NormalizedCross-CorrelationFunctionPitchDetectionAlgorithm),该算法在基音检测主过程的前端和末端加入了有效的预处理和后处理技术,实验分析表明,该方法在一般噪声环境下,基音周期提取和清浊判决具有令人满意的效果。  相似文献   

10.
噪声环境下的基音检测方法   总被引:4,自引:0,他引:4  
噪声环境下的基音检测在语音信号分析和识别中占有得要地位。自相关法和平均幅度差函数是两种常用的基音检测方法。结合两种方法,提出了一种有效的噪声环境下基音检测方法。实验表明,该方法是可行的,与传统方法相比鲁棒性好,特别适用于信噪比较低的情况。  相似文献   

11.
胡瑛  陈宁 《电声技术》2006,(11):63-66
提出了一种基于小波变换的鲁棒性基音周期检测方法。首先结合平均能量频带分布和短时过零率这两个特征参数对语音信号进行清浊音判决,然后对浊音段采用空域相关函数提取基音周期。实验表明,与传统的小波变换和自相关算法相比,该方法鲁棒性好,对基音检测具有更高的准确性。  相似文献   

12.
The rate of oscillation of the vocal cords known as the pitch is an important sound feature that is useful in many speech applications. A novel approach for the automatic detection and estimation of the rate of oscillation of the vocal cords is described. The importance of this approach stems from the fact that pitch determination is conducted using three independent stages: a segmentation stage; a voiced-unvoiced classification stage; and a pitch estimation stage. Segmentation and the detection of voiced segments are implemented prior to pitch estimation in order to: exclude unvoiced sounds and silence from biasing the result of pitch estimation; employ a simple segmentation procedure with low computational complexity and time-delay; enhance the accuracy of voiced-unvoiced classification by including additional features in voicing detection; help pitch tracking by testing similarities over successive segments and to make use of a different analysis domain that enables a high resolution pitch estimation. A frequency-domain maximum likelihood procedure is used for the estimation of the pitch frequency of voiced segments by maximizing a log-likelihood function over the range of possible pitch frequencies in conversational speech. An efficient simplified realization of the generalized likelihood ratio segmentation method is also presented. Computer simulations on a number of utterances show that this approach gives an accurate, reliable and robust estimation of the pitch of voiced sounds.  相似文献   

13.
李晔  樊燕红  郝秋赟  郭强 《电声技术》2010,34(12):51-53
基于增强型混合激励线性预测模型,提出一种高质量的300 bit/s声码器算法。每个语音帧仅提取少量参数,为提高量化效率,每8个语音帧组成一个超级帧,对超级帧参数进行矢量量化。算法采用基于模式转移的码本映射估计带通浊音度参数,改善其量化精度。对不同带通浊音度模式下的基音参数量化码本尺寸进行联合优化,提高量化效率。同时,对线谱频率参数采用带有级间预测的多级矢量量化以降低谱失真。主观听觉测试表明,此声码器具有较高的可懂度并具有一定的自然度,诊断押韵测试(DRT)的分数为84.2%。  相似文献   

14.
A hybrid pitch detector characterised by parallel analysis of the speech signal in temporal, spectral and cepstral domains is proposed. The voiced/unvoiced decision and pitch period evaluation is realised by a logical analysis of the results from three domains. The experimental analysis shows the robustness of the detector for noisy and telephone speech.<>  相似文献   

15.
The authors describe an integrated speech feature extraction method consisting of: (1) a pitch detector; (2) a voicing decision to correctly partition speech into voiced and unvoiced intervals; (3) a confidence measure which reflects the probabilistic accuracy of the voicing decision; (4) a confidence measure which reflects the expected deviation of the pitch estimate from the true pitch and the probabilistic accuracy of this deviation; and (5) smoothing techniques for the pitch detector, the voicing decision, and the two confidence measures. The focus of their research is on voiced and unvoiced speech corrupted by high levels of white noise. The voicing decision and the confidence measures are developed by observing the behavior of three features derived from the autocorrelation function and experimentally fitting curves to the data. This integrated set of algorithms is statistically analyzed for speech at seven signal-to-noise ratios  相似文献   

16.
该文提出了一种码率为 0.75-5.4kb/s可变速率的高质量语音编码讲法。该算法对CELP的激励进行了改进,根据语音的特征把语音分成4类,不同类型的语音采用不同的激励码本。特别是对于浊音,提出了一种基于基音同步的嵌入分裂式激励码本,该码本利用浊音具有准周期性的特点,使该算法在很低的码率下就可很好地恢复浊音信号,克服了CELP在4kb/s速率以下因码本尺寸小而导致合成语音质量差的缺点。经非正式听音测试,它的主观质量超过了1~8kb/s的可变速率QCELP系统,并且平均速率大约只有2kb/s,比QCELP的5kb/s平均速率低了很多、非常适用于 CDMA移动通信系统。  相似文献   

17.
一种新的子波域语音增强方法   总被引:7,自引:0,他引:7  
王振力  张雄伟  郑翔  杨剑 《信号处理》2006,22(3):325-328
提出了一种新的子波域语音增强法,即首先对带噪语音进行1层离散小波变换,然后对提取出来的低频信号和高频信号分别作3层DWT和3层小波包分解,最后对去噪后的语音完成重构。为了在降噪过程中减少清音信息的损失, 文中对语音信号进行了清浊音判决并分别采用多阈值进行处理。计算机仿真结果表明,经本文方法增强语音的清音成分得到了较好保留,并且增强语音的主客观质量均优于DWT去噪法和WPD去噪法。  相似文献   

18.
董恩清  刘贵忠  周亚同  顿玉洁 《电子学报》2001,29(10):1364-1367
文中主要对王永忠等提出的灵活分割算法存在的问题做了相应的改进,并做了比较分析,然后将改进后的分割算法应用于语音信号的清-浊音自动分割中.经过大量的理论模型与实际语音信号验证该改进后的算法确实解决了二进分割算法及王永忠方法存在的问题,达到了对信号自适应有效分割.仍然采用Wesfreid等提出的清-浊音识别准则,将新的分割方法应用到实际语音信号的清-浊音自动分割中,不仅同样产生较好划分结果,而且在时间上没有过多的冗余分割.  相似文献   

19.
Unvoiced/voiced classification of speech is a challenging problem especially under conditions of low signal-to-noise ratio or the non-white-stationary noise environment. To solve this problem, an algorithm for speech classification, and a technique for the estimation of pairwise magnitude frequency in voiced speech are proposed. By using third order spectrum of speech signal to remove noise, in this algorithm the least spectrum difference to get refined pitch and the max harmonic number is given. And this algorithm utilizes spectral envelope to estimate signal-to-noise ratio of speech harmonics. Speech classification, voicing probability, and harmonic parameters of the voiced frame can be obtained. Simulation results indicate that the proposed algorithm, under complicated background noise, especially Gaussian noise, can effectively classify speech in high accuracy for voicing probability and the voiced parameters.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号