首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
语音处理中自适应小波变换的应用   总被引:6,自引:0,他引:6  
本文提出一种语音端点检测方法,将小波变换模极大值应用于信号突变点的检测,有效地控制了噪声,能精确地检测出语音端点。  相似文献   

2.
一种语音端点检测算法及其在DSP上的实现   总被引:1,自引:0,他引:1  
提出一种基于模糊RBF神经网络的语音端点检测算法。该算法先利用小波分析提取语音信号的特征量,然后将其输入到模糊RBF神经网络进行端点检测运算,并采用以TMS320VC5416DSP为核心的电路进行算法实现。实验结果表明,该系统的端点检测正确率很高,即使在低信噪比时也能正确地判断语音信号的端点。  相似文献   

3.
基于临界频带及能量熵的语音端点检测   总被引:1,自引:0,他引:1  
张婷  何凌  黄华  刘肖珩 《计算机应用》2013,33(1):175-178
语音端点检测的准确性直接关系着语音识别、合成、增强等语音领域的准确性,为了提高语音端点检测的有效性,提出了一种基于临界频带及能量熵的语音端点检测算法。算法充分利用人耳听觉特性的频率分布,将含噪语音信号进行临界频带划分,并结合各频带内信号的能量熵值在语音段和噪声段的不同分布,实现不同背景噪声下语音端点检测。实验结果表明,提出的语音端点检测算法与传统的短时能量法相比,检测正确率平均高1.6个百分点。所提方法在不同噪声的低信噪比(SNR)环境下均能实现语音端点检测。  相似文献   

4.
语音端点检测是语音识别系统中最基本的模块,端点检测的准确与否直接影响了系统的运算复杂度和系统的识别性能.本文描述了一种典型的语音端点检测算法--两级判别法,并分析了这种方法在Matlab上的实现,最后给出了仿真结果.实验结果表明,两级判别法对于语音端点检测具有良好的效果.  相似文献   

5.
一种语音信号端点检测的改进方法   总被引:3,自引:0,他引:3  
顾亚强  赵晖  吴波 《计算机仿真》2010,27(5):340-343
在研究传统的语音端点检测方法的基础上,为提高语言识别率和准确性,提出了一种新的利用对短时能零和过零率的进行差分的方法来求取语音的起始点,达到了语音端点检测的目的。利用语音段和无声段的边界差异性,运用差分的方法找到语音段的起点和末点,避免了对语音段本身的判定过程,增强了抗噪性能也降低了计算复杂度。通过仿真实验结果可以证明,上述方法优于传统语音端点检测方法。  相似文献   

6.
针对染有加性噪声的语音信号,提出了一种基于信号子空间和信息复杂度相结合的语音端点检测方法。该方法先利用信号子空间法去除加性噪声,再对增强后的语音利用信息复杂度进行端点检测。实验仿真表明,该方法相对传统的语音端点检测方法,能提高语音端点检测准确率,特别在低信噪比条件下具有较高的端点检测准确率。  相似文献   

7.
小波分析和支持向量机相融合的语音端点检测算法   总被引:1,自引:0,他引:1  
为了提高语音端点检测的适应性和鲁棒性,提出一种基于小波分析和支持向量机的语音端点检测算法。首先利用小波变换提取语音信号的特征量,然后将这些特征量作为支持向量机的输入进行训练和建模,最后判断出该信号的类别。仿真实验表明,相对于传统的语音端点检测算法,小波分析和支持向量机的检测算法提高了语音端点检测的正确率,有效降低了虚检率和漏检率,具有更好的适应性和鲁棒性,对不同信噪比的信号都有较好的检测能力。  相似文献   

8.
针对语音复读系统等背景噪声相对较小且稳定的实际应用环境,提出一种改进的基于时域分析的句子语音端点检测算法。因为在此类应用环境中,对句子语音端点检测的干扰因素较少,且一般需要实现快速的句子语音端点检测。因此,简化了所要使用的语音特征参数,不再使用时域分析中常用的过零率,仅使用语音信号能量特征值辅以聚类分析完成语音端点检测。实验表明,本算法简化了端点检测的过程,可以便捷有效地检测出句子中的语音端点。  相似文献   

9.
为了提高语音端点检测率,提出一种改进动量粒子群优化神经网络的语音端点检测算法(WA-IMPSO-BP)。利用小波分析提取语音信号的特征量,将特征向量作为BP神经网络输入进行学习,并采用粒子群算法优化BP神经网络参数,建立语音端检测模型,在Matlab环境下进行仿真实验。仿真结果表明,WA-IMPSO-BP提高了语音端点检测率,有效降低了虚检率和漏检率,表示WA-IMPSO-BP是一种检测率高,抗噪性能强的语音检测算法。  相似文献   

10.
一种语音信号端点检测方法及其在DSP上的实现   总被引:5,自引:0,他引:5  
本文介绍了一种基于能量状态变迁算法的语音端点检测,并阐述了如何用TI的TMS320C542DS实现一个带有端点检测的语音识别系统。论文详细介绍了具体的实现方法,并对检测结果进行了分析。  相似文献   

11.
在汉语连续语音识别中,准确检测出音节的始点和终点是很重要的一步,传统的端点检测方法在非连续语音中检测准确度很高,但在连续语音中检测准确度会大幅度降低。利用MFCC0参数和汉语元音的共振峰能量设计了一种新的端点检测方法,可以准确检测出汉语连续语音中的音节端点。实验结果表明:这种端点检测方法在低信噪比下也有很高的检测正确率。  相似文献   

12.
根据语音信号的基音周期范围有限和周期相对稳定的特点,改进了可变长平均幅度差函数法(LV AMDF),提出一种自适应幅度差法检测基音周期。它在语音非稳定段通过简单的谷值点评选机制,筛选当前谷值点以及历史谷值点,得到较精确的基音周期;在语音稳定段依据历史谷值点缩短语音段的比较范围,减少计算代价。还改进了浊音起止点检测算法,使浊音起止点的定位更精确。实验证明,该方法在不同的信噪比环境下有效地降低了半周期和倍周期点的发生率。  相似文献   

13.
Segmentation plays vital role in speech recognition systems. An automatic segmentation of Tamil speech into syllable has been carried out using Vowel Onset Point (VOP) and Spectral Transition Measure (STM). VOP is a phonetic event used to identify the beginning point of the vowel in speech signals. Spectral Transition Measure is performed to find the significant spectral changes in speech utterances. The performance of the proposed syllable segmentation method is measured corresponding to manual segmentation and compared with the exiting syllable method using VOP and Vowel Offset Point (VOF). The result of the experiments shows the effectiveness of the proposed system.  相似文献   

14.
基于LV-AMDF的自适应基音检测算法   总被引:1,自引:0,他引:1  
张康杰  赵欢  饶居华 《计算机应用》2007,27(7):1674-1676,1679
根据语音信号的基音周期范围有限和周期相对稳定的特点,改进了可变长平均幅度差函数法(LV-AMDF),提出一种自适应幅度差法检测基音周期.它在语音非稳定段通过简单的谷值点评选机制,筛选当前谷值点以及历史谷值点,得到较精确的基音周期;在语音稳定段依据历史谷值点缩短语音段的比较范围,减少计算代价.还改进了浊音起止点检测算法,使浊音起止点的定位更精确.实验证明,该方法在不同的信噪比环境下有效地降低了半周期和倍周期点的发生率.  相似文献   

15.
In this paper we propose a method for improving the performance of the segmentation of speech waveforms to phonetic units. The proposed method is based on the well known Viterbi time-alignment algorithm and utilizes the phonetic boundary predictions from multiple speech parameterization techniques. Specifically, we utilize the most appropriate, with respect to boundary type, phone transition position prediction as initial point to start Viterbi time-alignment for the prediction of the successor phonetic boundary. The proposed method was evaluated on the TIMIT database, with the exploitation of several, well known in the area of speech processing, Fourier-based and wavelet-based speech parameterization algorithms. The experimental results for the tolerance of 20 milliseconds indicated an improvement of the absolute segmentation accuracy of approximately 0.70%, when compared to the baseline speech segmentation scheme.  相似文献   

16.
基于经验模态分解和递归图的语音端点检测算法   总被引:1,自引:1,他引:0       下载免费PDF全文
结合Hilbert-Huang变换中的经验模态分解(EMD)和递归图(RP)法,提出了一种新的语音端点检测算法。该算法首先基于语音和噪声通过经验模态分解及其多尺度特征,在不同的固有模态函数(IMF)上进行软阈值时间尺度滤波处理,然后采用非线性动力学行为中的递归图法,定量统计递归分析中的确定性进行语音端点检测。仿真结果表明,该方法具有很强的非稳态动态变化分析能力,在低信噪比环境下较传统方法能更准确提取出语音信号的起止点,鲁棒性好。  相似文献   

17.
吴庆贺  吴海锋  沈勇  曾玉 《计算机应用》2020,40(5):1476-1482
在协同作业的工业环境中进行语音通信时,语音往往会淹没于工业噪声中,致使语音通信的有效性受到影响。针对这种工业噪声下的语音环境,提出了一种采用多麦克风的卡尔曼语音增强算法。该算法简化了状态空间模型(SSM)中的差分方程以降低复杂度,每个采样点实时得到去噪信号从而增强了实时性。另外,为了进一步简化复杂度,还利用最小二乘原则来对语音进行增强。实验中采用了公开数据库的语音信号和工厂噪声信号来模拟多麦下的带噪语音,将所提算法与传统算法进行了对比。实验结果表明,所提算法的输出语噪比(增强后的语音与残留噪声之比)优于传统算法约2 dB,而运行时间仅不到传统算法的2%,且延迟时间仅是毫秒级。  相似文献   

18.
针对k-均值算法对初始点敏感、易陷入局部最优的问题,提出一种基于词性和中心点改进的文本聚类方法(STICS)。通过改进文本的语义型表示,优化中心点的选取,并消除孤立点的负面影响,从而获得较好的聚类效果。STICS考虑不同词性特征对文本的贡献,采用加权的向量空间模型来表示文本。对于中心点的选取,首先度量每个样本的样本平均相似度,其次选取样本平均相似度最大的样本作为第一个聚类中心。此外,STICS消除孤立点的负面影响,以此提高聚类效果。实验结果表明文中方法确实具有更好的聚类效果。  相似文献   

19.
The requirement for low data rate voice transmission has resulted in a large number of algorithms being proposed for speech digitization at data rates of 2·4–4 kilobits/sec. Many of the proposed algorithms are quite complicated and have their origin in disciplines generally considered to be outside of the realm of the speech researcher or communication system designer. Additionally, the algorithms have been developed and presented in highly varying notation using various theoretical approaches. The result is a confusing array of equations, algorithms, and numerical analysis procedure. It is the goal of this paper to alleviate this problem by providing a unified tutorial development of the various algorithms used and proposed for speech data compression.Classical least squares estimation theory is used as the focal point of the discussion since it forms the basis for several of the more familiar speech digitization algorithms. The remainder of the algorithms, whether they have their basis in stochastic estimation theory or statistical regression theory, are related back to the more familiar least squares approach. The speech digitization techniques discussed are the covariance method, the autocorrelation method, the PARCOR method, a priori analysis, the sequential least squares method, the Kalman filter approach, the stochastic approximation method, and the general linear regression model. An effort has been made to provide sufficient theoretical background to establish the algorithm relationships without stressing mathematical rigor.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号