共查询到18条相似文献,搜索用时 140 毫秒
1.
为了提高语音信号端点检测的准确率,提出了改进的端点检测方法。该方法在传统基于能量和过零率的端点检测方法基础上,加入第三道门限——近似熵,对信号进行三级门限检测。仿真实验表明,该方法比传统方法更有效、更优越.能够比较准确的检测语音信号。 相似文献
2.
3.
4.
5.
一种基于迟滞编码的自动语音端点检测方法 总被引:2,自引:0,他引:2
端点检测在语音识别中占有十分重要的地位,端点检测的准确性将直接影响整十语音识别系统的性能。已往的自动端点检测方绝大多数都是利用帧平均能量EN,帧平均跨零数ZN,帧平均跨零积A和帧平均零比B等参敦来确定语音段的始点和终点。这些方法的缺点是难以设置对各次实验都合适的固定阈值,这给实际应用带来了很多不便。本文提出了一种基于迟滞编码的自动端点检测方法——在对语音信号进行迟滞编码的基础上,利用各杖的码字和来判斯语音段的起点和终点。该方法充分利用了噪声和信号的统计特性,克服了已往端点检测方法的不足。实验结果表明.该方法具有良好的性能。 相似文献
6.
基于压缩感知观测序列倒谱距离的语音端点检测算法 总被引:2,自引:0,他引:2
本文基于语音信号在离散余弦基上的近似稀疏性,采用稀疏随机观测矩阵和线性规划重构算法对语音信号进行压缩感知与重构。研究了语音信号的压缩感知观测序列特性,根据语音帧和非语音帧压缩感知观测序列频谱幅度分布分散且差异较大的特性,提出基于压缩感知观测序列倒谱距离的语音端点检测算法,并对4dB-20dB下的带噪语音进行端点检测仿真实验。仿真结果显示,基于压缩感知观测序列倒谱距离的语音端点检测算法与奈奎斯特采样下语音的倒谱距离端点检测算法一样具有良好的抗噪性能,但由于采用压缩采样,减少了端点检测算法的运算数据量。 相似文献
7.
8.
语音端点检测是语音信号预处理过程中的一个重要环节,而在实际的噪声环境下,一些传统的端点检测方法已经不适用,为了提高在强背景噪声条件下语音端点检测的性能,提出了一种在DCT变换域下,基于Gaussian-Gamma模型的语音端点检测算法,设定其纯净语音信号的统计分布函数为Gamma分布,其相应参数使用了最大似然估计以及预测估计的方法.该算法具有较高的准确性和稳健性.仿真实验表明,该方法鲁棒性较好,在较低的信噪比下仍能比较准确的检测到语音信号的端点. 相似文献
9.
10.
为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法。对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测。通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测。 相似文献
11.
传统语音端点检测方法利用语音和噪声在某单一参数特征上的差异进行信号中语音起止点的切分,但不同参数在低信噪比不同噪声环境下表现不稳定,鲁棒性差。因此,本文提出了基于均匀子带谱方差,能熵比,梅尔倒谱距离,似然比四种参数相融合的语音端点检测方法。该方法能自适应地改变各参数阈值,并通过实时监测噪声段能熵比的值确定所采用的投票判决机制,从而进行语音端点判定。实验结果表明,该方法在低信噪比下较常用的端点检测方法有更高的检测正确率及鲁棒性,对语音信号后续处理工作有一定的借鉴意义。 相似文献
12.
13.
14.
基于EMD和改进双门限法的语音端点检测 总被引:3,自引:0,他引:3
语音端点检测的准确与否直接影响到语音识别系统的计算复杂度和识别能力,在基于短时能量和过零率的端点检测算法中,能量计算方法不尽合理而且在低信噪比下检测效果大大降低。对此提出了一种基于经验模式分解和改进双门限法的语音端点检测算法,仿真结果表明在低信噪比情况下本文算法有更好的端点检测能力,显示了算法的优越性。 相似文献
15.
16.
17.
18.
In this paper, we propose the use of data‐driven probabilistic utterance‐level decision logic to improve Weighted Finite State Transducer (WFST)‐based endpoint detection. In general, endpoint detection is dealt with using two cascaded decision processes. The first process is frame‐level speech/non‐speech classification based on statistical hypothesis testing, and the second process is a heuristic‐knowledge‐based utterance‐level speech boundary decision. To handle these two processes within a unified framework, we propose a WFST‐based approach. However, a WFST‐based approach has the same limitations as conventional approaches in that the utterance‐level decision is based on heuristic knowledge and the decision parameters are tuned sequentially. Therefore, to obtain decision knowledge from a speech corpus and optimize the parameters at the same time, we propose the use of data‐driven probabilistic utterance‐level decision logic. The proposed method reduces the average detection failure rate by about 14% for various noisy‐speech corpora collected for an endpoint detection evaluation. 相似文献