共查询到19条相似文献,搜索用时 109 毫秒
1.
针对传统最小均方误差谱幅度估计(MMSE—STSA.minimum mean-square error-short time spectral amplitude)语音增强算法无法有效的跟踪非平稳噪声变化的问题,对一种改进的MMSE-STSA语音增强算法进行了研究和仿真。该算法对背景噪声的估计利用加权噪声估计方法:采用一个非线性函数根据带噪语音信噪比(SNR.signal—to-noise ratio)的变化计算得到相应的加权因子并作用于带噪语音信号,对加权的带噪语音求平均得到估计的背景噪声。算法中的谱增益修正,还可以抑制低信噪比时的残留噪声以及避免对带噪语音的过抵消。实验结果表明,该方法能很好的跟踪非平稳噪声的变化,不仅在增强性能上有很好的效果,同时降低了语音的失真。 相似文献
2.
基于线性预测的数字语音参数估计 总被引:2,自引:0,他引:2
介绍了数字语音信号分析中的线性预测的基本原理。讨论了用线性预测估计基本语音参数的方法、并对实验仿真结果进行了分析,从实验分析结果可知:线性预测分析是一种估计精度较高、运算速度较快的语音参数估计方法。 相似文献
3.
为提高低信噪比环境下的语音可懂度,提出了一种基于联合失真控制的子空间语音增强算法。由于误差信号中的语音失真和残余噪声分量不能被同时最小化,同时,由语音估计器引起的语音放大失真超过6.02 d B时会严重损害语音可懂度。为此分别对语音失真和残余噪声进行最小化处理,最小化时把语音放大失真控制在6.02 d B以下作为约束条件,通过求解两个约束最优化问题得到两个不同的估计器,再对这两个估计器进行加权求和,得到一种基于联合失真控制的语音估计器。实验结果表明,相比于传统的子空间增强方法,在低信噪比环境下所提出的算法能更有效提高增强后语音的可懂度。 相似文献
4.
提出了一种基于对数谱估计的改进型语音增强算法。相对于传统语音增强算法,在语音信号存在不确定的条件下,利用软判决增益因子修正技术调正带噪语音信号的对数谱幅度,抑制背景噪声。引入的改进型先验信噪比估计和语音信号先验不存在概率估计方法,能够有效地估计得出语音信号的存在概率,进而求得语音信号存在时的谱增益因子函数,联合语音信号不存在时设定的增益因子函数加权求得谱增益函数。计算机仿真表明,即使在低信噪比条件下,输入背景噪声为高斯白噪声和粉红噪声等加性白噪声时,所提算法对噪声的抑制效果非常明显,且有效地克服了传统算法中引入的“音乐噪声”和语音信号畸变。 相似文献
5.
肖媛媛 《中国新技术新产品》2009,(7):1-2
本文首先对声音的预处理及其信号特征的提取过程进行了简要介绍,然后提出了在孤立字词语音识别的一个新的算法,即新型的识别算法。通过此算法,系统可以在不降低系统识别精度的前提下,大大精简运算量,因此提高了识别系统整体的识别效率。实验证明,这种识别算法在基于模板的孤立字词语音识别中可以达到100%的识别精度,在基于非模板的孤立字词的语音识别中,其识别精度也可以达到90%以上,并且与传统的识别方法相比,缩短了训练时间,提高了识别速度。在孤立字词的语音识别中具有自己独到的优势。然后,构建一个使用方便的语音识别系统,将本算法应用到实践当中来解决人们现实生活中遇到的各种问题。 相似文献
6.
7.
为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,文章提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信号的短时谱减去所估计噪声的短时谱,最后根据去噪后语音信号的短时谱计算美尔倒谱系数(MFCC)作为特征参数。在仿真和真实环境下的语音识别实验中,本文所提出的语音特征参数相比较传统的MFCC其识别正确率分别提升了38.2%和35.8%。实验结果表明本文所提算法能够较好地解决卷积噪声环境下训练与识别特征不匹配的问题,有效提高了语音识别系统的识别正确率。 相似文献
8.
语音识别的一个最重要的领域就是鲁棒性问题,这个问题的核心是如何处理训练和识别不匹配的问题。提出一个在线自适应匹配算法,此算法能够根据当前语音信号,自适应的估计出语音畸变参数,从而调正模型来匹配当前的测试环境,在Aurora2测试集上,正确率显著提升。 相似文献
9.
10.
语音活性检测是语音增强中的一个重要问题。大部分的语音活性检测方法都是建立在相对理想的实验室条件下的.要求背景噪声保持平稳,信噪比较高,这些条件在实际噪声环境中很难满足。本文提出的基于Mel刻度短时能量差的语音活性检测算法,距离测度简单,物理意义叫确,在低信噪比、缓变非平稳噪声环境下,标定准确,鲁棒性好。将其应用在维纳滤波语音增强中的噪声特性估计上,取得了较为理想的效果。 相似文献
11.
12.
13.
14.
15.
单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。 相似文献
16.
17.
传统的语音情感识别方式采用的语音特征具有数据量大且无关特征多的特点,因此选择出与情感相关的语音特征具有重要意义。通过提出将注意力机制结合长短时记忆网络(Long Short Term Memory, LSTM),根据注意力权重进行特征选择,在两个数据集上进行了实验。结果发现:(1)基于注意力机制的LSTM相比于单独的LSTM模型,识别率提高了5.4%,可见此算法有效提高了模型的识别效果;(2)注意力机制是一种有效的特征选择方法。采用注意力机制选择出了具有实际物理意义的声学特征子集,此特征集相比于原有公用特征集在降低了维数的情况下,提高了识别准确率;(3)根据选择结果对声学特征进行分析,发现有声片段长度特征、无声片段长度特征、梅尔倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)、F0基频等特征与情感识别具有较大相关性。 相似文献
18.
19.
潜水员在水下工作时,由于生理方面的原因,需要以氦氧混合气体作为呼吸气体,由于气体结构的变化出现了氦语音现象,使得语音发生畸变,降低了清晰度。通过介绍基于线性预测模型的氦语音增强算法,将频域的线谱对(LSP)分析应用于氦语音增强中,由于线谱对系数与语音信号谱包络有紧密的联系,用线谱对参数(LSP)构成合成滤波器时更容易保证稳定性,所以提出了一种基于线谱对系数(LSP)的氦语音增强算法。通过实验将这种算法与基于线性预测LPC的增强算法进行了比较,实验结果表明,两种算法均能对氦语音进行矫正,并且新的算法能够对共振峰进行单独调节,在不影响清晰度的同时最大限度地保持了原有语音的细节,提高了可懂度。 相似文献