共查询到16条相似文献,搜索用时 62 毫秒
1.
深入研究了基于多通道信号子空间的语音增强算法原理,对算法中各个参数对性能的影响进行了深入剖析.同时给出一种选取噪声方差的简单且有效的方法,并通过研究分析,证明多通道信号子空间算法不仅消噪明显而且对语音的损伤微小,而且相比于单通道子空间语音增强算法除了性能上的提升外,还没有导致计算量的增加。最后将多通道子空间语音增强算法用于说话人识别系统.并与其它多通道语音增强算法(延迟求和波束形成、波束形成后维纳滤波、线性约束最小方差波束形成)进行了对比.实验表明多通道信号子空间语音增强算法在多种噪声环境下均可有效的提高说话人识别系统的识别性能。 相似文献
2.
把小波变换和维纳滤波结合起来对语音信号进行去噪和利用NN分类器对语音信号进行非线性融合和子带语音识别,并采用了一种改进的MCE(最小分类错误)算法。通过三尺度的Daubechies小波变换把输入含噪语音信号分解成不同子带,然后在各个子带分别通过维纳滤波去噪,再把各个子带的输出通过小波重构恢复信号,最后通过Mel滤波器组把小波系数转换成MFCC(美尔倒谱系数)。在使用分类器之前先进行GMM(高斯混合模型)识别,并采用改进的MCE(最小分类错误)算法,分类器融合采用了MLP结构。试验结果显示,这种系统取得了较好的抗噪效果,系统的辨识率和鲁棒性都有所提高。 相似文献
3.
针对噪声环境下说话人识别率较低的问题,提出一种基于正规化线性预测功率谱的说话人识别特征。首先对语音信号线性预测分析和正规化处理求出语音频谱包络,然后通过伽马通滤波器组得到对数子带能量,最后对特征参数进行离散余弦变换,得到了一种说话人识别特征正规化线性预测伽马通滤波器倒谱系数(Regularized Linear Prediction Gammatone Filter Cepstral Coefficient,RLP-GFCC)。仿真结果表明,在噪声环境说话人辨认试验中,相比传统特征美尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)和伽马通滤波器倒谱系数(Gammatone Filter Cepstral Coefficient,GFCC)的系统识别率得到了明显提高,对噪声环境的鲁棒性得到了增强。 相似文献
4.
5.
根据不同环境下不同说话人语音特征各阶差异较大的特点,对矢量量化算法进行改进,提出一种基于动态权值改进的矢量量化(VQ)方法。实验结果证明,该方法提高说话人识别系统的识别率。 相似文献
6.
Delta特征是反映语音信号帧间动态特征的重要特征,本文对LPC和它的Delta特征进行了具体实例求解,并对计算结果进行了分析,探讨了将它用于说话人识别系统的有效性和可行性。 相似文献
7.
8.
9.
独立分量分析方法能够将线性混合信号进行分离,得到统计独立的源信号,能用于提取组合语音的特征基函数。倒谱矢量符合ICA变换的假设条件,用ICA方法对MFCC特征进行转换得到ICA特征基,继而用于说话人识别,建立了一个基于独立分量分析的说话人识别系统。实验结果表明,在噪声环境下此系统具有更高的识别率。 相似文献
10.
11.
话者识别中目标模型的最大期望算法存在着出现奇异阵的重大缺陷,而最大似然估计虽然不会出现奇异阵,但识别率比较低。提出了一种循环最大期望修正算法,采用最大似然估计所得模型为初始模型,然后用最大期望算法中每步的模型,通过α值控制修正比例对其进行修正。实验结果表明,该修正算法较好地克服了奇异阵的出现,同时提高了识别率。 相似文献
12.
针对复杂噪声环境下识别性能显著降低的问题,提出一种用于说话人识别系统前端的双微阵列语音增强算法。该算法采用的是相干滤波和频域宽带最小方差无畸变响应波束形成器后置结合改进的维纳滤波器。其基本原理是首先求出双微麦克风阵列信号中两个相邻通道间的相干函数,再利用通道间信号的相干性来进行初始噪声抑制。其次,通过一个频域宽带最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成器保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音质量。最后,使用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和伽马通滤波器组频率倒谱系数(Gammatone Filter-bank Frequency Cepstral Coefficients,GFCC)对增强后的语音信号做特征参数提取并进行说话人识别。仿真过程采用声学人工头模拟双耳采集数据,实验结果表明,该语音增强算法在复杂噪声环境下能够获得较好的增强效果,能有效提升说话人识别系统的识别率。 相似文献
13.
14.
从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。 相似文献
15.
16.
为提高人体下肢步态相识别的准确性,研究了融合表面肌电信号(sEMG)、膝关节角度和足底压力信号的人体下肢步态相识别方法。首先, 将sEMG信号进行小波包分解提取多尺度能量和多尺度模糊熵特征;然后,对提取的sEMG信号特征值采用主成分分析(PCA)方法进行降维处理,并与足底压力特征值和膝关节能量特征值构成一组特征向量;最后,将特征向量输入粒子群优化最小二乘支持向量机(PSO-LSSVM)对人体下肢运动信息进行步态相识别。实验结果表明,所提方法相较于其他方法有较高的识别准确率和有效性。 相似文献