首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
多通道子空间算法在说话人识别中的应用   总被引:2,自引:2,他引:0       下载免费PDF全文
关海欣  曾庆宁 《声学技术》2008,27(3):396-402
深入研究了基于多通道信号子空间的语音增强算法原理,对算法中各个参数对性能的影响进行了深入剖析.同时给出一种选取噪声方差的简单且有效的方法,并通过研究分析,证明多通道信号子空间算法不仅消噪明显而且对语音的损伤微小,而且相比于单通道子空间语音增强算法除了性能上的提升外,还没有导致计算量的增加。最后将多通道子空间语音增强算法用于说话人识别系统.并与其它多通道语音增强算法(延迟求和波束形成、波束形成后维纳滤波、线性约束最小方差波束形成)进行了对比.实验表明多通道信号子空间语音增强算法在多种噪声环境下均可有效的提高说话人识别系统的识别性能。  相似文献   

2.
把小波变换和维纳滤波结合起来对语音信号进行去噪和利用NN分类器对语音信号进行非线性融合和子带语音识别,并采用了一种改进的MCE(最小分类错误)算法。通过三尺度的Daubechies小波变换把输入含噪语音信号分解成不同子带,然后在各个子带分别通过维纳滤波去噪,再把各个子带的输出通过小波重构恢复信号,最后通过Mel滤波器组把小波系数转换成MFCC(美尔倒谱系数)。在使用分类器之前先进行GMM(高斯混合模型)识别,并采用改进的MCE(最小分类错误)算法,分类器融合采用了MLP结构。试验结果显示,这种系统取得了较好的抗噪效果,系统的辨识率和鲁棒性都有所提高。  相似文献   

3.
针对噪声环境下说话人识别率较低的问题,提出一种基于正规化线性预测功率谱的说话人识别特征。首先对语音信号线性预测分析和正规化处理求出语音频谱包络,然后通过伽马通滤波器组得到对数子带能量,最后对特征参数进行离散余弦变换,得到了一种说话人识别特征正规化线性预测伽马通滤波器倒谱系数(Regularized Linear Prediction Gammatone Filter Cepstral Coefficient,RLP-GFCC)。仿真结果表明,在噪声环境说话人辨认试验中,相比传统特征美尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)和伽马通滤波器倒谱系数(Gammatone Filter Cepstral Coefficient,GFCC)的系统识别率得到了明显提高,对噪声环境的鲁棒性得到了增强。  相似文献   

4.
周燕  胡志峰 《声学技术》2010,29(2):184-187
针对传统的基于RBF(Radial Bais Function)网络的说话人识别系统中聚类中心的数量和位置难以确定的问题,提出了一种基于人工免疫机制的RBF网络作为分类器的说话人识别系统。采用人工免疫机制可根据输入语音数据集合自适应地确定RBF网络隐层中心的数量和初始位置。实际测试表明,该系统具有快速学习网络权重的能力,并且网络的全局寻优能力强,识别率高,是说话人识别的一种有效可行的新方法。  相似文献   

5.
根据不同环境下不同说话人语音特征各阶差异较大的特点,对矢量量化算法进行改进,提出一种基于动态权值改进的矢量量化(VQ)方法。实验结果证明,该方法提高说话人识别系统的识别率。  相似文献   

6.
Delta特征是反映语音信号帧间动态特征的重要特征,本文对LPC和它的Delta特征进行了具体实例求解,并对计算结果进行了分析,探讨了将它用于说话人识别系统的有效性和可行性。  相似文献   

7.
武光利 《硅谷》2012,(19):179+189-179,189
说话人识别是语音识别的一个重要的分支,是当前的研究热点之一。首先介绍说话人识别的基本原理,然后介绍说话人识别常用的特征参数和分类方法,最后探讨说话人识别研究的难点。  相似文献   

8.
姚明秋  徐韩  王芳 《硅谷》2011,(21):177-178
分类在说话人识别中的应用对于提高系统响应时间有非常重要的作用,对基频和共振峰进行研究,基频可以用于区分男声和女声,依据共振峰的幅值则可以区分成人和儿童,将这种分类方法应用于说话人识别中可以大大缩短识别时间。  相似文献   

9.
邱作春  曾庆宁 《声学技术》2008,27(6):863-866
独立分量分析方法能够将线性混合信号进行分离,得到统计独立的源信号,能用于提取组合语音的特征基函数。倒谱矢量符合ICA变换的假设条件,用ICA方法对MFCC特征进行转换得到ICA特征基,继而用于说话人识别,建立了一个基于独立分量分析的说话人识别系统。实验结果表明,在噪声环境下此系统具有更高的识别率。  相似文献   

10.
提出基于确认模式的说话人识别系统,在说话人确认的两个过程中均进行了适当的改进,语音预处理中提出了新的端点检测机制,美尔频率倒谱系数(MFCC)提取中进行了倒谱滤波;在模板匹配过程中应用了基于码字转移的改进型矢量量化(VQ-LBG)算法,并应用于确认模式.实验采用将用户的声音数据置于智能(IC)卡中来进行用户确认,结果表明,该模式在大大降低数据量和存储量的同时,极大的提高了身份识别的速度和准确度.  相似文献   

11.
谢建平  成新民 《声学技术》2008,27(5):708-711
话者识别中目标模型的最大期望算法存在着出现奇异阵的重大缺陷,而最大似然估计虽然不会出现奇异阵,但识别率比较低。提出了一种循环最大期望修正算法,采用最大似然估计所得模型为初始模型,然后用最大期望算法中每步的模型,通过α值控制修正比例对其进行修正。实验结果表明,该修正算法较好地克服了奇异阵的出现,同时提高了识别率。  相似文献   

12.
毛维  曾庆宁  龙超 《声学技术》2018,37(3):253-260
针对复杂噪声环境下识别性能显著降低的问题,提出一种用于说话人识别系统前端的双微阵列语音增强算法。该算法采用的是相干滤波和频域宽带最小方差无畸变响应波束形成器后置结合改进的维纳滤波器。其基本原理是首先求出双微麦克风阵列信号中两个相邻通道间的相干函数,再利用通道间信号的相干性来进行初始噪声抑制。其次,通过一个频域宽带最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成器保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音质量。最后,使用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和伽马通滤波器组频率倒谱系数(Gammatone Filter-bank Frequency Cepstral Coefficients,GFCC)对增强后的语音信号做特征参数提取并进行说话人识别。仿真过程采用声学人工头模拟双耳采集数据,实验结果表明,该语音增强算法在复杂噪声环境下能够获得较好的增强效果,能有效提升说话人识别系统的识别率。  相似文献   

13.
在话者自动辨认系统中,话者数量是决定辨认时间的最主要因素。因而在大数量注册话者的辨认中如何减少辨认所需要的运算时间是一个关键问题。针对这一问题,提出了一种新的基于"码袋"的话者模型设计算法,它通过统计"码袋"中每个码字在话者语音中的概率分布来实现话者模型的设计。实验结果表明该算法在保证较高辨认率的同时,有效地降低了话者自动辨认系统的计算复杂度。  相似文献   

14.
从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。  相似文献   

15.
罗春梅  张风雷 《声学技术》2021,40(4):503-507
为提高神经网络在说话人识别应用中的识别性能,提出基于高斯增值矩阵特征和改进深度卷积神经网络的说话人识别算法.算法首先通过最大后验概率提取基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征的高斯均值矩阵,并对特征进行噪声适应性补偿,以增强信号的帧间关联和说话人特征信...  相似文献   

16.
为提高人体下肢步态相识别的准确性,研究了融合表面肌电信号(sEMG)、膝关节角度和足底压力信号的人体下肢步态相识别方法。首先, 将sEMG信号进行小波包分解提取多尺度能量和多尺度模糊熵特征;然后,对提取的sEMG信号特征值采用主成分分析(PCA)方法进行降维处理,并与足底压力特征值和膝关节能量特征值构成一组特征向量;最后,将特征向量输入粒子群优化最小二乘支持向量机(PSO-LSSVM)对人体下肢运动信息进行步态相识别。实验结果表明,所提方法相较于其他方法有较高的识别准确率和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号