首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 281 毫秒
1.
矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能.  相似文献   

2.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

3.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

4.
讨论了以单一矢量量化和基于矢量量化动态规划两种算法为基础的说话人证实方案,简明介绍了语音特征提取,叙述了矢量量化动态规划基本算法,计算机仿真结果表明,通过对每个人的个人性语音信息的分析,矢量量化动态规划算法不但能相当准确地证实一个人的身份,而且能识别出冒名顶替者;此算法在DSP(数字信号处理)上所实现的实时说话人证实系统的证实错误率已达到实际应用水准。  相似文献   

5.
基于多特征序贯判决的电话语音声纹鉴别方法研究   总被引:1,自引:0,他引:1  
提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法.文中分析了长时LPC倒谱特征和音调特征的特性;根据LPE倒谱各维分量对说话人识别贡献不同,改进了失真测度;用矢量量化方法建立每个说话人语音模型,构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统;构造一种简化的音调测度,将声道和声源特征结合,采用序贯判决策略,提高了系统的顽健性.实验表明,在60位说话人集合中,用大约10秒的话音做识别,正确率达95%以上.  相似文献   

6.
基于多特征序贯判决的电话语音声纹鉴别方法研究   总被引:2,自引:2,他引:2  
提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法 .文中分析了长时LPC倒谱特征和音调特征的特性 ;根据LPC倒谱各维分量对说话人识别贡献不同 ,改进了失真测度 ;用矢量量化方法建立每个说话人语音模型 ,构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统 ;构造一种简化的音调测度 ,将声道和声源特征结合 ,采用序贯判决策略 ,提高了系统的顽健性 .实验表明 ,在 60位说话人集合中 ,用大约 10秒的话音做识别 ,正确率达 95%以上  相似文献   

7.
矢量量化(VQ)是一种广泛应用于说话人识别系统的算法,基于对各说话人空间矢量内的相关性的研究,结合PNDM算法,利用Matlab软件对说话人识别系统进行研究。经实验结果证明,该方法有效增加了说话人间的区分性,提高说话人识别系统的识别率。  相似文献   

8.
利用矢量量化的说话人识别系统的研究   总被引:2,自引:0,他引:2  
利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92%,实时识别率达到90%以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

9.
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法,该方法适于说话人集合适中(100人以内)情况,具有训练简单、存储数据量少、响应快等特点.为提高系统的识别率和可靠性,系统采用了方差修正的VQ改进算法,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构.实验结果表明,改进后的方法对提高系统的识别率效果明显。  相似文献   

10.
一种改进的高斯混合模型算法   总被引:4,自引:0,他引:4       下载免费PDF全文
建立声学模型是说话人识别技术的重要环节,一种好的建模方法对说话人识别系统的识别率具有极其重大的影响。本文介绍了一种改进的高斯混合模型算法——将聚类算法与传统高斯混合模型结合起来的建模方法,并对此种建模方法得出的识别效果与传统的高斯混合模型进行了比较。从对比结果可以看出,基于聚类的高斯混合模型的说话人识别相对于传统的高斯混合模型在识别率上有所提高。  相似文献   

11.
介绍了话者识别技术的国内外最新研究进展情况,文章概要地介绍了所研究的题目和内容,重点讲座了近年来引起普遍关注和兴趣的新探索和新技术,其中包括VQ和Ergodic-HMM方法、与文本无关的识别方法,文本提示型识别方法、参数/距离标准模型匹配技术、校正模型的方法和话者确认中一种先进的阈值方法。虽然在话者识别方面已取得了一些进展和成果,还有许多问题有待于解答、探索,文章的最后给出了十六个话者识别方面公认的世界难题。  相似文献   

12.
在分析各个Mel子带抗噪性能的基础上,提出了鲁棒性的说话人识别算法,经实验结果证明,在噪声环境下此算法能有效地提高说话人识别系统的识别率。  相似文献   

13.
高斯混合模型(GMM)已广泛运用于文本无关的说话人识别系统中,该方法具有简单高效的特点。在使用EM算法训练GMM时,GMM模型的初始化参数必须首先确定。本文采用改进后的模糊C均值聚类(FCM)方法将特征矢量归为与混合数相等的各个类中,然后计算参数作为初始值。实验表明,此训练方法能够获得更优的模型参数且识别率有较大的提高。  相似文献   

14.
针对双矢量量化方法中语音的静态特征和动态特征的权重不满足可加性的情况,提出了一种新的说话人识别方法——基于Sugeno测度的动态不可加双矢量量化说话人识别方法。该方法在Sugeno测度空间上将说话人语音的静态特征和动态特征用Sugeno测度进行动态融合。然后,在噪声环境下研究了该方法的识别效果,找到了噪声环境下语音的静态特征和动态特征参数的较优的权重组合。实验结果表明,与双矢量量化识别方法相比,该方法可以使识别率明显提高。该方法为研究各类语音特征参数之间的关系、探寻最优的特征匹配方案提供了一种新的途径。  相似文献   

15.
为了加快粒子群优化算法的收敛速度,增强全局的搜索能力,通过对粒子群优化算法中惯性权重和全局最优值的分析,提出了一种根据迭代次数而自适应变化的惯性权重的粒子群优化方法。改进后的粒子群算法在防止陷入局部最优的能力方面有了明显的增强,同时,给出了应用粒子群优化算法训练支持向量机的方法,并将其应用于说话人识别。实验结果证实了在说话人识别中改进PSO-SVM方法比其他传统方法能获得更好的识别精度和识别速度。  相似文献   

16.
在说话人识别系统中,语音特征参选是系统的关键问题之一.本文研究了MFCC参数、小波包分析.从听觉特性出发,提出基于小波包分析代替傅立叶变换的一种新的特征参数,给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造一种新的混合特征参数,最后采用支持向量机实现说话人的分类识别.实验数据表明:有效地提高了说话人辨认系统的识别率.  相似文献   

17.
说话人识别技术(声纹识别技术)以其独特优势在信息安全领域的应用逐渐增大.本文概括叙述了说话人识别的基本概念;介绍了在模拟噪声环境下,采用新特征提取算法的基于GMM的说话人识别系统的设计原理以及实现.测试结果表明,说话人辨认识别率达到96%以上.  相似文献   

18.
针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号