首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
针对说话人识别的GMM模型中参数估计问题,提出了改进的EM算法,利用算法通过对说话人识别系统的实验数据的计算,验证了该算法能提高说话人识别系统的识别率。  相似文献   

2.
3.
矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能.  相似文献   

4.
为了加快粒子群优化算法的收敛速度,增强全局的搜索能力,通过对粒子群优化算法中惯性权重和全局最优值的分析,提出了一种根据迭代次数而自适应变化的惯性权重的粒子群优化方法。改进后的粒子群算法在防止陷入局部最优的能力方面有了明显的增强,同时,给出了应用粒子群优化算法训练支持向量机的方法,并将其应用于说话人识别。实验结果证实了在说话人识别中改进PSO-SVM方法比其他传统方法能获得更好的识别精度和识别速度。  相似文献   

5.
对音高特征在说话人识别中的可分性问题进行了分析和实验研究,首先利用基音周期均值和方差的统计特性,绘制出话者音高特征空间分布图,从中看出音高特征在区分说话人个性方面的可行性,可在少量话者集合或初级识别中加以利用,实验表明,利用音高特征进行说话人识别具有明显的效果,在大量话者辨认时,利用它进行粗判可以有效减少后级识别范围,对提高系统响应效率有应用价值。  相似文献   

6.
对音高特征在说话人识别中的可分性问题进行了分析和实验研究.首先利用基音周期均值和方差的统计特性,绘制出话者音高特征空间分布图,从中看出音高特征在区分说话人个性方面的可行性,可在少量话者集合或初级识别中加以利用.实验表明,利用音高特征进行说话人识别具有明显的效果,在大量话者辨认时,利用它进行粗判可以有效减少后级识别范围,对提高系统响应效率有应用价值.  相似文献   

7.
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法,该方法适于说话人集合适中(100人以内)情况,具有训练简单、存储数据量少、响应快等特点.为提高系统的识别率和可靠性,系统采用了方差修正的VQ改进算法,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构.实验结果表明,改进后的方法对提高系统的识别率效果明显。  相似文献   

8.
应用聚类有效性分析来生成可变电码本,实验数据表明,此算法能够根据每个说话人的语音特征自动生成大小合适的电码本,并且能够保持性能的条件下有效减小电码本的大小。  相似文献   

9.
基于矢量量化改进算法的说话人识别   总被引:2,自引:0,他引:2  
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法 ,该方法适于说话人集合适中(10 0人以内 )情况 ,具有训练简单、存储数据量少、响应快等特点 .为提高系统的识别率和可靠性 ,系统采用了方差修正的VQ改进算法 ,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构 .实验结果表明 ,改进后的方法对提高系统的识别率效果明显  相似文献   

10.
说话人识别是根据人的声音来识别人身份的一种生物认证技术。文章采用VC平台利用VQ和HMM技术实现了说话人身份认证功能。并用遗传算法改进了Baum-Welch算法,通过实验验证了改进的HMM算法识别的效率有所提高。  相似文献   

11.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

12.
在分析各个Mel子带抗噪性能的基础上,提出了鲁棒性的说话人识别算法,经实验结果证明,在噪声环境下此算法能有效地提高说话人识别系统的识别率。  相似文献   

13.
利用矢量量化的说话人识别系统的研究   总被引:2,自引:0,他引:2  
利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92%,实时识别率达到90%以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

14.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

15.
高斯混合模型(GMM)已广泛运用于文本无关的说话人识别系统中,该方法具有简单高效的特点。在使用EM算法训练GMM时,GMM模型的初始化参数必须首先确定。本文采用改进后的模糊C均值聚类(FCM)方法将特征矢量归为与混合数相等的各个类中,然后计算参数作为初始值。实验表明,此训练方法能够获得更优的模型参数且识别率有较大的提高。  相似文献   

16.
在基于高斯混合模型(GMM)的声纹识别算法中,K-means聚类算法是GMM模型参数初始化常用的方法之一。传统K-means算法在聚类过程中采用几何距离进行分类,忽略了类中各矢量的分布不同对聚类结果的影响,常常得不到令人满意的识别结果。文中对传统K-means算法进行了改进,并将改进后的K-means算法与GMM结合应用到声纹识别系统中。实验结果表明,改进的K-means算法与传统的算法相比具有更好的识别效果。  相似文献   

17.
矢量量化(VQ)是一种广泛应用于说话人识别系统的算法,基于对各说话人空间矢量内的相关性的研究,结合PNDM算法,利用Matlab软件对说话人识别系统进行研究。经实验结果证明,该方法有效增加了说话人间的区分性,提高说话人识别系统的识别率。  相似文献   

18.
基于编码比特流的说话人识别   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现代通信系统中压缩语音信号的特点,给出了编码域说话人识别的框架。在此框架下,研究了从GSM FR、G.729、G.723.1(6.3 k)3种语音编码器的码流中直接提取参数的方法。实验表明,在识别准确率和计算速度上,编码域说话人识别均优于传统的基于解码语音的说话人识别方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号