共查询到18条相似文献,搜索用时 46 毫秒
1.
2.
3.
矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能. 相似文献
4.
为了加快粒子群优化算法的收敛速度,增强全局的搜索能力,通过对粒子群优化算法中惯性权重和全局最优值的分析,提出了一种根据迭代次数而自适应变化的惯性权重的粒子群优化方法。改进后的粒子群算法在防止陷入局部最优的能力方面有了明显的增强,同时,给出了应用粒子群优化算法训练支持向量机的方法,并将其应用于说话人识别。实验结果证实了在说话人识别中改进PSO-SVM方法比其他传统方法能获得更好的识别精度和识别速度。 相似文献
5.
对音高特征在说话人识别中的可分性问题进行了分析和实验研究,首先利用基音周期均值和方差的统计特性,绘制出话者音高特征空间分布图,从中看出音高特征在区分说话人个性方面的可行性,可在少量话者集合或初级识别中加以利用,实验表明,利用音高特征进行说话人识别具有明显的效果,在大量话者辨认时,利用它进行粗判可以有效减少后级识别范围,对提高系统响应效率有应用价值。 相似文献
6.
对音高特征在说话人识别中的可分性问题进行了分析和实验研究.首先利用基音周期均值和方差的统计特性,绘制出话者音高特征空间分布图,从中看出音高特征在区分说话人个性方面的可行性,可在少量话者集合或初级识别中加以利用.实验表明,利用音高特征进行说话人识别具有明显的效果,在大量话者辨认时,利用它进行粗判可以有效减少后级识别范围,对提高系统响应效率有应用价值. 相似文献
7.
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法,该方法适于说话人集合适中(100人以内)情况,具有训练简单、存储数据量少、响应快等特点.为提高系统的识别率和可靠性,系统采用了方差修正的VQ改进算法,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构.实验结果表明,改进后的方法对提高系统的识别率效果明显。 相似文献
8.
应用聚类有效性分析来生成可变电码本,实验数据表明,此算法能够根据每个说话人的语音特征自动生成大小合适的电码本,并且能够保持性能的条件下有效减小电码本的大小。 相似文献
9.
基于矢量量化改进算法的说话人识别 总被引:2,自引:0,他引:2
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法 ,该方法适于说话人集合适中(10 0人以内 )情况 ,具有训练简单、存储数据量少、响应快等特点 .为提高系统的识别率和可靠性 ,系统采用了方差修正的VQ改进算法 ,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构 .实验结果表明 ,改进后的方法对提高系统的识别率效果明显 相似文献
10.
说话人识别是根据人的声音来识别人身份的一种生物认证技术。文章采用VC平台利用VQ和HMM技术实现了说话人身份认证功能。并用遗传算法改进了Baum-Welch算法,通过实验验证了改进的HMM算法识别的效率有所提高。 相似文献
11.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别. 相似文献
12.
在分析各个Mel子带抗噪性能的基础上,提出了鲁棒性的说话人识别算法,经实验结果证明,在噪声环境下此算法能有效地提高说话人识别系统的识别率。 相似文献
13.
利用矢量量化的说话人识别系统的研究 总被引:2,自引:0,他引:2
王吉林 《安徽工业大学学报》2005,22(3):282-285
利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92%,实时识别率达到90%以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。 相似文献
14.
基于矢量量化方法的说话人识别技术 总被引:1,自引:0,他引:1
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。 相似文献
15.
16.
17.
18.
针对现代通信系统中压缩语音信号的特点,给出了编码域说话人识别的框架。在此框架下,研究了从GSM FR、G.729、G.723.1(6.3 k)3种语音编码器的码流中直接提取参数的方法。实验表明,在识别准确率和计算速度上,编码域说话人识别均优于传统的基于解码语音的说话人识别方法。 相似文献