期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陆小珊王俊法田岚《山东工业大学学报》2005,35(4):56-58,79

对音高特征在说话人识别中的可分性问题进行了分析和实验研究，首先利用基音周期均值和方差的统计特性，绘制出话者音高特征空间分布图，从中看出音高特征在区分说话人个性方面的可行性，可在少量话者集合或初级识别中加以利用，实验表明，利用音高特征进行说话人识别具有明显的效果，在大量话者辨认时，利用它进行粗判可以有效减少后级识别范围，对提高系统响应效率有应用价值。相似文献

2.

改进VQ算法在说话人识别中的应用

张庆芳赵鹤鸣《苏州大学学报(工科版)》2005,25(6):1-4

与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别，因其运算过程简单等特点，在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进，并基于改进算法进行了与文本无关的说话人识别。经实验结果证明，本文的方法改善了码本的性能，提高了说话人识别的识别率。相似文献

3.

矢量量化技术在说话人识别中的应用

崔玫姜献忠《山东电力高等专科学校学报》2006,10(4):55-56,51

矢量化(VQ)是一种及其重要的信号压缩方法,广泛应用于语音信号压缩等领域。说话人识别系统利用所建的VQ码本保存了说话人一定的声道特性,来进行说话人识别,完成这个识别系统有两个步骤:一是建立参考模型码本;二是进行模式匹配。相似文献

4.

一种鲁棒的说话人识别新特征

谢怡宁黄金杰《哈尔滨理工大学学报》2013,18(4)

说话人识别系统不可避免地会受到噪声的影响,导致性能急剧降低,针对这一问题采用感知最小方差无畸变响应(PMVDR)技术,提出了一种新的语音特征提取方法.该特征基于平移差分倒谱算法,成功地融入了说话人语音的长时信息.所提取的特征不仅在干净环境下能取得良好性能,而且在混噪语音以及信道失配等声学条件下也优于目前主流的特征.在YOHO数据库和ROSSI数据库上的实验结果表明,新特征在噪声和信道畸变的情况下能有效提高识别系统的鲁棒性. 相似文献

5.

改进PSO-SVM在说话人识别中的应用

李明张勇李军权张亚芬《电子科技大学学报(自然科学版)》2007,36(6):1345-1349

为了加快粒子群优化算法的收敛速度,增强全局的搜索能力,通过对粒子群优化算法中惯性权重和全局最优值的分析,提出了一种根据迭代次数而自适应变化的惯性权重的粒子群优化方法。改进后的粒子群算法在防止陷入局部最优的能力方面有了明显的增强,同时,给出了应用粒子群优化算法训练支持向量机的方法,并将其应用于说话人识别。实验结果证实了在说话人识别中改进PSO-SVM方法比其他传统方法能获得更好的识别精度和识别速度。相似文献

6.

改进的EM算法在说话人识别中的应用

彭培福李树有姬永刚李鹏《辽宁工学院学报》2009,(3)

针对说话人识别的GMM模型中参数估计问题,提出了改进的EM算法,利用算法通过对说话人识别系统的实验数据的计算,验证了该算法能提高说话人识别系统的识别率。相似文献

7.

MFCC和LPCC特征参数在说话人识别中的研究

李泽崔宣马雨廷陈俊宇《河南工程学院学报(自然科学版)》2010,22(2):51-55

特征提取是说话人识别系统中的一项关键技术,讨论了在说话人识别中语音特征的提取,详细介绍了求取MEL倒谱系数MFCC和线性预测倒谱系数LPCC的具体步骤和算法,并对MFCC和LPCC语音特征参数做出了理论分析和实验数据比较,通过实验论证了对于低频语音,采用MFCC参数的说话人识别在屏蔽噪音和抗噪声能力都优于采用LPCC参数的说话人识别. 相似文献

8.

二次判决的融合系统在说话人识别中的应用

宁向延景昊《武汉大学学报(工学版)》2011,44(4):534-537

用希尔伯特-黄变换(HHT)对语音信号进行处理,由此提取语音特征参数.针对单一说话人识别方法的局限性,基于VQ分类器的工作原理,以缩小类集合规模为出发点,结合信息融合理论提出了基于串联方式的二次判决融合系统.实验表明,该融合系统较独立MFCC(Mel Frequency Cepstrum Coefficient)判决系统有更好的识别效果. 相似文献

9.

基于添加小样本特征VQ算法的说话人识别

《大庆石油学院学报》2009,33(4)

相似文献

10.

基于矢量量化改进算法的说话人识别

陆小珊田岚《山东工业大学学报》2004,34(3):60-62

给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法，该方法适于说话人集合适中(100人以内)情况，具有训练简单、存储数据量少、响应快等特点．为提高系统的识别率和可靠性，系统采用了方差修正的VQ改进算法，使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构．实验结果表明，改进后的方法对提高系统的识别率效果明显。相似文献

11.

开放场景下短时语音说话人识别系统的优化设计

郭新邓爱文罗程方邓飞其《南京信息工程大学学报》2023,15(5):585-591

为适应开放场景下说话人识别短时语音的应用需要,本文对说话人识别模型进行优化,提升了模型的准确率和鲁棒性.为了实现对重要频率特征的筛选,提出基于重加权的特征增强层及网络,起到增强特征表达的作用.将人脸识别领域的误分类样本损失函数首次引入到说话人识别领域,提高对困难样本的挖掘能力.提出基于误分类样本挖掘的分类损失与基于小样本学习框架的余弦角度原型损失的组合损失函数,解决了分类损失函数与说话人识别实际评测需求不匹配和度量函数对采样策略依赖性强的问题.实验结果显示,与基准模型相比,性能指标等误率(EER)降低12.45%,最小检测代价函数(minDCF)降低14.09%,取得现有说话人识别领域的优异效果. 相似文献

12.

说话人识别算法的研究 总被引：2，自引：0，他引：2

郭春霞《西安邮电学院学报》2010,15(5):104-106,119

针对说话人识别问题,基于概率神经网络PNN,实验比较MFCC,ΔMFCC+MFCC分别与PNN相结合时的识别率。仿真结果表明,在文本有关情况下,当说话人说话内容为0～9的发音时,ΔMFCC+MFCC优于MFCC,使用PNN算法的识别率能够满足说话人识别的实际要求。相似文献

13.

说话人计算机识别系统的设计与实现

韩雁陈利华《浙江大学学报(工学版)》2001,35(2):165-169

介绍了说话人计算机识别系统的基本原理和研究现状,通过对多种可能方案的比较和选择,设计出了一个说话人识别系统,该系统用汉语的6个单韵母作为录入语音,使用了包括短时平均幅度、短时平均过零率、倒频域分析技术和线性预测分析技术等来完成语音的端点检测和语音个性化特征参数的提取,在Windows环境下用MATLAB完成了系统的开发,使系统短小精悍,并取得了较好的实测效果。相似文献

14.

基于UBM降阶算法的高效说话人识别系统

单振宇杨莹春《浙江大学学报(工学版)》2009,43(6):978-982

为了提高基于高斯混合模型-通用背景模型（GMM UBM）说话人识别系统的运算速度,提出了通用背景模型（UBM）降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了459%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM UBM系统的运行效率. 相似文献

15.

一种基于模型距离的改进的说话人识别技术 总被引：1，自引：0，他引：1

孙林慧杨震《西安邮电学院学报》2005,10(2):118-121

提出了一种测量高斯混合模型距离的方法。基于此方法提出一种改进的说话人识别系统:首先从语音中提取几种参数;再分别训练高斯混合模型;然后选择使说话人辨认系统模型平均距离较大的那种特征参数的高斯混合模型,作为该说话人的训练模型;最后在识别时提取此种特征参数进行识别。本文仿真了两种不同模型平均距离的特征参数的正确识别率。实验结果表明:对说话人辨认系统来说,采用使模型平均距离较大的特征参数,所对应的识别性能较好。相似文献

16.

基于小波变换说话人识别技术的研究 总被引：7，自引：0，他引：7

赵铮侯伯亨《西安电子科技大学学报(自然科学版)》2000,27(4):437-442

提出了基于小波变换理论的说话人识别算法———小波基包法 .利用小波变换多分辨的特性 ,提取出真正地反映基音周期变化的基频包络 ,从声学语音学的角度去认识方言和口音 ,首次提出了汉语口音的参量表征 ,并应用到说话人识别当中 ,以实现从听觉的角度出发 ,进行说话人的先天特性与后天特性相结合的说话人识别 .结果表明 ,从基频包络中可以表现口音的一些表征 ,有助于认识说话人的特性 . 相似文献

17.

基于关联度修正欧氏距离的说话人识别技术 总被引：1，自引：0，他引：1

王宝树《西安电子科技大学学报(自然科学版)》1994,21(1):14-19

从语音的生理基础和大量试验结果出发，作者选择从发元音［ａ：］、［ｅ：］、［ｕ：］的语音信号中，提取线性预测系数ＬＰＣ和倒谱系数ＩＳＣ作为人的特征；文中在给出定帧数特征提取和利用“核心”方法对参考模板进行训练的基础上，提出了一种基于关联度修正欧氏距离和新的模式匹配算法。在微型计算机（３８６）上实现了用于５０人的说话人识别系统。识别率可达到９８％，识别时间不大于３ｓ。相似文献