期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于多特征序贯判决的电话语音声纹鉴别方法研究 总被引：1，自引：0，他引：1

田岚白树忠郑丽娜《山东工业大学学报》2003,33(6):648-651

提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法．文中分析了长时LPC倒谱特征和音调特征的特性；根据LPE倒谱各维分量对说话人识别贡献不同，改进了失真测度；用矢量量化方法建立每个说话人语音模型，构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统；构造一种简化的音调测度，将声道和声源特征结合，采用序贯判决策略，提高了系统的顽健性．实验表明，在60位说话人集合中，用大约10秒的话音做识别，正确率达95％以上．相似文献

2.

二次判决的融合系统在说话人识别中的应用

宁向延景昊《武汉大学学报(工学版)》2011,44(4):534-537

用希尔伯特-黄变换(HHT)对语音信号进行处理,由此提取语音特征参数.针对单一说话人识别方法的局限性,基于VQ分类器的工作原理,以缩小类集合规模为出发点,结合信息融合理论提出了基于串联方式的二次判决融合系统.实验表明,该融合系统较独立MFCC(Mel Frequency Cepstrum Coefficient)判决系统有更好的识别效果. 相似文献

3.

MFCC和LPCC特征参数在说话人识别中的研究

李泽崔宣马雨廷陈俊宇《河南工程学院学报(自然科学版)》2010,22(2):51-55

特征提取是说话人识别系统中的一项关键技术,讨论了在说话人识别中语音特征的提取,详细介绍了求取MEL倒谱系数MFCC和线性预测倒谱系数LPCC的具体步骤和算法,并对MFCC和LPCC语音特征参数做出了理论分析和实验数据比较,通过实验论证了对于低频语音,采用MFCC参数的说话人识别在屏蔽噪音和抗噪声能力都优于采用LPCC参数的说话人识别. 相似文献

4.

基于小波包分析和支持向量机的说话人识别

王志兰《佳木斯工学院学报》2010,(6):873-875,890

在说话人识别系统中,语音特征参选是系统的关键问题之一.本文研究了MFCC参数、小波包分析.从听觉特性出发,提出基于小波包分析代替傅立叶变换的一种新的特征参数,给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造一种新的混合特征参数,最后采用支持向量机实现说话人的分类识别.实验数据表明：有效地提高了说话人辨认系统的识别率. 相似文献

5.

说话人识别算法的研究 总被引：2，自引：0，他引：2

郭春霞《西安邮电学院学报》2010,15(5):104-106,119

针对说话人识别问题,基于概率神经网络PNN,实验比较MFCC,ΔMFCC+MFCC分别与PNN相结合时的识别率。仿真结果表明,在文本有关情况下,当说话人说话内容为0～9的发音时,ΔMFCC+MFCC优于MFCC,使用PNN算法的识别率能够满足说话人识别的实际要求。相似文献

6.

基于多特征序贯判决的电话语音声纹鉴别方法研究 总被引：2，自引：2，他引：2

田岚白树忠郑丽娜《山东大学学报(工学版)》2003,33(6):648-651

提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法 .文中分析了长时LPC倒谱特征和音调特征的特性 ;根据LPC倒谱各维分量对说话人识别贡献不同 ,改进了失真测度 ;用矢量量化方法建立每个说话人语音模型 ,构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统 ;构造一种简化的音调测度 ,将声道和声源特征结合 ,采用序贯判决策略 ,提高了系统的顽健性 .实验表明 ,在 60位说话人集合中 ,用大约 10秒的话音做识别 ,正确率达 95%以上相似文献

7.

基于修正MFCC的耳语说话人识别方法

丁国梁《苏州大学学报(工科版)》2009,29(4)

在说话人识别中,美尔倒谱系数MFCC(Mel-Frequency Cepstral Coefficients)是一种常用的特征.但是这种通用的特征在耳语音的说话人识别上并不太理想.MFCC的三角滤波器组在Mel尺度上是均匀分布的,但是耳语音不同于正常音的发声,通过改变这种均匀分布的格局来改善耳语音说话人识别率,将全频域分成不同频段,分别调整各频段内滤波器的疏密程度,再将各频段的滤波器组合成新的滤波器组.修正后的滤波器模型在文本无关的耳语音说话人识别中相比原模型识别效果有所提高. 相似文献

8.

一种小波包变换的声纹参数提取方法研究 总被引：1，自引：0，他引：1

《沈阳理工大学学报》2015,(6)

在声纹识别系统中,对声纹参数的提取很重要。传统的MFCC参数忽略了语音信号的动态特性,因此提出了一种基于小波包变换的声纹参数提取方法。为了更突出说话人的声纹特征,克服说话内容不同对提取声纹参数的影响,在分帧阶段采用帧长为2560点,增长有效语音段。再结合基于矢量量化(VQ)系统进行说话人识别实验,并通过比较常用的db3、db4、db6、coif3小波函数选取最优基。实验证明,相对于常用的256点帧长,帧长为2560点的识别率较高且提高了运算速率。coif3小波函数为声纹参数提取的最优基。新的WPT参数的识别率优于传统的MFCC参数。相似文献

9.

改进的跨语种说话人确认方法的研究

《延边大学学报(自然科学版)》2017,(2):184-188

提出了一种基于改进的语音融合特征和GMM模型相结合的跨语种说话人确认方法.首先,采用Teager能量算子提取语音中的浊音段,消除与说话人声道特征无关的静音段和清音段.其次,提取基音周期参数,并与16维的MFCC参数融合形成本文的语音融合特征.最后,将本文方法与文献[9]的方法分别进行了单语种和跨语种的说话人确认对比实验,实验结果表明本文方法识别准确率和平均判别时间均优于文献[9]的方法,证明本文提出的方法有效,可用于跨语种的说话人确认应用领域. 相似文献

10.

采用谱包络与超音段韵律调整的高自然度语音转换

丁耀娥俞一彪《苏州大学学报(工科版)》2009,29(4)

汉语语音转换技术的目的是在保持语义信息不变的前提下将汉语语音中源说话人的语音特征转换为目标说话人的语音特征.提出的适用于汉语说话人高自然度语音转换算法主要分为三个部分:前两部分用VQ模型实现了语音的谱包络及其激励的转换,第三部分采用BP算法实现语音的韵律转换规则建模.算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音转换并得到高自然度合成语音.实验表明本文提出的转换方法是一种有效的汉语语音转换算法. 相似文献

11.

噪声背景下语音识别特征参数选择研究

刘顺兰窦园园应娜《杭州电子科技大学学报》2011,(4):73-76

为提高语音识别系统的实用性与实时性,该文采用缺失特征分量的方法研究了美尔频率倒谱系数静态特征及其一阶差分各分量对识别率的影响.在不同信噪比情况下,分别对含白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声的语音进行了实验研究,结果表明:在保证系统有较高识别率的情况下,在低信噪比时,含白噪声的语音信号缺失美尔频率倒谱系数... 相似文献

12.

基于矢量量化方法的说话人识别技术 总被引：1，自引：0，他引：1

张一清李轶《杭州电子科技大学学报》2005,25(4):58-61

说话人识别是一项通过语音来识别说话人身份的技术，它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合，基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适，该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时，该系统具备拒绝识别集外人的功能。相似文献

13.

MFCC特征加权应力影响下的变异语音识别

张磊韩纪庆王承发《哈尔滨工业大学学报》2002,34(6):743-747

为了提高语音识别系统的顽健性，在对应力影响下语音数据分析的基础上，提出一种新的基于MF－CC系数加权的变异语音识别方法。它首先通过正常语音和应力影响下变异语音的差异求得一个变异影响因子，然后对该因子的倒数进行规正作为MFCC特征不同维的权值，从而减弱受变异影响较大的特征对识别性能的影响。对航空模拟飞行器中采集的特定话者小词表孤立词的实验表明，与传统的多重风格训练方法相比，该方法的识别率提高了10.9%；将其和倒谱平均减方法相结合，可进一步将识别率提高5.4%。相似文献

14.

PAD三维情感空间中的语音情感识别 总被引：1，自引：0，他引：1

陈逸灵程艳芬陈先桥王红霞李超《哈尔滨工业大学学报》2018,50(11):160-166

离散情感描述模型将人类情感标注为离散的形容词标签,该类模型只能表示有限种类的、单一明确的情感类型,而维度情感模型从情感的多个维度量化了复杂情感的隐含状态.另外,常用的语音情感特征梅尔频率倒谱系数(MFCC)存在因分帧处理引起相邻帧谱特征之间相关性被忽略问题,容易丢失很多有用信息.为此本文提出改进方法,从语谱图中提取时间点火序列特征、点火位置信息特征对MFCC进行补充,将这三种特征分别用于语音情感识别,根据识别结果从PAD维度情感模型的三个维度(Pleasure-displeasure愉悦度、Arousal-nonarousal激活度、Dominance-submissiveness优势度)进行相关性分析得到特征的权重系数,加权融合后获得情感语音的最终PAD值,将其映射至PAD三维情感空间中.实验表明,增加的时间点火序列、点火位置信息不但能探测说话人的情感状态,同时考虑了相邻频谱间的互相关信息,与MFCC特征形成互补,在提升基本情感类型离散识别效果的基础上,将识别结果表示为PAD三维情感空间中的坐标点,采用量化的方法揭示情感空间中各种情感的定位与联系,展示出情感语音中糅杂的情感内容,为后续复杂的语音情感分类识别奠定研究基础. 相似文献

15.

相关向量机及在说话人识别应用中的研究 总被引：2，自引：0，他引：2

杨成福章毅《电子科技大学学报(自然科学版)》2010,39(2):311

对基于相关向量机和高斯混合模型的说话人识别算法的模型和特征空间进行了一系列的研究。与一些基于语音帧的说话人识别算法相比,该算法将GMM算法作为底层的语音特征提取,从而实现对语音整体上的处理,对常用的两种语音特征美尔频率倒频系数和瞬时频率的表现进行了对比研究;同时,该算法充分利用了相关向量机的所提供的高泛化性、核函数功能和结果的高稀疏性。基于Chains和AHUMADA两个专门用于说话人识别的语音库的仿真表明,该算法在减少相对误差和减少计算量方面有较大的优势。相似文献

16.

基于SVM—GMM混合模型说话人辨认的研究

崔宣孙华《黑龙江工程学院学报》2009,23(4):54-57

建立一种新的混合模型-SVM-GMM模型,用以提高说话人辨认的识别率。阐述高斯混合模型（GMM）和支持向量机（SVM）建立的基本原理,分别指出高斯混合模型和支持向量机在实际应用中的不足之处,并针对两种模型的特点,提出将GMM模型的输出机制引入到SVM模型中,以便于调整支持向量（SVM）模型的概率输出,并建立SVM-GMM混合模型。通过实验对比,验证使用SVM-GMM模型能有效地提高系统识别率。相似文献

17.

与文本无关的声纹识别系统的研究

霍春宝张彩娟赵红敏《辽宁工学院学报》2013,(1):12-14

声纹识别按识别的方式分为与文本相关和与文本无关两类。针对声纹识别技术中与文本无关的声纹识别问题进行研究。为提高系统的识别率,提出并实现了多特征参数组合的识别算法。该算法以LPCC,MFCC组合作为特征参数并将其应用到声纹识别系统中,实验结果表明组合特征参数由于充分利用了语音信号的相关特性和人耳听觉感知特性,比单独使用一种参数具有更好的识别效果。相似文献