期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

融合LPC与MFCC的特征参数 总被引：1，自引：1，他引：1

张学锋王芳夏萍《计算机工程》2011,37(4):216-217

在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数：线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。相似文献

2.

基于MFCC和BP神经网络的说话人识别研究

缴春芳尹业安梁玉营《网友世界》2013,(4):37-37

介绍了语音的美尔倒谱特征及提取算法,并提取语音段的美尔倒谱特征,建立BP神经网络,用Matlab进行仿真识别,表明能较好的实现连续语音的说话人识别。相似文献

3.

一种对混合说话人特征提取的新方法

毛鹏杨鼎才《计算机系统应用》2009,18(5):93-95

本文在使用基音周期和美尔倒谱系数(MFCC)计算特征参数的基础上利用主成分分析(PCA)和线性判别分析(LDA)相结合的方法,构造了一种新的混合特征参数。这种新的参数结合了基音周期和MFCC 各自的特点,利用他们在说话人个人信息上的互补性,然后利用PCA 和LDA 相结合的方法提取特征,作为新的说话人特征。实验证明该方法具有更好地表征说话人特征的能力,能更好地识别说话人。相似文献

4.

基于MFCC和加权矢量量化的说话人识别系统 总被引：14，自引：4，他引：14

邵央刘丙哲李宗葛《计算机工程与应用》2002,38(5):127-128

文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结果,系统训练和识别计算量和存储量都比较低。相似文献

5.

基于动态MFCC的说话人识别算法 总被引：1，自引：0，他引：1

《模式识别与人工智能》2005,18(5)

提出了一种基于动态MFCC特征的说话人识别算法.该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性.此外,本文还讨论了基于高斯混合模型的分类器设计问题,给出了一个通过聚类分析获得高斯混合模型的最优混合度与相关模型参数的初始估计的方法.实验证明,本文所提出的方法在实际中能够获得较好的识别结果. 相似文献

6.

改进加权线性预测倒谱的复合参数说话人识别

杨顺辽林峰刘焕升陈玉炎《计算机应用与软件》2011,28(2)

说话人识别和确认是信号处理中研究的热点之一,但有关文献表明识别效率并不是很高,而且训练和识别的语音要求都比较长,距离实际应用还有一定差距.分析了说话人识别中有关参数的选取对识别结果的影响,采用线性预测倒谱和基音参数共同作为识别参数,并采用矢量量化,改进了线性预测倒谱距离的加权函数,提供了与文本无关的说话人识别系统.最后给出了实验结果和有关分析,在低噪声时识别正确率可达99%以上,在高噪声时也能达到98%以上的正确率. 相似文献

7.

实时说话人辨识系统中改进的DTW算法

下载免费PDF全文

李邵梅刘力雄陈鸿昶《计算机工程》2008,34(4):218-219

识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明显。实验表明,在不影响系统识别率的情况下,该方法使系统的运行速度平均提高了1.5倍。相似文献

8.

基于MFCC和LPCC的说话人识别 总被引：8，自引：0，他引：8

余建潮张瑞林《计算机工程与设计》2009,30(5)

MFCC参数和LPCC参数是说话人识别中两种最常用的特征参数,研究了MFCC和LPCC参数提取的算法原理及差分倒谱参数的提取方法,采用MFCC、LPCC及其一阶、二阶差分作为特征参数,通过k均值算法与三层BP神经网络来进行说话人识别.实验结果表明,该方法可以有效提高识别率,同时也验证MFCC参数的鲁棒性优于LPCC参数. 相似文献

9.

采用遗传算法的文本无关说话人识别 总被引：1，自引：0，他引：1

陈良柱王健《计算机辅助工程》2008,17(3):69-71

为解决在说话人识别方法的矢量量化(Vector Quantization,VQ)系统中,K-均值法的码本设计很容易陷入局部最优,而且初始码本的选取对最佳码本设计影响很大的问题,将遗传算法(Genetic Algorithm,GA)与基于非参数模型的VQ相结合,得到1种VQ码本设计的GA-K算法.该算法利用GA的全局优化能力得到最优的VQ码本,避免LBG算法极易收敛于局部最优点的问题;通过GA自身参数,结合K-均值法收敛速度快的优点,搜索出训练矢量空间中全局最优的码本.实验结果表明,GA-K算法优于LBG算法,可以很好地协调收敛性和识别率之间的关系. 相似文献

10.

基于信息融合的短语音说话人识别方法研究

下载免费PDF全文

周萍唐李珍《计算机工程》2011,37(2):169-171

针对短训练语音的说话人识别系统,提出一种基于决策层融合的识别算法。识别时运用经验模式分解法对语音信号进行处理,对获取的固有模态函数分量提取语音特征序列,分别进行匹配,通过决策层融合算法,将所得的匹配结果与传统独立识别结果相结合,最终输出识别结果。利用信号分解的方法,实现待测语音信号的重复识别,同时采用决策层融合算法优化识别结果,从而在短训练语音情况下,使系统的识别率得到保障。实验结果表明,该算法在短训练语音识别系统中的识别效果优于传统方法。相似文献

11.

说话人识别中基于Fisher比的特征组合方法

谢小娟曾以成熊冰峰《计算机应用》2016,36(5):1421-1425

为了提高说话人识别的准确率,可以同时采用多个特征参数,针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的梅尔频率倒谱系数(MFCC)、线性预测梅尔倒谱系数(LPMFCC)、Teager能量算子倒谱参数(TEOCC)相混合的特征参数提取方法。首先,提取语音信号的MFCC、LPMFCC和TEOCC三种参数;然后,计算MFCC和LPMFCC参数中各维分量的Fisher比,分别选出六个Fisher比高的分量与TEOCC参数组合成混合特征参数;最后,采用TIMIT语音库和NOISEX-92噪声库进行说话人识别实验。仿真实验表明,所提方法与MFCC、LPMFCC、MFCC+LPMFCC、基于Fisher比的梅尔倒谱系数混合特征提取方法以及基于主成分分析(PCA)的特征抽取方法相比,在采用高斯混合模型(GMM)和BP神经网络的平均识别率在纯净语音环境下分别提高了21.65个百分点、18.39个百分点、15.61个百分点、15.01个百分点与22.70个百分点;在30 dB噪声环境下,则分别提升了15.15个百分点、10.81个百分点、8.69个百分点、7.64个百分点与17.76个百分点。实验结果表明,该混合特征参数能够有效提高说话人识别率,且具有更好的鲁棒性。相似文献

12.

FPGA和NiosII软核的语音识别系统的研究 总被引：1，自引：0，他引：1

下载免费PDF全文

巢一波张曦煌《计算机工程与应用》2010,46(2):60-62

嵌入式语音识别的应用还是比较少,主要还是通过DSP实现,而且准确率还不是太高。提出一种基于FPGA和NiosII软核处理器的嵌入式语音识别系统的设计方案。系统以EP2C35 Cyclone II芯片和NiosII处理器为基础,采用软硬件结合的设计方式,共同完成语音识别的设计。系统结合改进的端点检测方法,提取线性预测倒谱系数（LPCC）的音频信号特征,采用IP核硬件实现动态时间规整（DTW）的识别算法,能达到较高的识别准确率。相似文献

13.

GMM文本无关的说话人识别系统研究 总被引：1，自引：2，他引：1

下载免费PDF全文

蒋晔唐振民《计算机工程与应用》2010,46(11):179-182

在高斯混合模型（Gaussian Mixture Model,GMM）训练时,对传统的模型参数初始化方法（随机法、K均值聚类法）进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。相似文献

14.

结合MFCC分析和仿生模式识别的语音识别研究

下载免费PDF全文

王宪保陈勇汤丽平《计算机工程与应用》2011,47(12):20-22

提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也会得到一定程度的提高。运用仿生模式识别理论中同类样本连续的观点,通过在特征空间中对训练样本进行有效的覆盖,大大提高了识别结果。相似文献

15.

基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法

胡峰松张璇《计算机应用》2012,32(9):2542-2544

为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。相似文献

16.

多类型语音特征进化选择算法

下载免费PDF全文

张小恒谢文宾李勇明《计算机工程与应用》2016,52(14):150-155

基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法（FSF-WrGAF）,该算法提取了四种类型的语音特征参数,通过链式智能体遗传算法和GMM-UBM进行封装式动态特征选择,获取高精度的识别准确率。采用了多种指标完成该算法的性能测试。实验结果表明,该算法具体实现过程简便,改进效果明显,较同类算法在多项指标（识别率,EER,DET曲线）上都有显著提高。相似文献

17.

基于LPCMCC的音频数据检索方法 总被引：1，自引：0，他引：1

下载免费PDF全文

江基华李应《计算机工程》2009,35(11):246-247

LPC美尔倒频谱系数（LPCMCC）根据人耳听觉特性将LPC倒谱系数（LPCC）用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数（MFCC）。相似文献