期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

孔荣吴迪廖启鹏朱俊杰周强陶智《计算机工程与应用》2014,(15):191-193,203

针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。相似文献

2.

病态嗓音的识别与研究

下载免费PDF全文

陈承义高俊芬《计算机工程与应用》2013,49(7):123-125

通过分析嗓音的发音机理,提取正常与病态嗓音的传统声学参数：基频、共振峰、Mel倒谱系数（MFCC）,以及非线性特征参数：计盒维数与截距,作为病态嗓音识别的特征矢量集。应用高斯混合模型（GMM）对156例正常嗓音与146例病态嗓音进行建模与识别。结果表明：非线性特征参数计盒维数与截距能很好地区分正常与病态嗓音,它们与传统声学参数基频和共振峰的组合,能够取得92.60%的识别率。相似文献

3.

基于HHT变换的病态嗓音特征提取及识别研究 总被引：2，自引：1，他引：2

龚英姬胡维平《计算机工程与应用》2007,43(34):217-219

主要介绍基于HHT变换提取的瞬时能量(A)和瞬时频率(f)的标准差参数作为病态嗓音特征参数的有效性,详细描述了A-f新特征参数的提取过程,并利用DHMM模型对A-f标准差新特征参数,与语音识别中常用的MFCC系数进行识别。识别结果表明,由HHT变换提取的A-f标准差参数更适合于描述病态嗓音,更能有效区分病态嗓音和正常嗓音。相似文献

4.

一种基于临界带宽的新小波包变换算法

李杰刘贺平《计算机工程与应用》2012,48(14):5-7,89

针对传统语音短时分析技术容易出现丢失信息的现状,提出了一种基于临界带宽的小波包变换算法,该算法借鉴传统倒谱特征参数(MFCC)提取的过程并在该过程中引入临界带宽(Critical Bandwidth)的概念。在基于高斯混合模型的说话人识别系统中进行实验,结果表明在选取不同小波包函数的情况下,该算法所取得的识别率较MFCC参数均有提高。相似文献

5.

分布式语音识别参数提取的改进算法及实现

叶蕾方鹏《福建电脑》2007,(5):91-91,78

本文介绍了分布式语音识别系统,对该系统中参数提取算法做了两种改进,并用Microsoft Visual C 6.0验证这两种改进算法可以提高噪声环境下识别系统的正确识别率. 相似文献

6.

基于GMM的说话人识别系统设计与实现

刘冰滕广超林嘉宇《微处理机》2014,(3):63-65

现代通信中,说话人的身份认证技术一直是通信行业研究的重点和热点。而基于GMM和MFCC的说话人识别技术,是目前为止相对成熟和常用的方法。对说话人识别系统的构成做了相关的研究,并通过MATLAB编程,设计了一款以MFCC作为特征参数,基于GMM模型的说话人识别系统。经过实验测试,本系统能基本满足工作及家庭生活环境下的说话人识别需要。相似文献

7.

基于动态MFCC的说话人识别算法 总被引：1，自引：0，他引：1

《模式识别与人工智能》2005,18(5)

提出了一种基于动态MFCC特征的说话人识别算法.该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性.此外,本文还讨论了基于高斯混合模型的分类器设计问题,给出了一个通过聚类分析获得高斯混合模型的最优混合度与相关模型参数的初始估计的方法.实验证明,本文所提出的方法在实际中能够获得较好的识别结果. 相似文献

8.

基于小波包分析的鲁棒性语音识别

下载免费PDF全文

张君昌李艳艳《计算机工程与应用》2011,47(10):124-126

通过对MFCC算法的研究,发现其中的FFT在整个时频空间使用固定的分析窗,这不符合语音信号的特性,而小波变换具有多分辨率特性,更符合人耳的听觉特性。提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC参数的提取方法,用小波包变换代替傅里叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC,然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数。仿真实验证明：基于新特征的识别率比原来MFCC的识别率有了很大提高,特别是在低信噪比情况下。相似文献

9.

短时谱特征的汉语重音检测方法研究 总被引：1，自引：0，他引：1

赵云雪 ;张珑 ;郑世杰《计算机与生活》2014,(9):1120-1128

重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC（Mel frequency cepstrum coefficient）和RASTA-PLP（relative spectra perceptual linear prediction）算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD（annotated speech corpus of Chi-nese discourse）上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于 MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。相似文献

10.

基于连续小波和支持向量机的病态嗓音检测

颜景斌《电脑与信息技术》2008,16(3):21-23

声学分析是一种非常有前景的嗓音病理诊断方法,它采用连续小波分析方法提取嗓音特征参数.文章提出了一种基于SVM的病态嗓音分类算法,通过选择径向基函数RBF,可使分类的正确率达到97%. 相似文献

11.

基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法

胡峰松张璇《计算机应用》2012,32(9):2542-2544

为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。相似文献

12.

GMM文本无关的说话人识别系统研究 总被引：3，自引：2，他引：1

下载免费PDF全文

蒋晔唐振民《计算机工程与应用》2010,46(11):179-182

在高斯混合模型（Gaussian Mixture Model,GMM）训练时,对传统的模型参数初始化方法（随机法、K均值聚类法）进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。相似文献

13.

基于MFCC和短时能量混合的异常声音识别算法

吕霄云王宏霞《计算机应用》2010,30(3):796-798

针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数（MFCC）与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型（GMM）分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性,分类器的平均识别率可达到90%以上,并且计算复杂度小。相似文献

14.

基于高斯混合模型的语音性别识别

张超琼苗夺谦岳晓冬《计算机应用》2008,28(Z2)

利用高斯混合模型(GMM)方法进行语音的性别识别.首先概述了特征提取、识别方法及性别识别的过程;然后通过减少提取特征的语音帧数和降低高斯混合模型的混合阶数来提高性别识别速度;最后,将由Mel频率倒谱参数(MFCC)特征和基音频率特征两种方法得到的测试样本后验概率结合,提出新的计算测试样本后验概率的方法.实验表明依据此后验概率能有效提高识别的正确率. 相似文献

15.

图像小波系数的高斯混合模型研究 总被引：3，自引：0，他引：3

侯建华熊承义田金文柳健《计算机应用》2006,26(3):579-0581

图像小波系数的统计分布具有非高斯特性,可以用高斯混合模型进行描述。提出了一种随像素自适应调整的混合高斯模型,每个系数建模为两个均值为零、方差不同的正态分布之和,利用局部贝叶斯阈值对小波系数进行分类,通过当前系数邻域窗中两类系数的信息,得到大、小方差以及有关概率的模型参数估计。将此模型应用于图像去噪,根据贝叶斯后验均值估计理论设计了Wiener滤波器。通过与三种代表性去噪算法的比较实验,表明了这种基于模型的滤波算法的有效性。相似文献

16.

结合MFCC分析和仿生模式识别的语音识别研究

下载免费PDF全文

王宪保陈勇汤丽平《计算机工程与应用》2011,47(12):20-22

提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也会得到一定程度的提高。运用仿生模式识别理论中同类样本连续的观点,通过在特征空间中对训练样本进行有效的覆盖,大大提高了识别结果。相似文献

17.

基于LPCMCC的音频数据检索方法 总被引：1，自引：0，他引：1

下载免费PDF全文

江基华李应《计算机工程》2009,35(11):246-247

LPC美尔倒频谱系数（LPCMCC）根据人耳听觉特性将LPC倒谱系数（LPCC）用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数（MFCC）。相似文献

18.

小波包变换与Teager能量算子结合的说话人识别

下载免费PDF全文

祝鹏王成儒《计算机工程与应用》2013,49(9):187-189

在说话人识别系统中,语音特征参数的提取是影响系统性能的关键因素之一。在研究了MFCC参数的基础上,结合MFCC参数在信号的低频部分具有高频率分辨率以及小波包变换可以对信号的高频部分进行分解以提高高频部分的频率分辨率的优点,将二者结合,将Teager能量算子引入到信号高频部分的能量参数求解,构造了一种新的混合特征参数,采用支持向量机实现说话人的分类识别。实验结果表明,该特征参数有效提高了说话人辨识系统的识别率。相似文献