期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

梁树岭王朝立梁振英杜佳明《计算机应用与软件》2010,27(12)

介绍一种新的等距离采样参数归一化方法.针对美尔倒谱系数(MFCC)和一阶、二阶美尔倒谱系数,提出了一种新的学习矢量量化(LVQ1)和改进学习矢量量化(LVQ2)结合的识别算法.仿真结果表明所提出的算法相对于只用LVQ1网络识别,可以有效改善学习效率. 相似文献

2.

一种噪声环境的语音端点检测方法

下载免费PDF全文

王帛冯新喜邱浪波《计算机工程与应用》2012,48(6):123-125

端点检测是语音识别系统的一个重要组成,尤其是在噪声环境中,其准确性对语音识别系统性能有直接影响。提出了一种基于小波子带倒谱系数（SBC）的语音信号端点检测方法,利用小波变换对频带进行尺度划分,采用小波子带倒谱能量检测语音端点。通过与MFCC的仿真对比以及大量实验分析,小波子带倒谱特征在语音端点检测中具有更好的识别性能。相似文献

3.

嵌入式语音识别系统特征参数提取研究

朱宇宋艳《计算机技术与发展》2011,21(7)

在噪声环境下能准确有效地提取语音信息是语音识别的重点难点,将其应用于嵌入式系统中,有一定的研究意义.通过比较分析传统的语音特征参数提取的方法:线性预测倒谱系数,Mel频率倒谱系数,提出了一种新的方法,采用Mel频率倒谱系数与一阶差分Mel频率倒谱系数(MFCC+ A MFCC)相结合的方法提取语音特征参数,结合双门限检测法进行端点检测和HMM模型进行模型匹配,并进行了以ARMSX2410为核心硬件与软件的系统设计.该方法较传统方法提高了系统的鲁棒性、识别的准确率和系统效率,适用于噪声环境下的语音识别. 相似文献

4.

一种基于调制谱特征的带噪语音识别方法 总被引：1，自引：0，他引：1

马昕杜利民何成林《计算机工程与应用》2005,41(20):53-55

在语音识别过程中,提取语音特征参数是重要的步骤之一。为了提高整个识别系统的性能,要求所选语音参数应具有较好的鲁棒性。文章在时频分析理论基础上,设计了一种基于语音调制谱的特征参数。这种参数利用了语音调制谱的时频集聚性并通过对语音调制谱作适当的滤波及归一化处理以削弱其对加性噪声和通道失真等干扰的敏感性。实验结果表明,该参数在提高语音识别系统的的抗噪性方面有明显的贡献。相似文献

5.

文本相关的语音锁设计

《传感器与微系统》2019,(11):72-74

设计了一种文本相关语音锁。提取语音的梅尔频谱倒谱系数(MFCC)及其一阶差分特征,利用矢量量化算法,训练说话者的语音特征模型。通过设计实验,分析了在不同的码本数量、语音样本信噪比水平、语音特征类别组合的情况下,系统的识别效果。实验结果表明:在一定的信噪比下,码本数量N=48时,识别准确率达到95%以上。移植到嵌入式平台后可正常运行,说明算法能够满足工程实用性要求。相似文献

6.

短语音噪声环境下说话人识别特征提取

高会贤马全福郑晓势《计算机应用》2010,30(10):2712-2714

为了使说话人识别系统在语音较短和存在噪声的环境下也具有较高的识别率,基于矢量量化识别算法,对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC)的提取相结合,并将改进后的特征与谱质心特征进行了组合,建立了一种美尔频率小波变换系数+谱质心(MFWTC+SC)的新的组合特征参数。经实验表明,该组合特征可以有效地提高说话人识别系统的性能。相似文献

7.

基于多核学习特征融合的语音情感识别方法

王忠民刘戈宋辉《计算机工程》2019,45(8):248-254

在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基础上,使用多核学习算法融合音频特征,并将生成的核函数应用于支持向量机进行情感分类。在2种语音情感数据集上的实验结果表明,与单一特征的分类器相比,该方法的语音情感识别准确率高达96%。相似文献

8.

基于小波变换和倒谱分析的腭裂高鼻音等级自动识别

赵利博刘奇付方玲何凌《计算机科学》2018,45(4):278-284

为实现对腭裂高鼻音等级的自动识别,通过对语音信号小波处理和特征提取方法的综合研究,提出基于小波分解系数倒谱特征的腭裂高鼻音等级自动识别算法。目前,研究人员对腭裂语音的研究多基于MFCC、Teager能量、香农能量等特征,识别正确率偏低,且计算量过大。文中对4种等级腭裂高鼻音的1789个元音\a\语音数据提取小波分解系数倒谱特征参数,使用KNN分类器对4种不同等级的高鼻音进行自动识别,将识别结果与MFCC、LPCC、基音周期、共振峰和短时能量共5种经典声学特征的识别结果作比较,同时使用SVM分类器对不同等级的腭裂高鼻音进行自动识别,并与KNN分类器进行对比。实验结果表明,基于小波分解系数倒谱特征的识别结果优于经典声学特征,且KNN分类器的识别结果优于SVM分类器。小波分解系数倒谱特征在KNN中的识别率最高达到91.67%,在SVM中达到87.60%,经典声学特征在KNN分类器中的识别率为21.69%~84.54%,在SVM中的识别率为30.61%~78.24%。相似文献

9.

一种鲁棒的基于小波变换的语音参数提取算法

吴翔唐焕华刘锦高《计算机应用研究》2008,25(10):2984-2986

提出了一种基于小波变换的新型语音参数提取算法 ,提高语音识别系统对环境噪声的鲁棒性。由于引入了多分辨率小波分析技术 ,识别既在高频提供高的频率分辨又在低频提供高的时间分辨率。这样 ,提出的改进算法在语音词汇的识别更准确的同时 ,还大大简化了计算。将该算法和传统提取 MFCC系数的算法进行了比较,实验结果表明 ,利用小波计算语音特征具有更优的性能。相似文献

10.

语音倒谱特征的研究 总被引：24，自引：1，他引：24

王让定柴佩琪《计算机工程》2003,29(13):31-33

语音倒谱特征是语音识别中最常用的特征参数，它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上，研究了LPCC和MFCC参数提取的算法原理及提取算法，提出了一级、二级差分倒谱特征参数的提取算法。识别实验验证了MFCC参数的鲁棒性优于LPCC参数。相似文献

11.

基于过程神经元的语音情感识别的建模与仿真

叶吉祥陈晋芳《计算机工程与应用》2014,50(15):187-190

为克服由传统语音情感识别模型的缺陷导致的识别正确率不高的问题,将过程神经元网络引入到语音情感识别中来。通过提取基频、振幅、音质特征参数作为语音情感特征参数,利用小波分析去噪,主成分分析（PCA）消除冗余,用过程神经元网络对生气、高兴、悲伤和惊奇四种情感进行识别。实验结果表明,与传统的识别模型相比,使用过程神经元网络具有较好的识别效果。相似文献

12.

Admissible wavelet packet features based on human inner ear frequency response for Hindi consonant recognition

Astik Biswas P.K. Sahu Mahesh Chandra 《Computers & Electrical Engineering》2014

It was observed that for non-stationary and quasi-stationary signals, wavelet transform has been found to be an effective tool for the time–frequency analysis. In the recent years wavelet transform being used for feature extraction in speech recognition applications. Here a new filter structure using admissible wavelet packet analysis is proposed for Hindi phoneme recognition. These filters have the benefit of having frequency bands spacing similar to the auditory Equivalent Rectangular Bandwidth (ERB) scale whose central frequencies are equally distributed along the frequency response of human cochlea. The phoneme recognition performance of proposed feature is compared with the standard baseline features and 24-band admissible wavelet packet-based features using a Hidden Markov Model (HMM) based classifier. Proposed feature shows better performance compared to conventional features for Hindi consonant recognition. To evaluate the robustness of proposed feature in the noisy environment NOISEX-92 database has been used. 相似文献

13.

一种新的修正Mel频率映射的应力影响下变异语音识别方法

毕继武韩纪庆《计算机科学》2002,29(12):150-153

1 引言话者在心理紧张和情绪变化时语音会发生变异,如在身体不适(如感冒)时、恐惧、愤怒、环境噪声影响下,以及生理情况受到影响(如加速度变化)时,其语音都会发生改变。发音变异可以引起各语音参数的不同变化,以致常规语音识别系统的识别率大大下降。从八十年代末开始,就有人研究顽健(ro-bust)语音识别问题,针对噪声下的研究工作已经取得了非常显著成效,但针对应力影响下变异语音识别的研究则很有限。应力影响下变异语音识别是一个难度较大的问题,因为应力影响同人的发音过程具有直接的物理关系,其所引起的发音相似文献

14.

基于复解析子波变换（CAWT）的汉语语音谱图 总被引：1，自引：0，他引：1

向建军袁晓刘静张大成《数据采集与处理》2001,16(4):494-497

复解析子波变换（CAWT）紧密地将希尔伯特变换（HT）与子波变换（WT）结合在一起,在信号分析处理方面具有良好的表现。本文将复解析子波复换应用于汉语语的谱分析中,实验结果表明,文中所构造的复子波语音谱图可以清晰地表征汉语语音的动态谱结构,谱图中的语音形态为进一步的语音识别提供了一种新的途径。相似文献

15.

Bark子带小波包自适应阈值语音去噪方法

田玉静左红伟董玉民魏德生《计算机应用》2010,30(11):3111-3114

为了克服低信噪比输入下,语音增强造成清音弱分量损失,导致信号重构失真的问题,提出了一种新的语音增强方法。该方法采用小波包拟合语音感知模型的临界带,按子带能量对语音清浊音分离,然后对清音和浊音信号分别作8层和4层小波包分解,在阈值计算上采用Bark子带小波包自适应节点阈值算法,在Bark子带实时跟踪噪声水平,有效保护清音中高频弱分量,减少失真。通过与传统语音增强方法的仿真对比实验,证实该方法在低信噪比输入时,具有明显优势,输出信噪比高,语音失真度低。将该方法与谱减法相结合,进行语音二次增强,能进一步提高增强语音质量。相似文献

16.

一种改进的MFCC参数提取方法

王彪《计算机与数字工程》2012,40(4):19-21

为了提高语音识别率,提出了一种改进的MFCC参数提取方法。该方法应用小波包变换高分辨率的特点和语音高频加权的功能,在传统MFCC参数的基础上提取了一种新特征参数。新参数能对语音信号频率进行更加精细的划分,能够更稳定地减小频谱失真,且在一定程度上降低了信号的噪声。最后采用高斯混合模型（GMM）进行说话人语音识别,实验表明新特征参数取得了较好的识别率。相似文献

17.

面向语音情感识别的语谱特征提取算法研究

唐闺臣冯月芹梁瑞宇包永强赵力《计算机工程与应用》2016,52(21):152-156

语音情感识别的精度很大程度上取决于不同情感间的特征差异性。从分析语音的时频特性入手,结合人类的听觉选择性注意机制,提出一种基于语谱特征的语音情感识别算法。算法首先模拟人耳的听觉选择性注意机制,对情感语谱信号进行时域和频域上的分割提取,从而形成语音情感显著图。然后,基于显著图,提出采用Hu不变矩特征、纹理特征和部分语谱特征作为情感识别的主要特征。最后,基于支持向量机算法对语音情感进行识别。在语音情感数据库上的识别实验显示,提出的算法具有较高的语音情感识别率和鲁棒性,尤其对于实用的烦躁情感的识别最为明显。此外,不同情感特征间的主向量分析显示,所选情感特征间的差异性大,实用性强。相似文献

18.

基于小波包与自适应维纳滤波的语音增强算法

董胡徐雨明马振中李列文任可《计算机技术与发展》2020,(1):50-53

语音增强主要用来提高受噪声污染的语音可懂度和语音质量,它的主要应用与在嘈杂环境中提高移动通信质量有关。传统的语音增强方法有谱减法、维纳滤波、小波系数法等。针对复杂噪声环境下传统语音增强算法增强后的语音质量不佳且存在音乐噪声的问题,提出了一种结合小波包变换和自适应维纳滤波的语音增强算法。分析小波包多分辨率在信号频谱划分中的作用,通过小波包对含噪信号作多尺度分解,对不同尺度的小波包系数进行自适应维纳滤波,使用滤波后的小波包系数重构进而获取增强的语音信号。仿真实验结果表明,与传统增强算法相比,该算法在低信噪比的非平稳噪声环境下不仅可以更有效地提高含噪语音的信噪比,而且能较好地保存语音的谱特征,提高了含噪语音的质量。相似文献

19.

一种新颖的语言/音乐分割与分类方法

孟永辉蒋冬梅付中华谢磊《计算机工程与科学》2009,31(4)

语音/音乐区分是音频高效编码、音频检索、自动语音识别等音频处理和分析的重要步骤。本文提出一种新颖的语音/音乐分割与分类方法,首先根据相邻帧间的均方能量差异检测音频的变化点,实现分割;然后对音频段提取低带能量方差比、倒谱能量调制、熵调制等八维特征,用人工神经网络做分类。实验结果显示,本文算法和特征具有很高的分割准确率和分类正确率。相似文献