共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
3.
基于Fisher比的梅尔倒谱系数混合特征提取方法 总被引:1,自引:0,他引:1
针对语音识别中梅尔倒谱系数(MFCC)对中高频信号的识别精度不高,并且没有考虑各维特征参数对识别结果影响的问题,提出基于MFCC、逆梅尔倒谱系数(IMFCC)和中频梅尔倒谱系数(MidMFCC),并结合Fisher准则的特征提取方法。首先对语音信号提取MFCC、IMFCC和MidMFCC三种特征参数,分别计算三种特征参数中各维分量的Fisher比,通过Fisher比对三种特征参数进行选择,组成一种混合特征参数,提高语音中高频信息的识别精度。实验结果表明,在相同环境下,新的特征与MFCC参数相比,识别率有一定程度的提高。 相似文献
4.
《传感器与微系统》2019,(4):55-58
为了提高语音识别的鲁棒性,提出一种新的特征组合方法。方法基于F比对梅尔频率倒谱系数(MFCC)进行加权优化,同时将不同特征组合输入到语音隐马尔科夫模型(HMM)进行训练,得到具有抗噪性的最佳组合,并采用主成分分析(PCA)进行降维,增加支持向量机(SVM)分类器作为后处理器。实验表明,改进的MFCC、短时平均能量和Teager能量算子组合参数识别效果最优,识别率达到90. 48%。PCA降维后识别率降低了0. 4%,提升了计算速度。增加后处理器,系统识别率达到95. 25%,提高了系统的识别效率和分类决策力,相对于常规识别方法,准确率有所提高。 相似文献
5.
鸟声识别研究中声音特征选取对识别分类的准确度有很大影响.为了提高鸟声识别正确率,针对传统的梅尔倒谱系数(MFCC)对鸟声高频信息表征不足.提出了基于Fisher准则MFCC和翻转梅尔倒谱系数(IMFCC)的特征融合,得到新的特征参数MFCC-IMFCC应用于鸟声识别,提高对鸟声高频信息表征.同时通过遗传算法(GA)对支持向量机(SVM)中的惩罚因子C和核参数g进行优化,训练出GA-SVM分类模型.实验表明,在同一条件下,MFCC-IMFCC与MFCC相比,识别率有一定的提高. 相似文献
6.
线性预测倒谱参数(LPCC)能很好的体现人的声道特性,而梅尔倒谱参数(MFCC)能很好的模拟人耳的听觉效应。针对MFCC在不同频率段的识别精度不一致和LPCC不能准确模拟人的听觉系统问题,将MFCC参数和IMFCC参数分别作为语音不同频率段的特征参数,结合线性预测参数(LPCC),均衡滤波器的分布,完整覆盖到整个频率段范围。将梅尔倒谱参数和线性预测参数结合起来作为语音识别的特征提取参数。实验结果表明,改进之后的算法从效率上和识别率上都有不同程度的提高。 相似文献
7.
为在语言朗读训练时对跟读语音的质量自动作出客观评价并在嵌入式系统上实现,提出了一种基于特征比较的语音评分方法。通过分析输入语音,提取语音特征并与参考标准进行匹配比较,由评分机制根据相似程度大小给出评价得分。实验证明该方法的算法复杂度较低,评分结果符合人的主观感觉。 相似文献
8.
普通话单字发音准确度的计算机辅助评价方法 总被引:1,自引:0,他引:1
该文提出一种普通话单字发音准确度的计算机辅助评价方法。以RBF网络为评价系统,选用归一化BARK谱为特征,并且用标准发音聚类构成的模板特征作为其它发音的参照。最后将样本特征与模板特征的差值平方矢量作为RBF网络的输入,进行网络的训练和评价。实验表明,该方法取得了较好的效果。 相似文献
9.
音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义。提出了一种新型音高估计和发声分类方法。利用梅尔频率倒谱系数(MFCC)进行频谱重构,并在对数下对重构的频谱进行压缩和过滤。通过高斯混合模型(GMM)对音高频率和滤波频率的联合密度建模来实现音高估计,实验结果在TIMIT数据库上的相对误差为6.62%。基于高斯混合模型的模型也可以完成发声分类任务,经试验测试表明发声分类的准确率超过99%,为音高估计和发声分类提供了一种新的模型。 相似文献
10.
本文探讨和研究计算机辅助汉语教学系统中语音评价体系的组成与实现方法。采用标准普通话语音示教数据库和非特定人大词汇量标准普通话汉语语料数据库,建立标准普通话示教语句特征模板库。采用Kohonen自组织神经网络进行学习者语音信号的分类与识别,经过汉语语音教学效果评价系统的处理,获得相应的量化评价结果。初步给出了计算机辅助汉语教学系统中语音评价体系的总体框架及其实现方法。通过实验验证了本语音评价体系的设计方案是合理的、可行的。它基本上能够满足计算机辅助汉语教学系统在线评价学生语音学习效果的需要。 相似文献
11.
特征提取是说话人识别系统中最关键的一个步骤.特征提取通俗的来说是提取代表说话人个性的语音特征.直接关乎识别系统的准确率.通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点.文章采用Mel频率倒谱域参数,是因为Mel频率尺度更加贴近入耳的听觉特性.Mel频率倒谱域参数不仅具有低频段高谱分辨率的优势,而且对噪声鲁棒能力很强.文章以声道模型和听觉模型为例,对比了LPC参数和MFCC参数分布.得出了MFCC不受全极点模型限制,对环境的适应性更强,且可降低不同人说话引起的差异度的影响.其参数性能优于LPC参数. 相似文献
12.
基于语音识别技术的英语口语教学系统 总被引:1,自引:0,他引:1
许多计算机辅助英语学习的应用欠缺口语学习的评估和反馈.描述了一个采用语音识别技术的英语口语学习系统.除了通常的发音评分外,还提供基于音素关联和音素识别的错误检测功能.结合纠正知识库的改进建议和韵律修正语音,可以及时地给学习者以帮助.实验结果表明,能够纠正有一定基础学习者的多数非故意错误. 相似文献
13.
建立基于三角形的感官评估基本模型和一种机器模拟人评估行为的控制方法,根据新的知识不断修正计算机存储的感官评估参数的控制策略,通过该控制策略实现机器的自学习过程.实验结果表明,采用自学习控制能够提高计算机辅助感官评估(CASE)实验的能力. 相似文献
14.
15.
提出了一个基于语音特征和均值量化的DWT域半脆弱音频数字水印方案.该方案对语音特征进行提取得到梅勒频率倒谱系数(MFCC),对其进行turbo纠错编码,通过均值量化把该编码作为水印嵌入到载体语音中.实验分析结果表明,该方案既对音频的一般操作有较强的鲁棒性,又对篡改音频操作有很强的敏感性,同时水印提取不需要额外的水印信号,准确度高. 相似文献
16.
研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒性较强的帧进行说话人识别的方法,分析了以上方法对系统识别性能的改善作用,并通过实验验证上述方法确实可以提高系统在噪声环境下的识别率。 相似文献
17.
18.
党倩 《自动化与仪器仪表》2014,(7):8-10
随着计算机网络技术的迅猛发展,全球经济面临着深刻的变革。计算机技术的发展使得制造业发生了很大变化。为了更好地将计算机技术应用到工业上去,本文提出了一种基于服务提供商模式的解决方案,用于解决计算机辅助工业设计中网络化制造的问题。本文设计并开发的系统由四个工具集构成,每个工具都是利用可重用组件技术进行开发,动态加载到计算机辅助工业设计平台中。本文重点研究了工具集中的形态布局、色彩方案、人机设计等技术,开发出的系统可以为企业提供一些基本的计算机辅助工业设计应用服务。实验表明,该系统能够提高企业的工作效率,提高企业的设计能力,对网络化制造业具有重要意义。 相似文献
19.
从当前普通话测试的现状与需求出发,对基于ARM-Linux的语音评价系统进行了深入研究,提出了基于嵌入式技术的普通话发音质量评价方案。其中,系统硬件以S3C2410X处理器和UDA134TS为主要部分,软件则主要研究基于语音特征比较的普通话评价方法。本设计方案能有效实现普通话测试系统从PC平台到嵌入式平台的移植。 相似文献