首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
2.
为了得到较好的语音识别效果,构建了基于线性核函数支持向量机的非特定人孤立词语音识别系统,取得了较高的识别率,并将该实验结果同基于HMM的识别结果进行了比较,显示出了支持向量机在基于有限样本情况下进行语音识别的优势。  相似文献   

3.
提出一种基于改进多核学习的语音情感识别算法.算法以高斯径向基核函数为基准,通过采样不同的样本,采用不同的评价标准并获得不同的参数,来提高分类性能.此外,通过引入多核技术,将得到的高斯核函数构建多核学习的基核,并通过利用松弛因子构建的软间隔多核学习的目标函数改善了学习效率.对比仿真实验结果表明,本文提出的基于多核学习语音情感识别算法有效提高了语音情感识别性能.  相似文献   

4.
基于PCA和SVM的普通话语音情感识别   总被引:1,自引:0,他引:1  
蒋海华  胡斌 《计算机科学》2015,42(11):270-273
在语音情感识别中,情感特征的选取与抽取是重要环节。目前,还没有非常有效的语音情感特征被提出。因此,在包含6种情感的普通话情感语料库中,根据普通话不同于西方语种的特点,选取了一些有效的情感特征,包含Mel频率倒谱系数、基频、短时能量、短时平均过零率和第一共振峰等,进行提取并计算得到不同的统计量;接着采用主成分分析(PCA)进行抽取;最后利用基于支持向量机(SVM)的语音情感识别系统进行分类。实验结果表明, 与其他一些重要的研究结果相比,该方法得到了较高的平均情感识别率, 且情感特征的选取、抽取及建模是合理、有效的。  相似文献   

5.
大词表连续语音识别系统由多个组件构成,识别错误受多种因素的影响。系统开发者需要分析错误发生的不同原因。根据语音识别的基本理论给出了对错误进行分类分析的原理,将识别错误按错误原因分为解码错误、声学模型错误、语言模型错误、声学和语言复合错误四大类,并对分类后的错误做了统计分析。实验证明,识别错误的分类分析为系统的改进提供了参考依据。  相似文献   

6.
为有效提高语音情感识别系统的识别率,研究分析了一种改进型的支持向量机(SVM)算法。该算法首先利用遗传算法对SVM参数惩罚因子和核函数中参数进行优化,然后用优化后的参数进行语音情感的建模与识别。在柏林数据集上进行7种和常用5种情感识别实验,取得了91.03%和96.59%的识别率,在汉语情感数据集上,取得了97.67%的识别率。实验结果表明该算法能够有效识别语音情感。  相似文献   

7.
针对预先给定参数求解共同向量所存在的不足,提出了一种基于共同向量的非常态语音说话人识别算法,首先,通过系统识别率自适应调整求解共同向量的参数;然后,将系统识别率最高的参数视为最优参数,为测试语音提取共同向量,并用SVM分类器进行非常态语音说话人分类。实验结果表明:该算法所提取的共同向量,对轻微感冒语音说话人识别率为85.4%,比对特征不进行处理的GMM算法、SVM和结合共同向量的GMM算法的识别率分别提高了16.9%、15.2%和3.2%。  相似文献   

8.
严斌峰  朱小燕  张智江  张范 《软件学报》2006,17(12):2547-2553
提出了一种基于支持向量机的联合多种置信特征进行语音识别确认的判定方法.从待确认语音中提取出分段的后验概率和线性预测编码识别结果置信特征,其中后验概率根据垃圾模型近似计算得到;设计支持向量机分类器联合多种置信特征给出最终确认结果.实验结果表明,所提出的置信特征和支持向量机分类器取得了很好的确认效果.  相似文献   

9.
赵炯  樊养余 《计算机应用研究》2010,27(12):4775-4777
为减少Pseudo-Zernike矩的计算复杂度,将系数迭代算法与核函数的对称性相结合,提出了一种新的混合快速算法。与现有的两种快速算法相比较,新算法有更快的计算速度。将其应用到遥感飞机图像库识别中,首先提取图像的Pseudo-Zernike矩特征,然后将其作为支持向量机分类器的输入。理论分析和实验证明,新算法在保持识别准确率的情况下提高了识别速度。  相似文献   

10.
针对语音情感识别中的特征提取的问题,提出了一种新的特征提取方式,利用深度神经网络(DNN)中的深度信念网络(DBNs)自动提取语音信号中情感特征.通过训练一个5层的深度信念网络提取语音情感特征,把连续多帧的语音并在一起,构成一个高维的特征,把深度信念网络训练完的特征作为非线性支持向量机(SVM)分类器的输入端,最终建立一个语音情感识别多分类器系统.其识别率为86.5%比传统的基于提取句子的时间构造、振幅构造、基频构造等特征的方法提高7%.  相似文献   

11.
赵博  檀晓红 《计算机应用》2009,29(3):761-763
许多许多计算机辅助英语学习的应用,都忽略了口语的教学,或者缺乏对口语学习结果良好的评估和反馈。对于这一问题,语音识别技术可以从待评价语音与参考模型以及参考语音的相似程度给以评价,作为矫正的依据。该文描述了一个采用语音识别技术的英语口语学习系统。除了通常的发音评分外,提供的矫正还包括基于音素关联和音素识别的错误检测及韵律修正。依据错误类型查询纠正知识库的改进建议,可以及时的给学习者以帮助。实验结果表明,能够纠正有一定基础学习者非故意的多数错误。  相似文献   

12.
13.
《Ergonomics》2012,55(11):1943-1957
Abstract

Errors, whether created by the user, the recognizer, or inadequate systems design, are an important consideration in the more widespread and successful use of automatic speech recognition (ASR). An experiment is described in which recognition errors are studied under different types of feedback. Subjects entered data verbally to a microcomputer according to four experimental conditions: namely, orthogonal combinations of spoken and visual feedback presented concurrently or terminally after six items. Although no significant differences in terms of error rates or speed of data entry were shown across the conditions, analysis of the time penalty for error correction indicated that as a general rule, there is a small timing advantage for terminal feedback, when the error rate is low. It was found that subjects do not monitor visual feedback with the same degree of accuracy as spoken, as a larger number of incorrect data entry strings was being confirmed as correct. Further evidence for the use of ‘second best’ recognition data is given, since correct recognition on re-entry could be increased from 83·0% to 92·4% when the first choice recognition was deleted from the second attempt. Finally, the implications for error correction protocols in system design are discussed.  相似文献   

14.
基于序贯三支决策的图像识别方法仅考虑测试样本与支持向量机(SVM)分离超平面的符号距离,忽略了已有粒度层的信息,图像识别性能有待提高。提出一种新的置信度评价(dual confidence score and ensembling, DCE),将符号距离结合测试样本与特征空间中每一类训练样本中心的距离作为基本置信度,用于序贯三支决策时,将较粗粒度层无法识别图像的置信度与当前粒度层的置信度合并进行评价,有效地利用已有信息,提高识别准确度,在粒度层较粗时也能进行决策,提升了识别效率。在Caltech-101和Caltech-256数据集上使用两个经典预训练模型进行验证,与现有三支决策图像识别方法相比,实验结果表明该方法能有效提升识别的准确度和效率。  相似文献   

15.
说话是人类正常生活中最重要的技能之一,是发音相关肌肉在神经中枢的控制下协调运动的 结果。表面肌电图法(Surface Electromyography,sEMG)是目前采集肌肉电信号的常用方法,能检测到 可靠的肌肉电生理信息。用肌电信号进行语音分类时,所选的电极位置对分类精度有重大作用。但目 前基于 sEMG 的语音识别方法选取电极位置及数量时没有一个客观的指标,也不清楚发音相关的面、 颈部左右两侧对称位置电极对肌电语音识别的贡献是否冗余。该文使用 120 通道电极(关于面中、颈 中对称)采集了 8 名发音正常的受试者分别发 5 个中文单词和 5 个英文单词时的面、颈部 sEMG,考察 了面、颈部左右两侧对称位置 sEMG 对语音识别的贡献。结果表明,发音过程中面、颈部左右两侧肌 肉活动有相似的变化规律,但整个活动过程中面部对称位置的相关性比颈部低;使用颈部左侧、右侧 的肌电信号进行语音分类的分类精度区别不大,而使用面部左、右两侧肌电信号的分类结果差异较明 显。因此,颈部对称位置的 sEMG 信号对语音识别贡献程度具有一致性,而面部则不具有,这为后续 研究减少电极数量和选择最佳通道提供了新思路。  相似文献   

16.
为提高语音情感识别精度,对基本声学特征构建的多维特征集合,采用二次特征选择方法综合考虑特征参数与情感类别之间的内在特性,从而建立优化的、具有有效情感可分性的特征子集;在语音情感识别阶段,设计二叉树结构的多分类器以综合考虑系统整体性能与复杂度,采用核融合方法改进SVM模型,使用多核SVM识别混淆度最大的情感。算法在Berlin情感语音库五种情感状态的样本上进行验证,实验结果表明二次特征选择与核融合相结合的方法在有效提高情感识别精度的同时,对噪声具有一定的鲁棒性。  相似文献   

17.
基于LSSVM的静态手势识别   总被引:2,自引:0,他引:2  
段洪伟  陈一民  林锋 《计算机工程与设计》2004,25(12):2352-2353,2368
支持向量机(Support Vector Machine,简称SVM),是基于统计学习理论的一种新的模式识别方法,较好地解决了小样本学习问题。通过使非线性空间变换为线性空间,降低了算法的复杂性。LSSVM(Least Squares Support Vector Machine)由于使用线性等式代替了标准的SVM算法中的线性不等式,进一步降低了运算量。利用傅立叶描述子获取静态手势特征向量,通过LSSVM大尺度算法求解方程组来得到LSSVM分类器,进行静态手势识别,取得了较高的识别率。说明如何把静态手势识别结果应用到机器人远程控制中,提高人机交互的友好性。  相似文献   

18.
针对Baum—Welch算法依赖于初始值的选取而容易陷入局部最优解的问题,基于全局优化的思想,提出了一种改进的HMM语音识别算法。该算法将遗传算法应用到HMM模型训练中,得到了全局最优解。实验结果表明,所提出的算法使用有效,识别率显著提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号