共查询到18条相似文献,搜索用时 78 毫秒
1.
2.
基于PCA和SVM的普通话语音情感识别 总被引:1,自引:0,他引:1
在语音情感识别中,情感特征的选取与抽取是重要环节。目前,还没有非常有效的语音情感特征被提出。因此,在包含6种情感的普通话情感语料库中,根据普通话不同于西方语种的特点,选取了一些有效的情感特征,包含Mel频率倒谱系数、基频、短时能量、短时平均过零率和第一共振峰等,进行提取并计算得到不同的统计量;接着采用主成分分析(PCA)进行抽取;最后利用基于支持向量机(SVM)的语音情感识别系统进行分类。实验结果表明, 与其他一些重要的研究结果相比,该方法得到了较高的平均情感识别率, 且情感特征的选取、抽取及建模是合理、有效的。 相似文献
3.
为有效提高语音情感识别系统的识别率,研究分析了一种改进型的支持向量机(SVM)算法。该算法首先利用遗传算法对SVM参数惩罚因子和核函数中参数进行优化,然后用优化后的参数进行语音情感的建模与识别。在柏林数据集上进行7种和常用5种情感识别实验,取得了91.03%和96.59%的识别率,在汉语情感数据集上,取得了97.67%的识别率。实验结果表明该算法能够有效识别语音情感。 相似文献
4.
针对人脸结构过于复杂,导致识别精度低的问题,提出基于支持向量机(Support Vector Machine,SVM)的人脸识别方法。首先,选取Gabor小波变换算法,利用高斯函数表示短时傅里叶变换的窗函数,通过对人脸图像的卷积运算,提取人脸图像的幅值特征以及相位特征。其次,选取主成分分析方法,对所提取的人脸图像特征进行特征降维处理。最后,设置完成降维处理的人脸特征值,作为SVM的输入,利用SVM输出人脸识别结果。实验结果表明,该方法在强光等复杂环境下,仍然可以精准识别人脸,人脸识别精度高于97%。 相似文献
5.
6.
语音情感计算引起了国内外广泛的关注,特别是在语音情感特征提取方面做了大量的研究。利用经验模态分解(EMD)方法对情感语音进行处理,得到情感语音的前4阶固有模态函数(IMF),并将前4阶IMF分别通过Hilbert变换得到其瞬时频率和瞬时振幅。提取它们的统计特征,再结合情感语音的声学特征共同组成情感特征向量,并对特征向量做归一化处理。利用支持向量机(SVM)对四种情感语音即生气、高兴、悲伤和平静进行识别。实验结果表明该方法的识别效果较好。 相似文献
7.
基于Fisher准则与SVM的分层语音情感识别 总被引:1,自引:0,他引:1
针对说话人无关的语音情感识别,提出一个分层语音情感识别模型,由粗到细识别悲伤、愤怒、惊奇、恐惧、喜悦和厌恶6种情感.每层采用Fisher比率从288个备选特征中选择适合该层分类的特征,同时将Fisher比率作为输入参数训练该层的支持向量机分类器.基于北京航空航天大学情感语音数据库和德国柏林情感语音数据库,设计4组对比实验,实验结果表明,Fisher准则在两两分类特征选择上优于PCA,SVM在说话人无关的语音情感识别推广方面优于人工神经网络(ANN).在两个数据库的基础上得到类似结果,说明文中分类模型具有一定的跨文化适应性. 相似文献
8.
语音情感识别日益受到人们的关注,在社会生活中发挥着重要作用。为了提高语音情感的识别率,提出一种改进的灰狼算法(Grey Wolf Optimizer,GWO)优化支持向量机(Support Vector Machine,SVM)的分类模型(IGWO-SVM)。介绍了灰狼算法的基本理论;嵌入选择算子和引入非线性收敛因子来提升IGWO的寻优性能;采用IGWO优化SVM参数,进而建立语音情感的分类模型。通过10个基准测试函数的仿真实验,验证了IGWO性能优于GWO。对于参比模型,IGWO-SVM模型能够有效提高语音情感的识别率。 相似文献
9.
基于组合特征提取与多级SVM的轮胎花纹识别 总被引:1,自引:0,他引:1
基于轮胎花纹分类识别在交通与刑事部门的重要作用,提出了一种新的基于组合特征提取与多级SVM的轮胎花纹识别方法。分别采用非下采样Contourlet变换和灰度共生矩阵方法提取轮胎花纹特征;组合两种方法所提取的特征作为图像特征,并从中提取5个有效特征作为最终识别特征;运用提取的5个特征和多级支持向量机分类器完成轮胎花纹的分类识别。新的特征提取方法所得轮胎花纹特征分离度高,用决策树SVM分类器预测分类效果理想,对轮胎花纹的正确分类识别有着重要意义。 相似文献
10.
支持向量机(SVM)具有适合处理小样本、非线性和高维数问题,利用核函数且泛化能力强等多方面的优点。文章简要介绍了SVM的基本原理,然后利用支持向量机(SVM)进行两类分类和多类分类实验,比较不同核函数的结果。实验证明支持向量机的分类效果比较好。 相似文献
11.
12.
13.
为增强不同情感特征的融合程度和语音情感识别模型的鲁棒性,提出一种神经网络结构DBM-LSTM用于语音情感识别。利用深度受限玻尔兹曼机的特征重构原理将不同的情感特征进行融合;利用长短时记忆单元对短时特征进行长时建模,增强语音情感识别模型的鲁棒性;在柏林情感语音数据库上进行分类实验。研究结果表明,与传统识别模型相比,DBM-LSTM网络结构更适用于多特征语音情感识别任务,最优识别结果提升11%。 相似文献
14.
针对F-score特征选择算法不能揭示特征间互信息而不能有效降维这一问题,应用去相关的方法对F-score进行改进,利用德语情感语音库EMO-DB,在提取语音情感特征的基础上,根据支持向量机(SVM)的分类精度选择出分类效果最佳的特征子集。与F-score特征选择算法对比,改进后的算法实现了候选特征集较大幅度的降维,选择出了有效的特征子集,同时得到了较理想的语音情感识别效果。 相似文献
15.
支持向量机在训练过程中,将很多时间都浪费在对非支持向量的复杂计算上,特别是对于大规模数据量的语音识别系统来说,支持向量机在训练时间上不必要的开销将会更加显著。核模糊C均值聚类是一种常用的典型动态聚类算法,并且有核函数能够把模式空间的数据非线性映射到高维特征空间。在核模糊C均值聚类的基础上,结合了多类分类支持向量机中的一对一方法,按照既定的准则把训练样本集中有可能属于支持向量的样本数据进行预选取,并应用到语音识别中。实验取得了较好的结果,该方法有效地提高了支持向量机分类器的学习效率和泛化能力。 相似文献
16.
语音情感识别的精度很大程度上取决于不同情感间的特征差异性。从分析语音的时频特性入手,结合人类的听觉选择性注意机制,提出一种基于语谱特征的语音情感识别算法。算法首先模拟人耳的听觉选择性注意机制,对情感语谱信号进行时域和频域上的分割提取,从而形成语音情感显著图。然后,基于显著图,提出采用Hu不变矩特征、纹理特征和部分语谱特征作为情感识别的主要特征。最后,基于支持向量机算法对语音情感进行识别。在语音情感数据库上的识别实验显示,提出的算法具有较高的语音情感识别率和鲁棒性,尤其对于实用的烦躁情感的识别最为明显。此外,不同情感特征间的主向量分析显示,所选情感特征间的差异性大,实用性强。 相似文献
17.
针对不同语料库之间数据分布差异问题,提出一种基于深度自编码器子域自适应的跨库语音情感识别算法.首先,该算法采用两个深度自编码器分别获取源域和目标域表征性强的低维情感特征;然后,利用基于LMMD(local maximum mean discrepancy)的子域自适应模块,实现源域和目标域在不同低维情感类别空间中的特征分布对齐;最后,使用带标签的源域数据进行有监督地训练该模型.在eNTERFACE库为源域、Berlin库为目标域的跨库识别方案中,所提算法的跨库识别准确率相比于其他算法提升了5.26%~19.73%;在Berlin库为源域、eNTERFACE库为目标域的跨库识别方案中,所提算法的跨库识别准确率相比于其他算法提升了7.34%~8.18%.因此,所提方法可以有效地提取不同语料库的共有情感特征并提升了跨库语音情感识别的性能. 相似文献
18.
为了克服语音情感线性参数在刻画不同情感类型特征上的不足,将多重分形理论引入语音情感识别中来,通过分析不同语音情感状态下的多重分形特征,提取多重分形谱参数和广义Hurst指数作为新的语音情感特征参数,并结合传统语音声学特征采用支持向量机(SVM)进行语音情感识别。实验结果表明,通过非线性参数的介入,与仅使用传统语音线性特征的识别方法相比,识别系统的准确率和稳定性得到有效提高,因此为语音情感识别提供了一个新的思路。 相似文献