首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于NAQ的语音情感识别研究   总被引:1,自引:0,他引:1  
研究了用迭代自适应逆滤波器估计声门激励的方法,以声门激励的时域参数归一化振幅商作为特征,对六种不同情感的连续语音,首先使用Fratio准则判别其对情感的区分能力,然后运用混合高斯模型对语音情感进行建模和识别。采用eNTERFACE’05情感语音数据库中的语音,比较了以整句NAQ值作为特征和以元音段的NAQ值作为特征,以及主观感知的情感识别结果。实验表明元音段的NAQ值是一种具有判别力的语音情感特征。  相似文献   

2.
基于高斯语音滤波的稳健文本无关说话人识别   总被引:5,自引:1,他引:4  
基于高斯模型,提出一种去除实际电话录音中噪音、静音等非语音信号的新方法。与传统的语音检测器方法相比,基于高斯语音滤波的方法在不同信道条件下都可以自动进行,更好地保留了与说话人身份有关的信息。实验结果表明,采用该方法的系统的等错误率比传统方法最多下降了21.2%。  相似文献   

3.
研究了情绪的维度空间模型与语音声学特征之间的关系以及语音情感的自动识别方法。介绍了基本情绪的维度空间模型,提取了唤醒度和效价度对应的情感特征,采用全局统计特征减小文本差异对情感特征的影响。研究了生气、高兴、悲伤和平静等情感状态的识别,使用高斯混合模型进行4种基本情感的建模,通过实验设定了高斯混合模型的最佳混合度,从而较好地拟合了4种情感在特征空间中的概率分布。实验结果显示,选取的语音特征适合于基本情感类别的识别,高斯混合模型对情感的建模起到了较好的效果,并且验证了二维情绪空间中,效价维度上的情感特征对语音情感识别的重要作用。  相似文献   

4.
自适应滤波是IP回声消除的核心。该文针对声学回声消除的原理、基本算法以及实现过程中的一些关键问题进行了讨论与研究,并提出了适用于计算机软件实现的一种改进的LMS算法,即归一化LMS算法,通过实验结果证明它能够提高收敛性能,改善通话质量。  相似文献   

5.
为实现更为有效的自动语音情感识别系统,提出了一种基于声门信号特征参数及高斯混合模型的情感识别算法.该算法基于人类发音机理,通过逆滤波器及线性预测方法,实现声门信号的估计,提取声门信号时域特征参数表征不同情感类别.实验采用公开的BES (berlin emotion speech database)情感语料库,对愤怒、无聊、厌恶、害怕、高兴、平静、悲伤这7种情感进行自动识别.实验结果表明,提出的语音情感识别系统能有效的识别各类情感状态,其情感判别正确率接近于人类识别正确率,且优于传统的基音频率及共振峰参数.  相似文献   

6.
提出一种基于改进GMM模型的耳语情感语音识别方法.该方法在GMM的每个成员通过用矢量量化误差值取代传统GMM的输出概率值来计算模型的得分,使得建模时所需训练数据量减少,并且识别速度有所提高.实验结果表明当训练数据较少时,提出的新的识别方法的实验结果明显好于传统的GMM方法,证明了该方法的有效性.  相似文献   

7.
针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空间参数,以获取更高维的细节信息,进一步提高情感识别性能。采用柏林情感语料库进行验证,新参数的识别率比传统的MFCC和LSF分别有5.7%和6.9%的提高。实验结果表明,提出的WMFCC以及GW-MFCC参数可以有效地表现语音情感信息,提高语音情感识别率。  相似文献   

8.
针对GrabCut算法在图像分割中存在迭代求解耗时长、分割结果欠分割的问题,提出了一种基于非归一化直方图改进的GrabCut算法。在保留GrabCut第一次分割结果的基础上,通过非归一化直方图计算像素点属于前景或背景的方法来代替高斯混合模型迭代学习的过程;在构图过程中引入一类新的节点Bin进行构图以提高分割精度。选取MSRA1000数据集中部分图片进行实验验证,结果表明该算法在分割效果和效率上都有明显的提升,在进行背景复杂图像的分割时改进算法优势更加明显。  相似文献   

9.
提出了一种基于隐马尔可夫模型(HMM)与人工神经网络(ANN)相结合的情感语音识别系统的实现方法.并从情感语音资料的获取、情感语音特征的提取及情感语音识别等方面阐明了情感语音识别系统的建立过程.该系统实现了情感语音特征参数的提取、情感语音模型参数的训练及对录入的情感语音进行识别等功能.研究结果表明了该系统识别效果良好.  相似文献   

10.
自适应GHPF及其在组合导航中的应用   总被引:1,自引:0,他引:1  
研究组合导航系统精度优化问题,针对粒子滤波存在重要性密度函数难以选取的问题,提出一种新的自适应GHPF算法,通过高斯-厄米特滤波来获取状态均值和协方差阵,计算自适应因子并利用自适应因子调节均值和方差,得到一种参数可调节的重要性密度函数.重要性密度函数考虑了最新量测的影响,提高了滤波精度,使滤波性能明显改善,能更好地解决非线性非高斯系统模型的滤波问题.将提出的算法应用于SINS/SAR组合导航系统中,仿真结果表明,提出的滤波算法能提高导航计算的精度,定位性能明显优于与扩展Kalman滤波、粒子滤波以及高斯-厄米特粒子滤波.  相似文献   

11.
为了解决语音情感识别系统中训练数据和测试数据来自不同数据 库所引起的识别率降低的问题,提出了一种基于稀疏特征迁移的语音情感识别方法。通过引入稀疏编码获取情感特征在不同数据库条件下的共同稀疏表示;同时引入最大区分差异(Maximum mean discrepancy, MMD)来衡量不同数据库条件下稀疏表示分布之间的距离,并将其作为稀疏编码目标函数的约束条件,从而获得较为鲁棒的稀疏特征。实验结果表明,相比传统语音情感识别方法,基于稀疏特征迁移的语音情感识别方法显著提高了跨库条件下的情感识别率。  相似文献   

12.
同一组特征向量对不同的情感,其识别能力不同.以HMM作为语音情感分类器模型,对不同情感状态选择不同的特征向量进行识别.系统分两个阶段完成:首先基于漏识率和误识率最小的决策原则,采用优先选择(PFS)算法分别为每种情感状态选择最优的特征向量,然后用这些特征向量分别建立对应情感状态的HMM模型.利用北航情感语音库(BHUDES)对算法进行验证,将所有实验样本分为训练样本集、特征选择样本集和测试样本集3组,采用交叉实验的方法对本算法进行验证,结果表明,与单特征向量HMM相比,多特征向量HMM可达到更高的识别精度.  相似文献   

13.
针对目前基于智能手机的情绪识别研究中所用数据较为单一,不能全面反应用户行为模式,进而不能真实反应用户情绪这一问题展开研究,基于智能手机从多个维度全面收集反应用户日常行为的细粒度感知数据,采用多维数据特征融合方法,利用支持向量机(support vector machine,SVM)、随机森林(random forest)等6种分类方法,基于离散情绪模型和环状情绪模型两种情绪分类模型,对12名志愿者的混合数据和个人数据分别进行情绪识别,并进行了对比实验。实验结果表明,该全面反应用户行为的多维数据特征融合方法能够很好地对用户的情绪进行识别,其中使用个人数据进行情绪识别的准确率最高可达到79.78%,而且环状情感模型分类结果明显优于离散分类模型。  相似文献   

14.
罗宪华  杨大利  徐明星  徐露 《计算机科学》2011,38(8):212-213,256
在语音情感识别中,如何选取有效的情感特征是识别过程的重要环节。迄今为止,一些常用的特征选择算法虽然能够帮助提高识别性能,但也存在理论性不强、随机性高、计算量大的缺点。因此提出了一种基于主成分分析(PCA)的特征选择方法,亦即对原始特征集合先进行PCA变换,再利用变换矩阵分析出原始特征进行变换时各自的权重,最后根据权重的大小对原始特征进行选择。实验结果表明,选择出的特征对识别率具有较大的贡献,属于重要特征。  相似文献   

15.
语音识别领域的发展日新月异.同时,现有的研究结果表明声学特性集中存在较多的互补信息.本文提出了一种基于轨迹的空间-时间谱特语音情感识别方法.其核心思想是从语音频谱图中获得空间和时间上的描述符,进行分类和维度情感识别.本方法采用了穷举特征提取的实验表明:与MFCCs和基频等特征提取方法相比,提出的方法在噪声条件下,更具鲁棒性.通过在4类情感识别实验中获得了可比较的非加权平均回馈,得到了较为准确的结果,语音激活检测方面也具有显著的改进.  相似文献   

16.
针对目前基于单一脑区功能性网络层面的特征提取,文中提出稀疏组lasso-granger因果关系方法.首先从效应性脑网络层面提取不同脑区之间的因果关系作为脑电特征,分别提取受试者α,β,γ脑电波段的granger因果特征值.然后引用稀疏组lasso算法对获取的granger因果特征值进行特征筛选,获得高相关性特征子集作为情感分类特征.最后使用SVM分类器进行情感分类.此外,为了减少计算时间复杂度,使用过滤特征选择(ReliefF)算法,选取有效的脑电信号通道.实验表明,文中方法在Valence-Arousal二维情感模型上获得较高的平均情感分类准确率,分类效果优于对比的脑电特征,提取的情感脑电特征可以有效识别受试者的不同情感状态.  相似文献   

17.
王忠民  刘戈  宋辉 《计算机工程》2019,45(8):248-254
在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基础上,使用多核学习算法融合音频特征,并将生成的核函数应用于支持向量机进行情感分类。在2种语音情感数据集上的实验结果表明,与单一特征的分类器相比,该方法的语音情感识别准确率高达96%。  相似文献   

18.
传统基于脑电信号(electroencephalogram,EEG)的情感识别主要采用单一的脑电特征提取方法,为了充分利用EEG中蕴含的丰富信息,提出一种多域特征融合的脑电情感识别新方法。提取了EEG的时域、频域和空域特征,将三域特征进行融合作为情感识别模型的输入。首先计算不同时间窗EEG信号的alpha、beta、gamma三个频段功率谱密度,并结合脑电电极空间信息构成EEG图片,然后利用卷积神经网络(convolutional neural network,CNN)与双向长短期记忆网络(bidirectional long short-term memory network,BLSTM)构建CNN-BLSTM情感识别模型,分别对时、频、空三域特征进行学习。在SEED数据集对该方法进行验证,结果表明该方法能有效提高情感识别精度,平均识别准确率达96.25%。  相似文献   

19.
针对单模态深度神经网络(Deep Neural Network,DNN)难以充分提取情感分类任务中脑电信号的多域特征,且脑电信号中存在通道冗余的问题,提出一种结合互信息通道选择与混合深度神经网络的脑电情感识别方法,首先提取各通道信号中γ节律的微分熵(Differential Entropy,DE)特征,通过DE计算通道间的归一化互信息(Normalized mutual information,NMI),将所得NMI矩阵按列求和后的向量作为表征各通道任务相关性的权值,根据权值选出最优通道集,之后采用卷积神经网络(Convolutional Neural Networks,CNN)和长短期记忆网络(Long-short term memory neural network,LSTM)相结合的混合DNN网络进行样本特征提取和分类.该方法分别在DEAP数据集的效价(Valence)和唤醒度(Arousal)上取得了87.60%和88.58%的平均分类准确率,表明了所提出方法的可行性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号