首页 | 本学科首页   官方微博 | 高级检索  
     

嵌入马尔可夫网络的多尺度判决融合耳语音情感识别
引用本文:黄程韦,金赟,包永强,余华,赵力.嵌入马尔可夫网络的多尺度判决融合耳语音情感识别[J].信号处理,2013,29(1):98-106.
作者姓名:黄程韦  金赟  包永强  余华  赵力
作者单位:1. 东南大学水声信号处理教育部重点实验室,南京,210096
2. 东南大学水声信号处理教育部重点实验室,南京,210096;江苏师范大学,物理与电子工程学院,徐州,221116
3. 南京工程学院通信工程学院,南京,211167
基金项目:国家自然科学基金(No:61231002;No:61273266;No:51075068);教育部博士点基金(No.20110092130004);江苏省高校自然科学研究基金(No.10KJB510005)
摘    要:本文中我们提出了一种将高斯混合模型同马尔可夫网络结合的时域多尺度语音情感识别框架,并将其应用在耳语音情感识别中.针对连续语音信号的特点,分别在耳语音信号的短句尺度上和长句尺度上进行了基于高斯混合模型的情感识别.根据情绪的维度空间论,耳语音信号中的情感信息具有时间上的连续性,因此利用三阶的马尔可夫网络对多尺度的耳语音情感分析进行了上下文的情感依赖关系的建模.采用了一种弹簧模型来定义二维情感维度空间中的高阶形变,并且利用模糊熵评价将高斯混合模型的似然度转化为马尔可夫网络中的一阶能量.实验结果显示,本文提出的情感识别算法在连续耳语音数据上获得了较好的识别结果,对愤怒的识别率达到了64.3%.实验结果进一步显示,与正常音的研究结论不同,耳语音中的喜悦情感的识别相对困难,而愤怒与悲伤之间的区分度较高,与Cirillo等人进行的人耳听辨研究结果一致.

关 键 词:语音情感识别  多尺度分析  马尔可夫网络  判决融合

Whispered Speech Emotion Recognition Embedded with Markov Networks and Multi-Scale Decision Fusion
HUANG Cheng-wei , JIN Yun , BAO Yong-qiang , YU Hua , ZHAO Li.Whispered Speech Emotion Recognition Embedded with Markov Networks and Multi-Scale Decision Fusion[J].Signal Processing,2013,29(1):98-106.
Authors:HUANG Cheng-wei  JIN Yun  BAO Yong-qiang  YU Hua  ZHAO Li
Affiliation:1(1.Key Laboratory of Underwater Acoustic Signal Processing of Ministry of Education,Southeast University,Nanjing 210096,P.R.China;2.School of Physics and Electronics Engineering,Jiangsu Normal University,Xuzhou, 221116,China;3.School of Communication Engineering,Nanjing Institute of Technology,Nanjing 211167,P.R.China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号