首页 | 本学科首页   官方微博 | 高级检索  
     

融合图像显著性的声波动方程情感识别模型
引用本文:贾宁,郑纯军.融合图像显著性的声波动方程情感识别模型[J].数据采集与处理,2021,36(5):1062-1072.
作者姓名:贾宁  郑纯军
作者单位:大连东软信息学院软件学院,大连 116023
摘    要:语音情感识别(Speech emotion recognition, SER)是计算机理解人类情感的关键之处,也是人机交互的重要组成部分。当情感语音信号在不同的介质传播时,使用深度学习模型获得的识别精度不高,识别模型的迁移能力不强。为此,设计了一种融合图像显著性和门控循环的声波动方程情感识别(Image saliency gated recurrent acoustic wave equation emotion recognition, ISGR-AWEER)模型,该模型由图像显著性提取和基于门控循环的声波动模型构成。前者模拟注意力机制,用于提取语音中情感表达的有效区域,后者设计了一个声波动情感识别模型,该模型模拟循环神经网络的流程,可以有效提升跨介质下语音情感识别的精度,同时可快速地实现跨介质下的模型迁移。通过实验,在交互情感二元动作捕捉(Interactive emotional dyadic motion capture, IEMOCAP)情感语料库和自建多介质情感语音语料库上验证了当前模型的有效性,与传统的循环神经网络相比,情感识别精度获得了25%的改善,并且具有较强的跨媒介迁移能力。

关 键 词:语音情感识别  图像显著性和门控循环的声波动方程情感识别  图像显著性  声波动方程  门控循环  多介质情感语音语料库
收稿时间:2021/5/24 0:00:00
修稿时间:2021/9/11 0:00:00

An Acoustic Wave Equation Emotion Recognition Model Based on Image Saliency
JIA Ning,ZHENG Chunjun.An Acoustic Wave Equation Emotion Recognition Model Based on Image Saliency[J].Journal of Data Acquisition & Processing,2021,36(5):1062-1072.
Authors:JIA Ning  ZHENG Chunjun
Affiliation:School of Software, Dalian Neusoft University of Information, Dalian 116023, China
Abstract:
Keywords:speech emotion recognition (SER)  image saliency gated recurrent acoustic wave equation emotion recognition (ISGR-AWEER)  image saliency  acoustic wave equation  gated recurrent  multi-media emotional speech corpus
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号