基于改进语音处理的卷积神经网络中文语音情感识别方法 |
| |
引用本文: | 乔栋,陈章进,邓良,屠程力.基于改进语音处理的卷积神经网络中文语音情感识别方法[J].计算机工程,2022(2):281-290. |
| |
作者姓名: | 乔栋 陈章进 邓良 屠程力 |
| |
作者单位: | 1. 上海大学微电子研究与开发中心;2. 上海大学计算中心 |
| |
基金项目: | 国家自然科学基金(61674100); |
| |
摘 要: | 语音情感识别在人机交互中具有重要意义。为解决中文语音情感识别效率和准确率低等问题,提出一种基于Trumpet-6卷积神经网络模型的中文语音情感识别方法。在MFCC特征提取过程中,通过增加分帧加窗操作时采样点的个数,增添每个汉明窗内的特征及减少汉明窗个数,从而缩小MFCC特征图的像素尺寸,提高单次识别的处理效率。在此基础上,使用高斯白噪声对数据集进行数据增强处理,缓解训练过程中的过拟合问题。在CASIA语音情感数据集上的实验结果表明,该方法的测试准确率达95.7%,优于Lenet-5、RNN、LSTM等传统方法,且Trumpet-6卷积神经网络模型采用2 048个采样点,仅需176 550个待训练参数,与采用DCNN的ResNet34和循环神经网络模型相比,参数更少,结构更简单,处理速度更快。
|
关 键 词: | 语音情感识别 MFCC特征 高斯白噪声 数据增强 卷积神经网络 |
|
|