注意力残差模型的语音抑郁倾向识别方法 |
| |
作者姓名: | 鲁小勇 石代敏 刘阳 原静仪 董强利 马秀云 |
| |
作者单位: | 1. 西北师范大学物理与电子工程学院;2. 互联网教育数据学习分析技术国家地方联合工程实验室;3. 甘肃省行为与心理健康重点实验室;4. 兰州大学第二医院心理卫生科 |
| |
基金项目: | 国家自然科学基金项目(31860285,31660281)资助; |
| |
摘 要: | 采用语音信号进行抑郁倾向识别具有重要的现实意义.针对语音抑郁倾向识别使用深度神经网络方法结构复杂和传统机器学习方法需要手动提取特征及识别率低的问题.本文提出了一种结合残差思想和注意力机制的模型,首先基于心理学自我参照效应(Self-reference Effect, SRE)实验范式设计了抑郁语料,进行语音数据集标注;然后将注意力模块引入残差单元中,利用通道注意力学习其通道维度上的特征,空间注意力反馈其空间维度的特征,并将两者结合得到注意力残差单元;最后堆叠单元构建基于注意力残差网络的语音抑郁倾向识别模型.实验结果表明,与传统机器学习方法相比,该模型在抑郁倾向识别上获得了更优的结果,可满足抑郁倾向识别应用的需求.
|
关 键 词: | 抑郁倾向识别 残差神经网络 注意力机制 Mel频率倒谱系数(MFCC) |
|