跨域注意力特征融合的说话人确认方法 |
| |
引用本文: | 杨震,王天朗,郭海燕,王婷婷.跨域注意力特征融合的说话人确认方法[J].通信学报,2023(8):89-98. |
| |
作者姓名: | 杨震 王天朗 郭海燕 王婷婷 |
| |
作者单位: | 1. 南京邮电大学通信与信息工程学院;2. 南京邮电大学通信与网络技术国家地方联合工程研究中心 |
| |
基金项目: | 国家自然科学基金资助项目(No.62071242)~~; |
| |
摘 要: | 针对目前说话人确认系统中前端特征的语音信号样点间结构信息缺失问题,提出了跨域注意力特征融合的说话人确认方法。首先,提出了一种基于图信号处理的图频域特征提取方法来有效利用语音信号的结构信息,将语音信号帧的每个样点作为图节点,构建语音图信号,通过图傅里叶变换以及滤波器组提取图频域特征。其次,提出了一种由残差模块与挤压-激励模块构成的注意力特征融合网络,对传统时频域特征与图频域特征进行跨域融合,来提升说话人确认系统的性能。最后,在Vox Celeb、SITW和CN-Celeb数据集上进行实验。实验结果表明,所提方法在等错误率以及最小检测代价函数的评价指标上,优于基线模型ECAPA-TDNN。
|
关 键 词: | 说话人确认 图信号处理 注意力特征融合 |
|
|