基于不确定性学习的文本无关的说话人确认方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于不确定性学习的文本无关的说话人确认方法

作者姓名：	张玉莲姚姗姗王超畅江

作者单位：	山西大学大数据科学与产业研究院

基金项目：	国家自然科学基金资助项目（61906115）;;山西省青年科学基金资助项目（20210302124556）~~;

摘要：	说话人确认任务旨在判断注册语音与测试语音是否属于同一说话人。针对说话人识别系统提取的声纹特征通常会受到与身份信息无关的因素干扰进而导致系统的准确性严重下降的问题,提出一种基于不确定性学习（UL）的文本无关的说话人确认（TISV）方法。首先,在说话人主干网络中引入不确定性同时学习声纹特征（均值）和话语数据的不确定性（方差）,以建模语音数据集中的不确定性;其次,通过重采样技巧得到特征的分布表示;最后,在说话人分类损失中引入KL散度正则化约束噪声的分布,从而解决计算分类损失过程中的退化问题。实验结果表明,当训练集为VoxCeleb1和VoxCeleb2开发集时,与基于确定性方法的Thin ResNet34模型相比,所提方法的模型在VoxCeleb1-O测试集上的等错误率（EER）分别降低了9.9%和10.4%,最小检测代价函数（minDCF）分别降低了10.9%和4.5%。可见,所提方法在有噪声、无约束场景下的准确度有所提高。
关键词：	说话人确认数据不确定性分布嵌入 AAM-softmax KL散度