首页 | 本学科首页   官方微博 | 高级检索  
     

基于卷积神经网络的法庭说话人识别研究
引用本文:南兆营.基于卷积神经网络的法庭说话人识别研究[J].电声技术,2021,45(2):23-27,31.
作者姓名:南兆营
作者单位:中国刑事警察学院,辽宁 沈阳 110854
摘    要:传统的法庭说话人识别方法存在对语音数据建模能力差、特征提取难以及容易受噪声干扰影响等问题,为了改进这些问题,提出一种基于卷积神经网络的法庭说话人识别方法.该方法以AlexNet网络为基础进行参数调整,为了弥补ReLU函数作为激活函数时易出现神经元坏死和偏移的现象,融合Tanh和ReLU函数的特性,构造一种新的TR函数作为网络的激活函数.同时,为了避免人工提取语音特征的主观性和不全面性,在实验中将语音转换成声纹图作为网络输入.实验结果表明,激活函数为TR函数时,该方法在法庭说话人识别数据集的准确率达到了92.24%,在花朵图像公开数库的准确率达到了96.13%,效果均好于Tanh和ReLU函数.

关 键 词:卷积神经网络  法庭说话人识别  激活函数  声纹图

Research on Forensic Speaker Recognition Based on Convolutional Neural Networks
NAN Zhaoying.Research on Forensic Speaker Recognition Based on Convolutional Neural Networks[J].Audio Engineering,2021,45(2):23-27,31.
Authors:NAN Zhaoying
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号