首页 | 本学科首页   官方微博 | 高级检索  
     

基于卷积神经网络的鲁棒性基音检测方法
引用本文:张晖, 苏红, 张学良, 高光来. 基于卷积神经网络的鲁棒性基音检测方法. 自动化学报, 2016, 42(6): 959-964. doi: 10.16383/j.aas.2016.c150672
作者姓名:张晖  苏红  张学良  高光来
作者单位:内蒙古大学计算机学院 呼和浩特 010020
基金项目:国家自然科学基金(61365006, 61263037)资助
摘    要:在语音信号中, 基音是一个重要参数, 且有重要用途. 然而, 检测噪声环境中语音的基音却是一项难度较大的工作. 由于卷积神经网络(Convolutional neural network, CNN)具有平移不变性, 能够很好地刻画语谱图中的谐波结构, 因此我们提出使用CNN来完成这项工作. 具体地, 我们使用CNN来选取候选基音, 再用动态规划方法(Dynamic programming, DP)进行基音追踪, 生成连续的基音轮廓. 实验表明, 与其他方法相比, 本文的方法具有明显的性能优势, 并且 对新的说话人和噪声有很好的泛化性能, 具有更好的鲁棒性.

关 键 词:信号处理   基音检测   卷积神经网络   动态规划
收稿时间:2015-10-29

Convolutional Neural Network for Robust Pitch Determination
ZHANG Hui, SU Hong, ZHANG Xue-Liang, GAO Guang-Lai. Convolutional Neural Network for Robust Pitch Determination. ACTA AUTOMATICA SINICA, 2016, 42(6): 959-964. doi: 10.16383/j.aas.2016.c150672
Authors:ZHANG Hui  SU Hong  ZHANG Xue-Liang  GAO Guang-Lai
Affiliation:Computer Science Department, Inner Mongolia University, Hohhot 010020
Abstract:Pitch is an important characteristic of speech and is useful for many applications. However, pitch determination in noisy conditions is difficult. Because shift-invariant property of convolutional neural network (CNN) is suitable to model spectral feature for pitch detection, we propose a supervised learning algorithm to estimate pitch using CNN. Specifically, we use CNN for pitch candidate selection, and dynamic programming (DP) for pitch tracking. Our experimental results show that the proposed method can obtain accurate pitch estimation and that it has a good generalization ability in terms of new speakers and noisy conditions.
Keywords:words Signal processing  pitch determination  convolutional neural network (CNN)  dynamic programming (DP)
点击此处可从《自动化学报》浏览原始摘要信息
点击此处可从《自动化学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号