首页 | 本学科首页   官方微博 | 高级检索  
     

基于MFCC和常数Q变换的乐器音符识别
引用本文:陈燕文,李坤,韩焱,王燕平.基于MFCC和常数Q变换的乐器音符识别[J].计算机科学,2020,47(3):149-155.
作者姓名:陈燕文  李坤  韩焱  王燕平
作者单位:中北大学信息探测与处理山西省重点实验室 太原 030051;中北大学艺术学院 太原 030051
摘    要:音符识别是音乐信号分析处理领域内非常重要的研究内容,它为计算自动识谱、乐器调音、音乐数据库检索和电子音乐合成提供技术基础。传统的音符识别方法通过估计音符基频与标准频率进行一一对应识别。然而一一对应较为困难,且随着音符基频的增大将导致误差增大,可识别的音符基频范围不广。为此,文中采用分类的思想进行音符识别。首先,建立所需识别的音符音频库,并针对音乐信号低频信息的重要性,选取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)和常数Q变换(Constant Q Transform,CQT)作为音符信号提取特征。然后,将提取的特征MFCC和CQT分别作为音符识别的单一特征输入和两者特征融合输入;结合Softmax回归模型在多分类问题中的优势以及BP神经网络良好的非线性映射能力与自学习能力,构建基于Softmax回归模型的BP神经网络多分类识别器。在MATLAB R2016a的仿真环境下,将特征参数输入到多分类器中进行学习与训练,通过调整网络参数来寻找最优解。通过改变训练样本数进行对比实验。实验结果表明,将融合特征(MFCC+CQT)作为特征输入时,可以识别出从大字组到小字三组的25类音符,并可以获得95.6%的平均识别率;在识别过程中,特征CQT比特征MFCC的贡献更大。实验数据充分说明,利用分类的思想提取音符信号的MFCC和CQT特征来进行音符识别,可以取得很好的识别效果,并且不受音符基频范围的限制。

关 键 词:音符库  MFCC  常数Q变换  特征融合  Softmax回归模型  BP神经网络

Musical Note Recognition of Musical Instruments Based on MFCC and Constant Q Transform
CHEN Yan-wen,LI Kun,HAN Yan,WANG Yan-ping.Musical Note Recognition of Musical Instruments Based on MFCC and Constant Q Transform[J].Computer Science,2020,47(3):149-155.
Authors:CHEN Yan-wen  LI Kun  HAN Yan  WANG Yan-ping
Affiliation:(Shanxi Key Laboratory of Signal Capturing&Processing,North University of China,Taiyuan 030051,China;School of Arts,North University of China,Taiyuan 030051,China)
Abstract:
Keywords:Music note library  Mel frequency cepstrum coefficients  Constant Q transform  Feature fusion  Softmax regression model  BP neural network
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号