基于MFCC和常数Q变换的乐器音符识别 Musical Note Recognition of Musical Instruments Based on MFCC and Constant Q Transform期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于MFCC和常数Q变换的乐器音符识别

引用本文：	陈燕文,李坤,韩焱,王燕平.基于MFCC和常数Q变换的乐器音符识别[J].计算机科学,2020,47(3):149-155.

作者姓名：	陈燕文李坤韩焱王燕平

作者单位：	中北大学信息探测与处理山西省重点实验室太原 030051;中北大学艺术学院太原 030051

摘要：	音符识别是音乐信号分析处理领域内非常重要的研究内容,它为计算自动识谱、乐器调音、音乐数据库检索和电子音乐合成提供技术基础。传统的音符识别方法通过估计音符基频与标准频率进行一一对应识别。然而一一对应较为困难,且随着音符基频的增大将导致误差增大,可识别的音符基频范围不广。为此,文中采用分类的思想进行音符识别。首先,建立所需识别的音符音频库,并针对音乐信号低频信息的重要性,选取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)和常数Q变换(Constant Q Transform,CQT)作为音符信号提取特征。然后,将提取的特征MFCC和CQT分别作为音符识别的单一特征输入和两者特征融合输入;结合Softmax回归模型在多分类问题中的优势以及BP神经网络良好的非线性映射能力与自学习能力,构建基于Softmax回归模型的BP神经网络多分类识别器。在MATLAB R2016a的仿真环境下,将特征参数输入到多分类器中进行学习与训练,通过调整网络参数来寻找最优解。通过改变训练样本数进行对比实验。实验结果表明,将融合特征(MFCC+CQT)作为特征输入时,可以识别出从大字组到小字三组的25类音符,并可以获得95.6%的平均识别率;在识别过程中,特征CQT比特征MFCC的贡献更大。实验数据充分说明,利用分类的思想提取音符信号的MFCC和CQT特征来进行音符识别,可以取得很好的识别效果,并且不受音符基频范围的限制。
关键词：	音符库 MFCC 常数Q变换特征融合 Softmax回归模型 BP神经网络
Musical Note Recognition of Musical Instruments Based on MFCC and Constant Q Transform

CHEN Yan-wen,LI Kun,HAN Yan,WANG Yan-ping.Musical Note Recognition of Musical Instruments Based on MFCC and Constant Q Transform[J].Computer Science,2020,47(3):149-155.

Authors:	CHEN Yan-wen LI Kun HAN Yan WANG Yan-ping

Affiliation:	(Shanxi Key Laboratory of Signal Capturing&Processing,North University of China,Taiyuan 030051,China;School of Arts,North University of China,Taiyuan 030051,China)

Abstract:

Keywords:	Music note library Mel frequency cepstrum coefficients Constant Q transform Feature fusion Softmax regression model BP neural network
本文献已被维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏