基于CQT和梅尔频谱的带有人声的音乐风格转换方法 Music Style Transfer Method with Human Voice Based on CQT and Mel-spectrum期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于CQT和梅尔频谱的带有人声的音乐风格转换方法

引用本文：	叶洪良,朱皖宁,洪蕾.基于CQT和梅尔频谱的带有人声的音乐风格转换方法[J].计算机科学,2021,48(z1):326-330,363.

作者姓名：	叶洪良朱皖宁洪蕾

作者单位：	金陵科技学院软件工程学院南京211100

摘要：	近年来,生成对抗网络在图像风格迁移领域中表现优秀,然而其在音乐领域表现一般.现有的音乐风格迁移对带有人声的音乐的风格迁移效果不佳.为了解决这些问题,首先提取音乐的CQT特征和梅尔频谱特征,然后采用CycleGAN对CQT特征和梅尔频谱的联合特征做风格迁移,再通过WaveNet声码器来对迁移后的谱图进行解码,最终实现了带有人声的音乐的风格迁移.在公开数据集FMA上对所提模型进行评估,符合要求的音乐的平均风格迁移率达到了94.07％.与其他算法相比,该方法所产生的音乐的风格迁移率和音频质量都优于其他算法.
关键词：	生成对抗网络风格迁移音乐处理表征学习
Music Style Transfer Method with Human Voice Based on CQT and Mel-spectrum

YE Hong-liang,ZHU Wan-ning,HONG Lei.Music Style Transfer Method with Human Voice Based on CQT and Mel-spectrum[J].Computer Science,2021,48(z1):326-330,363.

Authors:	YE Hong-liang ZHU Wan-ning HONG Lei

Abstract:

Keywords:
本文献已被万方数据等数据库收录！