首页 | 本学科首页   官方微博 | 高级检索  
     

基于CQT和梅尔频谱的带有人声的音乐风格转换方法
引用本文:叶洪良,朱皖宁,洪蕾.基于CQT和梅尔频谱的带有人声的音乐风格转换方法[J].计算机科学,2021,48(z1):326-330,363.
作者姓名:叶洪良  朱皖宁  洪蕾
作者单位:金陵科技学院软件工程学院 南京211100
摘    要:近年来,生成对抗网络在图像风格迁移领域中表现优秀,然而其在音乐领域表现一般.现有的音乐风格迁移对带有人声的音乐的风格迁移效果不佳.为了解决这些问题,首先提取音乐的CQT特征和梅尔频谱特征,然后采用CycleGAN对CQT特征和梅尔频谱的联合特征做风格迁移,再通过WaveNet声码器来对迁移后的谱图进行解码,最终实现了带有人声的音乐的风格迁移.在公开数据集FMA上对所提模型进行评估,符合要求的音乐的平均风格迁移率达到了94.07%.与其他算法相比,该方法所产生的音乐的风格迁移率和音频质量都优于其他算法.

关 键 词:生成对抗网络  风格迁移  音乐处理  表征学习

Music Style Transfer Method with Human Voice Based on CQT and Mel-spectrum
YE Hong-liang,ZHU Wan-ning,HONG Lei.Music Style Transfer Method with Human Voice Based on CQT and Mel-spectrum[J].Computer Science,2021,48(z1):326-330,363.
Authors:YE Hong-liang  ZHU Wan-ning  HONG Lei
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号