首页 | 本学科首页   官方微博 | 高级检索  
     

基于正弦加噪声模型的说话人转换方法
引用本文:夏菁,尹俊勋,黄建成,黄锋.基于正弦加噪声模型的说话人转换方法[J].电声技术,2005(2):49-52.
作者姓名:夏菁  尹俊勋  黄建成  黄锋
作者单位:华南理工大学,电子信息学院,广东,广州,510641;摩托罗拉中国研究中心,上海,200041
摘    要:提出一种基于正弦加噪声模型的说话人转换方法,着重讨论通过修改音素段内的声学参数实现说话人的转换。通过修改基音频率和共振峰结构,该方法合成的语音有效地模拟了目标说话人的特性。听力测试表明,转换后的语音和目标说话人的语音相似度达到78.8%。与经典的LPC方法的对比实验验证了该法在合成语音质量方面的优越性。

关 键 词:说话人转换  正弦加噪声模型  音素  基音  共振峰
文章编号:1002-8684(2005)02-0049-04
修稿时间:2004年10月11

A Voice Conversion Scheme Based on Sinusoidal Plus Noise Model
XIA Jing,YIN Jun-xun,HUANG Jian-cheng,HUANG Feng.A Voice Conversion Scheme Based on Sinusoidal Plus Noise Model[J].Audio Engineering,2005(2):49-52.
Authors:XIA Jing  YIN Jun-xun  HUANG Jian-cheng  HUANG Feng
Affiliation:XIA Jing1,YIN Jun-xun1,HUANG Jian-cheng2,HUANG Feng1
Abstract:A voice conversion approach with a sinusoidal plus noise model is introduced and a parametric conversion algorithm based on phoneme segments is discussed in this paper. The modification of both pitch and formant structure contributed greatly to reproducing the target speaker's characteristics. Listening tests show that the similarity between target speech and modified one reached 78.8%. Compared to classical LPC approach, the experiments prove the superiority of this approach in terms of speech quality.
Keywords:voice conversion  sinusoidal plus noise model  phoneme  pitch  formant
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号