首页 | 本学科首页   官方微博 | 高级检索  
     

一种使用声调映射码本的汉语声音转换方法
引用本文:左国玉,刘文举,阮晓钢.一种使用声调映射码本的汉语声音转换方法[J].数据采集与处理,2005,20(2):144-149.
作者姓名:左国玉  刘文举  阮晓钢
作者单位:中国科学院自动化所模式识别国家重点实验室,北京,100080;北京工业大学电子信息与控制工程学院,北京,100022
基金项目:国家自然科学基金(60172055,60121302)资助项目,北京市自然科学基金(4042025)资助项目。
摘    要:在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成源、目标声调码本,根据时间对准原则建立了一个由源特征空间到目标特征空间的声调模式映射码本。声音转换实验评估了声调码本映射算法的性能。实验结果表明,该算法较好地反映出源说话人与目标说话人基频曲线之间的映射关系,改善了声音转换性能。

关 键 词:声音转换  声调映射码本  混合高斯映射
文章编号:1004-9037(2005)02-0144-06
修稿时间:2004年12月1日

Voice Conversion with Tone Mapping Codebook of Mandarin Speech
ZUO Guo-yu,LIU Wen-ju,RUAN Xiao-gang.Voice Conversion with Tone Mapping Codebook of Mandarin Speech[J].Journal of Data Acquisition & Processing,2005,20(2):144-149.
Authors:ZUO Guo-yu  LIU Wen-ju  RUAN Xiao-gang
Affiliation:ZUO Guo-yu 1,2,LIU Wen-ju1,RUAN Xiao-gang2
Abstract:With a mixture Gaussian mapping method for speech spectral envelope transformation, a Mandarin tone codebook mapping algorithm for the pitch conversion is proposed to improve the preference for target characteristics in the converted speech. The syllable pitch contours are first extracted from the source and target speech, and preprocessing and clustering operations are performed. A tone mapping codebook is obtained by associating the source codebook with the target one. Voice conversion experiments are performed to evaluate the tone codebook mapping algorithm. Results show that the method gives a good mapping between the source and target pitches, and improves the performance of voice conversion for Mandarin speech.
Keywords:voice conversion  tone mapping codebook  mixture Gaussian mapping
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号