首页 | 本学科首页   官方微博 | 高级检索  
     

基于双层码本的语音驱动视觉语音合成系统
引用本文:贾熹滨,尹宝才,孙艳丰. 基于双层码本的语音驱动视觉语音合成系统[J]. 计算机科学, 2014, 41(1): 100-104
作者姓名:贾熹滨  尹宝才  孙艳丰
作者单位:北京工业大学多媒体与智能软件技术北京市重点实验室 北京100124;北京工业大学多媒体与智能软件技术北京市重点实验室 北京100124;北京工业大学多媒体与智能软件技术北京市重点实验室 北京100124
基金项目:本文受国家自然科学基金(61070117),北京市自然科学基金(4122004)资助
摘    要:提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系。为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类,构造同时反映语音之间与视觉语音之间相似性的双层映射码本。数据预处理阶段,提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型,并在语音特征LPCC及MFCC基础上采用遗传算法提取视觉语音相关的语音特征模型。合成的视频中图像数据与原始视频中图像数据的比较结果表明,合成结果能在一定程度上逼近原始数据,取得了很好的效果。

关 键 词:双层码本  视觉语音合成  视觉语音特征  语音特征
收稿时间:2013-06-07
修稿时间:2013-08-20

Bi-level Codebook Based Speech-driven Visual-speech Synthesis System
JIA Xi-bin,YIN Bao-cai and SUN Yan-fen. Bi-level Codebook Based Speech-driven Visual-speech Synthesis System[J]. Computer Science, 2014, 41(1): 100-104
Authors:JIA Xi-bin  YIN Bao-cai  SUN Yan-fen
Affiliation:Beijing Municiple Key Laboratory of Multimedia and Intelligent Software Technolgy, Beijing University of Technology,Beijing 100124,China;Beijing Municiple Key Laboratory of Multimedia and Intelligent Software Technolgy, Beijing University of Technology,Beijing 100124,China;Beijing Municiple Key Laboratory of Multimedia and Intelligent Software Technolgy, Beijing University of Technology,Beijing 100124,China
Abstract:
Keywords:Bi-level codebook  Visual speech synthesis  Visual speech feature  Speech feature
本文献已被 CNKI 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号