首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 81 毫秒
1.
针对语音驱动人脸动画中如何生成随语音运动自然呈现的眨眼、抬眉等表情细节以增强虚拟环境的沉浸感的问题,提出一种可以合成表情细节的语音驱动人脸动画方法.该方法分为训练与合成2个阶段.在训练阶段,首先对富有表情的三维人脸语音运动捕获数据特征进行重采样处理,降低训练数据量以提升训练效率,然后运用隐马尔可夫模型(HMM)学习表情人脸语音运动和同步语音的关系,同时统计经过训练的HMM在训练数据集上的合成余量;在合成阶段,首先使用经过训练的HMM从新语音特征中推断与之匹配的表情人脸动画,在此基础上,根据训练阶段计算的合成余量增加表情细节.实验结果表明,文中方法比已有方法计算效率高,合成的表情细节通过了用户评价验证.  相似文献   

2.
叶静  董兰芳  王洵  万寿红 《计算机工程》2005,31(13):165-167,219
利用HMM的统计特性,对HMM模型结构进行改动,使其成为人脸语音动画合成中语音特征到图像特征的映射模型。通过一些必要的前期处理,就可以根据训练样本建立特定说话对象的HMM。使用该模型,加上一些必要的后期处理工作,就可以通过输入的语音信号合成语种无关的、平滑的、并富有真实感的人脸语音动画。  相似文献   

3.
人工心理模型驱动的人脸表情动画合成   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种人脸表情动画合成方法,该方法以人工心理模型输出概率值作为权重向量,通过因素加权综合法,控制表情动画模型参数。实验结果表明,该方法实现了心理状态对表情的实时驱动,合成的人脸表情动画真实、自然。  相似文献   

4.
基于机器学习的语音驱动人脸动画方法   总被引:19,自引:0,他引:19  
语音与唇动面部表情的同步是人脸动画的难点之一.综合利用聚类和机器学习的方法学习语音信号和唇动面部表情之间的同步关系,并应用于基于MEPG-4标准的语音驱动人脸动画系统中.在大规模音视频同步数据库的基础上,利用无监督聚类发现了能有效表征人脸运动的基本模式,采用神经网络学习训练,实现了从含韵律的语音特征到人脸运动基本模式的直接映射,不仅回避了语音识别鲁棒性不高的缺陷,同时学习的结果还可以直接驱动人脸网格.最后给出对语音驱动人脸动画系统定量和定性的两种分析评价方法.实验结果表明,基于机器学习的语音驱动人脸动画不仅能有效地解决语音视频同步的难题,增强动画的真实感和逼真性,同时基于MPEG-4的学习结果独立于人脸模型,还可用来驱动各种不同的人脸模型,包括真实视频、2D卡通人物以及3维虚拟人脸.  相似文献   

5.
针对表情识别中存在人脸semi-Markov models,HSMM)的人脸表情识别模型.该模型具有每个状态产生多个观察值、允许观察值缺省等特性,据此识别那些由于局部被遮挡或其它原因引起的丢失特征的人脸表情.实验结果表明,该模型提高了部分遮挡人脸的表情识别效果,同时对无遮挡人脸的表情识别也有所改善.  相似文献   

6.
提出了一种基于隐马尔可夫模型(HMM)与人工神经网络(ANN)相结合的情感语音识别系统的实现方法.并从情感语音资料的获取、情感语音特征的提取及情感语音识别等方面阐明了情感语音识别系统的建立过程.该系统实现了情感语音特征参数的提取、情感语音模型参数的训练及对录入的情感语音进行识别等功能.研究结果表明了该系统识别效果良好.  相似文献   

7.
MPEG-4提出的基于对象的编码格式,将人脸作为一个特殊的对象,为人脸建模和动画研究奠定了基础。本文通过对MPEG-4人脸动画标准的分析,提出基于MPEG-4人脸动画系统的设计思想和需解决的关键问题。  相似文献   

8.
提出一种基于时域基音同步叠加TD-PSOLA算法的情感语音合成系统。根据情感语音库分析总结情感规则,在此基础上利用TD-PSOLA算法对中性语音的韵律参数进行改变,并提出一种能够对基频曲线尾部形状改变的方法,使句子表达出丰富的情感。实验表明,合成出的语音具有明显的情感色彩,证明了该系统能以简单明了的方式实现情感语音的合成,有助于提高人脸语音动画表达的丰富性和生动性。  相似文献   

9.
随着三维数字虚拟人的发展,语音驱动三维人脸动画技术已经成为虚拟人交互的重要研究热点之一.其关键技术在于语音-视觉映射模型的建立以及三维人脸动画的合成.首先分析了音-视素匹配法和音-视觉参数映射两类方法的特点;之后阐述了目前三维人脸模型的建立方法,并依据三维人脸模型的表示方法不同,分析了不同运动控制方法的优缺点;然后阐述了语音驱动三维人脸动画的主观评价和客观评价方法;最后总结了语音驱动三维人脸动画技术的未来发展方向.  相似文献   

10.
赵黎 《福建电脑》2008,24(9):15-15
本文提出了一种新的情感模型用于人脸表情识别与合成中。该情感模型是基于已泛化的和非线性映射表现的五层神经网络,输入和输出层有相同数目的单元,在中间层可以实现特征的映射和情感空间的构造。从输入层到中间层的映射是情感识别,从中间层到输出层的映射是根据情感值进行表情合成。  相似文献   

11.
为了提高特征提取环节对表情识别率的影响,文中采用活动外观模型(AAM)提取整体形变信息,对眉毛及眼睛区域采用Gabor小波变换提取纹理信息,对嘴巴区域采用模板匹配法获取嘴部纹理信息,然后对提取的各个特征采用离散的隐马尔科夫模型得出6种表情概率,在识别阶段根据每个特征对6种表情的贡献权值分别进行特征加权融合,最后选择最大概率的表情作为表情识别结果。通过对10位女性6种表情图像进行训练实验,该方法有着良好的识别率。  相似文献   

12.
Kinect驱动的人脸动画合成技术研究   总被引:1,自引:0,他引:1  
三维人脸动画合成技术可以应用于虚拟现实、角色控制等多个领域。为此,提出一种基于Kinect的人脸动画合成方法。人脸跟踪客户端利用Kinect对用户的脸部表情进行跟踪识别,得到人脸表情动画参数,通过socket发送给人脸动画合成服务器,由人脸动画合成服务器查找基于MPEG-4标准的人脸动画定义表,控制人脸模型的变形,从而实时合成与用户表情相对应的三维人脸动画。实验结果表明,该方法能够在满足实时性要求的条件下合成高质量的三维人脸动画,同现有技术相比,结构简单、容易部署且具有较好的可扩展性。  相似文献   

13.
情感计算的一个重要任务是情感建模。提出了在人脸情感的视觉识别范畴中基于PAD理论的情感建模。根据Mehrabian提出的PAD 3维情感理论,建立了EBM(emotional block model)模型,进行了非典型情感识别的尝试。采用88特征点的Gabor特征和SVM算法在Cohn-Kanade数据集上进行了非典型情感识别以及典型情感识别的实验,并就典型情感的识别与基本情感模型比较。实验结果表明,无论是识别非典型情感还是典型情感,基于PAD理论建立的情感模型都是可靠的。在会聚度高的情感子空间上的识别率比会聚度低的情感子空间高。  相似文献   

14.
语音情感识别研究进展综述   总被引:6,自引:2,他引:6  
对语音情感识别的研究现状和进展进行了归纳和总结,对未来语音情感识别技术发展趋势进行了展望. 从5个角度逐步展开进行归纳总结,即情感描述模型、具有代表性的情感语音库、语音情感特征提取、语音情感识别算法研究和语音情感识别技术应用,旨在尽可能全面地对语音情感识别技术进行细致的介绍与分析,为相关研究人员提供有价值的学术参考;最后,立足于研究现状的分析与把握,对当前语音情感识别领域所面临的挑战与发展趋势进行了展望.侧重于对语音情感识别研究的主流方法和前沿进展进行概括、比较和分析.  相似文献   

15.
李海峰  陈婧  马琳  薄洪健  徐聪  李洪伟 《软件学报》2020,31(8):2465-2491
情感识别是多学科交叉的研究方向,涉及认知科学、心理学、信号处理、模式识别、人工智能等领域的研究热点,目的是使机器理解人类情感状态,进而实现自然人机交互.首先,从心理学及认知学角度介绍了语音情感认知的研究进展,详细介绍了情感的认知理论、维度理论、脑机制以及基于情感理论的计算模型,旨在为语音情感识别提供科学的情感理论模型;然后,从人工智能的角度,系统地总结了目前维度情感识别的研究现状和发展,包括语音维度情感数据库、特征提取、识别算法等技术要点;最后,分析了维度情感识别技术目前面临的挑战以及可能的解决思路,对未来研究方向进行了展望.  相似文献   

16.
为了较好地实现数字语音识别,运用隐式马尔科夫理论研究数字语音识别系统,通过软件编程研究其在语音识别系统中的应用。在VC++6.0环境下,该系统实现了汉语数字语音的识别。实验结果表明,其达到了较高的识别率。  相似文献   

17.
具有真实感的三维人脸动画   总被引:10,自引:0,他引:10       下载免费PDF全文
张青山  陈国良 《软件学报》2003,14(3):643-650
具有真实感的三维人脸模型的构造和动画是计算机图形学领域中一个重要的研究课题.如何在三维人脸模型上实时地模拟人脸的运动,产生具有真实感的人脸表情和动作,是其中的一个难点.提出一种实时的三维人脸动画方法,该方法将人脸模型划分成若干个运动相对独立的功能区,然后使用提出的基于加权狄里克利自由变形DFFD(Dirichlet free-form deformation)和刚体运动模拟的混合技术模拟功能区的运动.同时,通过交叉的运动控制点模拟功能区之间运动的相互影响.在该方法中,人脸模型的运动通过移动控制点来驱动.为了简化人脸模型的驱动,提出了基于MPEG-4中脸部动画参数FAP(facial animation parameters)流和基于肌肉模型的两种高层驱动方法.这两种方法不但具有较高的真实感,而且具有良好的计算性能,能实时模拟真实人脸的表情和动作.  相似文献   

18.
本文介绍了语音情感识别领域的最新进展和今后的发展方向,特别是介绍了结合实际应用的实用语音情感识别的研究状况。主要内容包括:对情感计算研究领域的历史进行了回顾,探讨了情感计算的实际应用;对语音情感识别的一般方法进行了总结,包括情感建模、情感数据库的建立、情感特征的提取,以及情感识别算法等;结合具体应用领域的需求,对实用语音情感识别方法进行了重点分析和探讨;分析了实用语音情感识别中面临的困难,针对烦躁等实用情感,总结了实用情感语音语料库的建立、特征分析和实用语音情感建模的方法等。最后,对实用语音情感识别研究的未来发展方向进行了展望,分析了今后可能面临的问题和解决的途径。  相似文献   

19.
研究了情绪的维度空间模型与语音声学特征之间的关系以及语音情感的自动识别方法。介绍了基本情绪的维度空间模型,提取了唤醒度和效价度对应的情感特征,采用全局统计特征减小文本差异对情感特征的影响。研究了生气、高兴、悲伤和平静等情感状态的识别,使用高斯混合模型进行4种基本情感的建模,通过实验设定了高斯混合模型的最佳混合度,从而较好地拟合了4种情感在特征空间中的概率分布。实验结果显示,选取的语音特征适合于基本情感类别的识别,高斯混合模型对情感的建模起到了较好的效果,并且验证了二维情绪空间中,效价维度上的情感特征对语音情感识别的重要作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号