排序方式: 共有90条查询结果,搜索用时 171 毫秒
61.
基于小波图像融合的表情细节合成 总被引:2,自引:0,他引:2
表情细节是人脸表情变化时带来的皮肤纹理变化,表情细节合成有助于增强合成表情的真实感.提出了基于小波的图像融合方法,挖掘表情细节的纹理特征本质,并应用到表情细节的合成中,使合成的表情更加真实自然.为了满足表情细节个性化的需求,采用传统的小波变换和双树复小波变换,同时使用不同的融合算子,得到了丰富的表情合成.本方法不仅适用于灰度图像,通过颜色空间的转换还适用于彩色图像.最后还提出了基于聚类和图切割的最优替换区域选取方法,使得合成的表情细节区域与目标图像融为一体. 相似文献
62.
语音合成技术是人机言语交互中重要的媒介方式,基元选取算法一直是拼接式语音合成中的研究重点.在传统的语音合成中基于代价函数的拼接合成基元选取算法的基础上,将双音子(diphone)的稳定段边界模型应用到单词和音节中,最后使用3种基元模型的分层不定长选音算法,从语料库中优选出最佳合成基元序列拼接合成最终语音.该算法一方面利用分层统一的不定长选音策略,尽可能地选取具有更好韵律特性和声学连续性的较大基元,从而显著减少拼接点,将有可能发生协同发音或者切分错误的拼接点包含到更大的基元内部;另一方面通过稳定段切分修改传统拼接基元边界类型,充分利用了diphone的稳定段边界良好的拼接特性,从而提高了合成语音的连续性和自然度.评测结果显示,这种方法与传统diphone拼接合成方法相比,其合成效果有显著的提升. 相似文献
63.
64.
合成语音自然度客观测度 总被引:2,自引:1,他引:1
目前合成语音的自然度有待提高,论文根据目前的研究现状提出了一种合成语音自然度的客观评价方法,该方法主要从语音韵律特征的主要参数出发,计算同一发音人的自然语音和合成语音之间的基频、时长、音强等参数的差距,其中由于两种语音基频时间不匹配,所以采用DTW(Dynamic Time Warping)算法来对两种语音的基频进行了时间弯折对准。最后再将计算结果与主观评测(MOS)的结果进行比较。实验数据表明,论文提出的基频曲线失真测度与MOS之间具有很强的相关性,从韵律特征角度给出的评价结果能够衡量合成语音的自然度。 相似文献
65.
66.
基于结构助词驱动的韵律短语界定的研究 总被引:10,自引:5,他引:5
提高合成语音的自然度是汉语文语转换系统(CTTS)的核心任务,而韵律短语的界定扮演着重要的角色。本文通过分析虚词的特征,研究了结构助词在连续语流中的特点、地位,以及在韵律短语界定中的作用,得到了一组相应的规则和结论。 相似文献
67.
68.
本文介绍了音频合成技术的发展概况,语音合成中使用的关键技术与算法实现,音乐合成的基本原理及语言合成的具体方法,简要介绍了作者研制的汉字语文-语转换系统及其韵律修改。 相似文献
69.
70.
基于规则学习的韵律结构预测 总被引:11,自引:4,他引:11
韵律结构的分析和预测作为提高语音合成系统自然度的一个重要核心组成, 日益受到重视。本文提出了一种基于规则学习的汉语韵律结构预测方法, 该方法从人工韵律标注的语料库中抽取语言学特征和两级韵律结构标记, 构建了实例数据库(example database), 再利用规则学习(rule learning)算法从实例中自动归纳韵律短语预测规则。本文通过大量的实验挑选出对于汉语韵律结构预测最有效的特征, 采用和比较了两种典型的规则学习算法。同时, 对于实验结果给出了较为系统的评价参数。实践表明, 规则学习算法用于韵律结构预侧达到了90%以上的正确率, 优于目前其他方法的结果, 是一种行之有效的办法。 相似文献