排序方式: 共有90条查询结果,搜索用时 15 毫秒
71.
基于规则学习的韵律结构预测 总被引:11,自引:4,他引:11
韵律结构的分析和预测作为提高语音合成系统自然度的一个重要核心组成, 日益受到重视。本文提出了一种基于规则学习的汉语韵律结构预测方法, 该方法从人工韵律标注的语料库中抽取语言学特征和两级韵律结构标记, 构建了实例数据库(example database), 再利用规则学习(rule learning)算法从实例中自动归纳韵律短语预测规则。本文通过大量的实验挑选出对于汉语韵律结构预测最有效的特征, 采用和比较了两种典型的规则学习算法。同时, 对于实验结果给出了较为系统的评价参数。实践表明, 规则学习算法用于韵律结构预侧达到了90%以上的正确率, 优于目前其他方法的结果, 是一种行之有效的办法。 相似文献
72.
为了实时地生成自然真实的人脸表情,提出了一种基于MPEG-4人脸动画框架的人脸表情图像变形方法。该方法首先采用face alignment工具提取人脸照片中的88个特征点;接着在此基础上,对标准人脸网格进行校准变形,以进一步生成特定人脸的三角网格;然后根据人脸动画参数(FAP)移动相应的面部关键特征点及其附近的关联特征点,并在移动过程中保证在多个FAP的作用下的人脸三角网格拓扑结构不变;最后对发生形变的所有三角网格区域通过仿射变换进行面部纹理填充,生成了由FAP所定义的人脸表情图像。该方法的输入是一张中性人脸照片和一组人脸动画参数,输出是对应的人脸表情图像。为了实现细微表情动作和虚拟说话人的合成,还设计了一种眼神表情动作和口内细节纹理的生成算法。基于5分制(MOS)的主观评测实验表明,利用该人脸图像变形方法生成的表情脸像自然度得分为3.67。虚拟说话人合成的实验表明,该方法具有很好的实时性,在普通PC机上的平均处理速度为66.67 fps,适用于实时的视频处理和人脸动画的生成。 相似文献
73.
74.
韵律结构的自动预测是高自然度文语转换(TTS)系统的关键组成部分,直接影响到合成语音的自然度和表现力。该文建立了一个同时具有语法信息与韵律结构标注的汉语语料库。在这一语料库的基础上,对汉语的韵律结构组成、韵律结构与语法语义之间的关系进行了分析,并进行了预测试验。研究发现,汉语的韵律结构虽与语法结构不同,但是有着密切的联系,韵律结构可以通过语法结构进行预测。韵律结构除与语法结构有关之外,还要受到语句语义的制约。 相似文献
75.
着重介绍 离电话集成系统设计中的两种多线路同时控制技术以及该技术在实际开发应用中应注意的一个问题。 相似文献
76.
文语转换系统韵律置标方法的研究 总被引:3,自引:1,他引:2
韵律理解是言语合成的基础,本文分析了文语转换系统TTS(texe to speech)的研究现状,提出了韵律置标的方法,设计了韵律符号,并将其用于汉语TTS系统中,实现了重音和语调的模拟,改善了输出语音的自然度。 相似文献
77.
78.
Intel和IBM联合开发了台式多媒体的新模型,即视频制作演播模型。它 能同时处理多道视频音频信息,具有电视演播台同样的创作自由。其软件核心是AVK(Audio-Video Kernel)。它定义了新模型的体系结构和多媒体标准;支持窗口应用界面;提供低层次编程接口。与之相适应的多媒体新板是Action Media Ⅱ。该板基于DVI B系列视频处理器。 相似文献
79.
80.