首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
针对传统的英语翻译系统存在无法准确识别说话者语音和语气的问题。设计一个基于语音识别和语气语音合成的英语翻译系统,该系统终端主要包括语音识别、语言翻译、语气识别、语气转换和语气语音合成模块。基于CVAE语气语音合成模型对语音识别和语言翻译的英语语句进行语气语音合成,以进行便携式英语翻译终端设计与实现。实验表明,基于CVAE的语气语音合成模型合成语气语音的基频曲线与原始语音间的误差仅为0.02,两者基频曲线十分接近。且在主观评价方面,本模型的语音合成自然度MOS评分为3.84分,方差仅为0.004;情感语气一致性平均打分为3.72,方差为0.002。综合分析可知,本模型可取得较好的语音生成效果,生成语音具备多样性和准确性。系统应用发现,本模型在系统中可提升英语翻译系统终端的语音识别和语气语音合成效果,系统性能优越。  相似文献   

2.
利用流媒体技术实现了一个在线语音合成系统.能在Internet/Intranet上提供实时的在线语音合成服务.系统采用了自适应技术适应网络状况的变化,并利用动态带宽分配技术管理客户端连接.保证了客户端连接的合成语音质量.系统可应用于语音邮件、语音校对、远程教学等领域.  相似文献   

3.
设计了一款基于Android手机的智能家居语音控制系统,通过Android手机的APP"语音"按钮实现一键式控制、智能应答,语音识别模块和语音合成模块整合到上位机上,减少了在语音识别和语音合成方面的硬件开支.下位机由STC89C52单片机、HC-06蓝牙模块、1602液晶显示模块及相应的电路组成.系统能够实现语音控制家居照明系统的开关、定时、状态查询与显示,电视的开关、音量和频道切换等功能.  相似文献   

4.
为了实现机器能够发出声音,本文设计并搭建了HTK(HMM-Tool-Kit)平台用来实现中文语音合成系统.采用参数合成法实现了文本到语音的合成,并对合成系统中的文本分析、韵律控制以及语音合成的实现技术进行了详细的论述.最后在Linux系统下搭建环境并进行实验,得到了预期的结果,实现了文本到语音的转化.  相似文献   

5.
韵律规则对于语音识别和语音合成具有重要意义,韵律特征参数的描述正确与否直接影响合成系统的输出.为了提高藏语语音合成中语音的自然度,本文研究了基于数据挖掘中的关联规则来发现韵律参数之间的相互关系,并基于关联规则算法获得藏语韵律参数中基频参数的变化规则,这些规则可以为藏语语音合成系统的选音提供帮助.  相似文献   

6.
用于车载无线终端的嵌入式语音处理系统   总被引:2,自引:0,他引:2  
刘志  刘加  刘润生 《计算机工程》2005,31(6):182-183,202
介绍了一个用于汽车环境的无线终端中利用语音技术进行语音识别拨号、语音合成和语音提示的系统.系统包括两个主要的模块:语音处理模块和蓝牙通信模块.其中蓝牙通信模块的功能是与具有蓝牙接口的手机进行通信,包括连接手机进行通话,下载手机内的电话号码本并传送给语音处理模块;语音处理模块完成语音识别、语音合成、语音提示、利用语音压缩编解码进行通话录放以及号码查询等功能,并控制整个系统的流程.该系统可以实现对手机电活本的下载并在线生成识别词表,识别词表容量可达1000词;在600词情况下的实验结果表明系统的识别率大于97%;系统基于SoC架构,具有高集成度和高稳定性的特点.  相似文献   

7.
简要分析中文语音合成的整个过程,并进行初步研究和实践,提出基于语音数据库的语音合成的程序实现方式.通过简单文本处理和注音后,从语音库中读取语音数据进行拼接,经语音合成后,封装成Wave格式送给播放程序进行播放.编程实现采用C#语言,调用Windows系统API函数进行开发,语音数据库存储使用SQL Server 2005.  相似文献   

8.
基于数据驱动方法的汉语文本-可视语音合成   总被引:7,自引:0,他引:7  
王志明  蔡莲红  艾海舟 《软件学报》2005,16(6):1054-1063
计算机文本-可视语音合成系统(TTVS)可以增强语音的可懂度,并使人机交互界面变得更为友好.给出一个基于数据驱动方法(基于样本方法)的汉语文本-可视语音合成系统,通过将小段视频拼接生成新的可视语音.给出一种构造汉语声韵母视觉混淆树的有效方法,并提出了一个基于视觉混淆树和硬度因子的协同发音模型,模型可用于分析阶段的语料库选取和合成阶段的基元选取.对于拼接边界处两帧图像的明显差别,采用图像变形技术进行平滑并.结合已有的文本-语音合成系统(TTS),实现了一个中文文本视觉语音合成系统.  相似文献   

9.
基于韵律特征参数的情感语音合成算法研究   总被引:1,自引:0,他引:1  
为了合成更为自然的情感语音,提出了基于语音信号声学韵律参数及时域基音同步叠加算法的情感语音合成系统.实验通过对情感语音数据库中生气、无聊、高兴和悲伤4种情感的韵律参数分析,建立4种情感模板,采用波形拼接语音合成技术,运用时域基音同步叠加算法合成含有目标感情色彩的语音信号.实验结果表明,运用波形拼接算法,调节自然状态下语音信号的韵律特征参数,可合成较理想的情感语音.合成的目标情感语音具有明显的感情色彩,其主观情感类别判别正确率较高.  相似文献   

10.
为了提高语音合成自然度和稳定性,提出HMM与深度神经网络相融合的,以维吾尔语作为实验语言的语音合成方法.基于深度学习的端到端语音合成方法存在生成速度慢、稳定性及可控性不够好,但是合成语音自然度高,而基于HMM的方法系统稳定性好,合成语音自然度不如端到端的方法.因此,系统前端部分利用HMM(马尔科夫模型)获取维吾尔语固有的语言特征,后端合成部分利用深度神经网络框架建立自回归模型.前端文本分析用HMM模型获取语言特征,后端合成用不同的神经网路模型,并进行了对比试验.最后对于实验结果进行了评测.实验结果验证了基于HMM+BiLSTM的语音合成方法的效果最好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号