首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
马冰 《软件世界》2006,(10):43-43
随着科技的不断发展进步,各种终端设备的智能化和集成化程度越来越高,然而如何让我们从设备获取信息的方式越来越简单并且没有其他隐患,成为目前各种终端设备面临的问题。语音技术的应用,给人们带来了福音,它让这些问题都可以迎刃而解。语音技术包含语音合成和语音识别。语音合成将文本状态的信息转换成语音的形式输出。就像给设备安装上了嘴巴,你想让设备说什么,设备就可以说什么,解决了设备上的信息只能看不能听得问题。语音识别使得设备可以听懂用户的话,目前在嵌入式领域发展比较成熟的是命令词的识别。语音识别就像给设备安装了耳朵,让…  相似文献   

2.
针对传统的英语翻译系统存在无法准确识别说话者语音和语气的问题。设计一个基于语音识别和语气语音合成的英语翻译系统,该系统终端主要包括语音识别、语言翻译、语气识别、语气转换和语气语音合成模块。基于CVAE语气语音合成模型对语音识别和语言翻译的英语语句进行语气语音合成,以进行便携式英语翻译终端设计与实现。实验表明,基于CVAE的语气语音合成模型合成语气语音的基频曲线与原始语音间的误差仅为0.02,两者基频曲线十分接近。且在主观评价方面,本模型的语音合成自然度MOS评分为3.84分,方差仅为0.004;情感语气一致性平均打分为3.72,方差为0.002。综合分析可知,本模型可取得较好的语音生成效果,生成语音具备多样性和准确性。系统应用发现,本模型在系统中可提升英语翻译系统终端的语音识别和语气语音合成效果,系统性能优越。  相似文献   

3.
语音不仅包含说话人所要表达的语义信息,也蕴含着说话人所要表达的情感信息.语音情感识别是人机情感交互的关键,对语音情感的有效识别能够提升语音可懂度,使各种智能设备最大限度理解用户意图,提高机器人性化水平,从而更好地为人类服务.采用文献研究法从语音情感语料库、语音情感特征提取、语音情感模型的构建以及语音情感识别的应用等方面对其研究现状和进展进行了综述;同时,对其未来发展趋势也进行了展望.旨在尽可能全面地对语音情感识别技术进行详细分析,为相关研究人员提供有价值的学术参考.  相似文献   

4.
与Microsorft公司早先版本的办公软件相比,Office XP增加了不少新功能,语音功能就是其中的一种。在Office XP中,语音功能实际上包括两个方面:一个是语音识别,一个是语音合成,本文只对语音合成功能进行讨论。Office XP中只有Excel有语音合成功能,下面首先介绍如何在Excel中使用此功能,然后介绍如何把此功能移植到Word中。  相似文献   

5.
应用小波分析技术进行汉语语音基音频率分析的研究   总被引:1,自引:0,他引:1  
基音频率是语音信号中的一个重要信息.准确地进行基音频率的分析和提取一直是语音合成及语音识别等领域中所关注的核心问题之一.本文结合语音信号中基音频率的频域特征及汉语语音的特点.利用小波分析技术,对汉语语音中韵母的基音频率等信息的提取进行了研究.通过对试验结果的比较和分析,得到了相关的一些结论.  相似文献   

6.
人类的语音情感变化是一个抽象的动态过程,难以使用静态信息对其情感交互进行描述,而人工智能的兴起为语音情感识别的发展带来了新的契机。从语音情感识别的概念和在国内外发展的历史进程入手,分别从5个方面对近些年关于语音情感识别的研究成果进行了归纳总结。介绍了语音情感特征,归纳总结了各种语音特征参数对语音情感识别的意义。分别对语音情感数据库的分类及特点、语音情感识别算法的分类及优缺点、语音情感识别的应用以及语音情感识别现阶段所遇到的挑战进行了详细的阐述。立足于研究现状对语音情感识别的未来研究及其发展进行了展望。  相似文献   

7.
深度语音信号与信息处理:研究进展与展望   总被引:1,自引:0,他引:1  
论文首先对深度学习进行简要的介绍,然后就其在语音信号与信息处理研究领域的主要研究方向,包括语音识别、语音合成、语音增强的研究进展进行了详细的介绍。语音识别方向主要介绍了基于深度神经网络的语音声学建模、大数据下的模型训练和说话人自适应技术;语音合成方向主要介绍了基于深度学习模型的若干语音合成方法;语音增强方向主要介绍了基于深度神经网络的若干典型语音增强方案。论文的最后我们对深度学习在语音信与信息处理领域的未来可能的研究热点进行展望。  相似文献   

8.
语音合成技术日趋成熟,为了提高合成情感语音的质量,提出了一种端到端情感语音合成与韵律修正相结合的方法。在Tacotron模型合成的情感语音基础上,进行韵律参数的修改,提高合成系统的情感表达力。首先使用大型中性语料库训练Tacotron模型,再使用小型情感语料库训练,合成出具有情感的语音。然后采用Praat声学分析工具对语料库中的情感语音韵律特征进行分析并总结不同情感状态下的参数规律,最后借助该规律,对Tacotron合成的相应情感语音的基频、时长和能量进行修正,使情感表达更为精确。客观情感识别实验和主观评价的结果表明,该方法能够合成较为自然且表现力更加丰富的情感语音。  相似文献   

9.
针对现有矿山救护队应急救援管理系统存在数据录入实时性和交互性较差、应急处置消息传递手段落后等问题,将语音交互技术应用到矿山救护队应急救援管理系统中,实现了系统报警信息的智能录入和通知公告的语音自动播放等功能。采用语音识别技术智能录入接警信息,快速生成接警记录单,并实时跟踪接警处置情况;采用语音合成技术将通知公告和待办提醒通过语音提醒用户,避免工作延误。测试结果表明,该系统的平均语音识别率为90%以上,语音合成正确率为100%,通过语音识别方式录入接警信息速度明显快于手写和打字方式。现场应用结果验证了该系统的有效性和稳定性。  相似文献   

10.
针对手工输入查询要求的传统检索系统的不便,该文提出利用语音检索技术,设计开发了Voice Hotel宾馆信息查询系统,基本实现了人机语音对话的查询方式。该系统采用的语音处理技术有:1)基于HMM模型的语音识别,用以现实语音到文本的转换;2)PSOLA的语音合成技术,用以实现文本到语音的转换,完成对检索结果进行语音播报的功能。该系统的语音检索正确率达到85%。  相似文献   

11.
韵律特征是语音信号中情感信息的主要表征之一。为了更好地进行情感语音合成的研究,本文通过提取普通话情感语音的韵律特征进行分析,采用广义回归神经网络构建了一个情感语音韵律特征预测模型,并根据所提取的测试集数据文本语境信息进行韵律特征预测,实验获得了相应的结果。实验结果表明,情感语音韵律特征预测效果较好。  相似文献   

12.
本文描述了一个以火车售票和信息查询事项为对话主题的专人使用的连续汉语人机对话系统原型, 着重讨论语言理解和应答文生成, 这部分是连接语音识别和语音合成的纽带, 起着承上启下的作用。语言理解和应答文生成采用上下文无关文法(CFG), 结合黑板以及局部上下文相关(CSG), 对连续汉语语音识别输出的结果进行理解, 生成人机对话系统中的应答文, 作为语音合成的输入。利用堆栈技术处理不完全信息和信息证实, 使得该系统具有自动提问获取知识的能力和对关健信息进行确认的能力, 从而使人机对话能连续进行。语义处理提取动词等关键信息, 使该系统具有容错性。我们对时间的描述采用模糊数学方法处理, 以适应现实对话中不精确的时间表示。  相似文献   

13.
频谱分析技术在语音信号处理中得到了广泛应用。短时频谱分析是各种语音频域处理方法的基础,广泛应用于语音编解码、语音合成、语音识别等领域。通过时频分析理论,对语音短时频谱分析与合成进行理论推导,表明语音短时频谱分析与合成可以通过加窗和滤波语音信号实现,并据此提出具体算法,按照该算法处理实际语音数据。合成语音与原始语音相比,差异很小。  相似文献   

14.
语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术:VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法.可以提高噪音影响下的语音识别率。  相似文献   

15.
语音识别是一个多学科交叉的边缘学科,它需要语言学、心理学、工程和计算机等领域的专业知识.不仅要对语音识别和语音合成技术进行研究,还要对人在语音通道下的交互机理、行为方式等方面进行研究.  相似文献   

16.
语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术:VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法,可以提高噪音影响下的语音识别率。  相似文献   

17.
语音信号中包含着丰富的情感信息,通过对语言信号的分析来识别人的情感是当前一个十分活跃的研究课题。首先介绍了国内外语音情感识别的研究现状,然后分析了语音情感识别研究的关键理论与技术,最后在此基础上进行了总结并概括了语音情感识别研究领域的发展趋势。  相似文献   

18.
数据挖掘技术是近年来计算机领域的重要方向.文中的研究目的就是通过深入分析各种语音情感特征,找出某种特征对语音情感识别的贡献程度,并在数据挖掘技术中寻找适合的模型将有效特征加以利用. 分析和研究了多位科学家在进行语音情感分析过程中采用的方法和技术,通过总结和创新建立了语音情感语料库,并成功地提取了相关的语音信号的特征.后研究了基音频率、振幅能量和共振峰等目前常用的情感特征在语音情感识别中的作用,把数据挖掘中常用的决策树分类方法和语音信号的多个特征相结合,建立了语音情感识别模型,对语音情感数据进行了大量的实验,取得了较为满意的识别结果.  相似文献   

19.
主要介绍了如何利用语音交互技术来创建英语教学情景,并就其支持技术:语音识别、语音合成进行了探讨。  相似文献   

20.
固体语音电路经过近十年的发展,已经广泛地应用于各项领域,从倒车电路、语音报时钟、公共汽车报站器、电话留言机到会说话的仪表、家电、电脑记事本,到能够对话的玩具,门铃识别等装置,可以说五花八门、品种繁多。语音电路分为语音合成和语音识别两类。语音识别因语种、讲者差异带来的识别问题,目前还不能达到实用的目标,应用范围较窄,因此在没有特指的情况下,我们说语音电路多指语音合成电路,即语音录放电路。 OTP是英文(One-Time-programmable)的缩写,即“一次编程”,OTP语音电路是指一次性将语音内容写入一个已经封装好的成品IC中,以区别掩膜ROM。因为掩膜ROM要在半  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号