共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
屈瑾 《自动化与仪器仪表》2023,(1):221-225
针对于当前语音信号的复杂性,和外界噪音的干扰,导致语音交互系统难以实现较为连续交互这一问题,采用由语音识别、单轮交互、多轮交互、语音合成这四个模块构成的基于语音识别的人机交互系统,在语音识别模块中,语音特征信号提取采用了MFCC特征提取方法,采用了深度算法进行构建声学模型。在多轮交互模块中,采用了GPT-2模型来实现了人机交互中的长对话。结果表明:该语音交互系统可以精准地提取出语音中的所需特征,然后进行有效的语音识别,DNN-HMM模型进行语音识别的WER值为4.11,识别时间短,最后合成出了清晰自然的语音。该结果证明此语音交互系统具有可行性。 相似文献
3.
局域网并行处理在语音识别中的应用 总被引:1,自引:0,他引:1
在语音识别中,不论是训练语音识别系统,还是使用系统识别语音,都需要进行大量的数据处理,这使得语音识别的研究和实现都变的非常困难。本文提出一种基于局域网的分布式计算机系统的快速并行数据处理方法来实现语音识别的模型训练和语音的识别,不仅加 了训练和识别的速度,节约了大量的时间,而且降低了语音识别任务对硬件的要求,取得了满意的效果。 相似文献
4.
本文介绍了语音识别技术的一些基本概念,解释了语音数字化的原理,详细分析了语音识别系统的工,了后对语音听写软件的产品和应用作一综述。 相似文献
5.
语音是人们日常生活中高效、自然的交流方式之一。但是直到目前为止,语音交互方式在计算机技术上的应用还是比较少的。近年来,随着Ubiquitous Computing和便携式计算机的出现,再次对语音用户界面的应用提出了迫切的需求。而且语音识别、合成技术的发展也为语音交互界面的实现提供了技术基础。本文综合参考了国内外语音界面的一些应用系统实例以及语音这种独特的交流媒体的优点和局限性,总结了语音用户界面的适用环境和设计指导原则,并提出了对语音界面的发展展望。 相似文献
6.
7.
电力系统中的语音应用技术研究 总被引:2,自引:0,他引:2
随着电力市场的发展,电力系统对信息的处理能力进一步提高。从传统的语音报警到实时语音信息访问和语音控制,语音应用技术在电力系统中都得到应用。一种基于现有Internet基础构架的语音服务标准VoiceXML是网络与电话技术完美的结合,制定了通过语音对话访问Web服务和交互语音问答的传递标准。VoiceXML使得开发人员从底层开发脱离出来,而直接面向应用提供解决方案;用户可以通过计算机或者电话,用语音访问Internet服务。该文描述了电力系统中语音技术的应用,并着重于VoiceXML标准给出了语音在电力系统中的应用解决方案。 相似文献
8.
该文阐述了语音信号的特点,语音识别过程及技术,重点讨论了例谱技术及其在语音信号特征提取中的应用,并将自组织映射神经网络应用到语音识别中,提出了网络模型。 相似文献
9.
本文提出了一种基于正弦模型的语音编码技术,通过对语音频率,幅值和相位参数的分析处理,合成高质量的语音。在编码处理过程中,我们应用了语音叠加技术和频迹跟踪技术,以提高合成语音清晰度,实验结果表明,谝编码方式具有很好的顽健性,适合于不同来语的信号,使如带背景音乐的语音。 相似文献
10.
11.
介绍了语音信号处理的关键技术,论述了在语音识别与合成和多媒体数据库中基于内容的语音数据检索的应用特点,指出了建立分层次的语音特征表示将有利于语音特征提取和满足不同层次的应用需要。 相似文献
12.
几种无语音检测噪音估计方法的比较研究 总被引:1,自引:0,他引:1
噪音谱的估计是谱相减方法中关键的一环。传统的噪声谱的估计是通过对输入语音作语音检测,区分出纯噪声段,根据噪声段的频谱估计出噪声谱。该方法的准确性局限于语音检测算法的性能,在信噪比较低时,性能下降很快。近年来人们提出了多种不用语音检测的噪声估计方法,这些方法不区分语音和非语音段,在每一帧都进行噪声谱的更新。评估了几种无语音检测的噪音估计方法,比较了它们用于谱相减时在语音识别中的性能,提出了一种新的基于能量聚类的无语音检测噪音估计方法,通过实验验证了它的优良性能。 相似文献
13.
实际的语音以及语音中掺杂的噪声一般都是非平稳的。本文详细分析了TVAR(时变自回归模型)语音系统模型,把利用TVAR模型增强语音分解成卡尔曼滤波和粒子滤波两步,以减小运算量。同时在粒子滤波中,为克服粒子退化效应,引入了粒子重采样技术提高粒子滤波精度。实验证明,这种增强语音方法无需对语音分帧处理,无需要求噪声是否平稳,能很好地跟踪语音信号的非平稳性,对系统初始值设置不敏感,增强后的语音信号信噪比得到明显改善。 相似文献
14.
15.
16.
讨论了一些语音改变技术的应用场合,分析了语音改变的一般方法,并提出了一种新的针对PLAR(pseudo log arearatio)曲线进行变换的语音改变方法,从而使说话人的语音特征得到改变。该方法采用了基于音段和听觉的方法来改变语谱特征参数,算法简便,计算量少,便于实时处理。用该算法实现了语音通信中个人隐私的实时保护。 相似文献
17.
18.
19.
20.
提出一种噪声环境下具有鲁棒性的语音识别系统的设计方法。首先,简单介绍了在高噪声环境下语音识别所遇到的问题,随后,建立了描述噪声环境中语音的加性卷积干扰及非正常发音的飞行员语音仪器畸变模型,采用二次判头尾方法较好解决了噪语音端点检验困难的问题。 相似文献