首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 78 毫秒
1.
王骞  何培宇  徐自励 《信号处理》2020,36(6):902-910
针对现有深度神经网络语音增强方法对带噪语音的去噪能力有限、语音质量提升不高的问题,提出了一种基于奇异谱分析的深度神经网络语音增强方法。通过引入奇异谱分析算法对带噪语音进行预处理,以初步分离得到语音信号与噪声。接着将语音信号与噪声用于深度神经网络模型得训练,以得到性能更优的网络模型,从而使得本文方法具有更好的性能。最后在重建干净语音的环节中,同时使用神经网络估计得到的对数功率谱和带噪语音的对数功率谱,并加入了权重系数,使得本文提出的方法可以适应不同信噪比的情形,有效的去除背景噪声,降低语音信号的失真。本文通过仿真实验验证了该方法的有效性和鲁棒性。   相似文献   

2.
鲍长春  项扬 《信号处理》2019,35(12):1931-1941
语音增强是一种试图从噪声中分离出语音的技术,目的是提高语音的质量和可懂度。在过去的几十年里,人们提出了多种类型的语音增强方法,但这些方法在非平稳噪声环境中的表现还未达到最佳程度,因为他们没有充分利用语音和噪声的先验信息。近年来,随着深度学习的发展,深度神经网络已成为当下实现语音增强的主流方法,在改善语音质量和提升可懂度方面发挥了积极作用。本文从深度神经网络的结构出发,回顾了基于深度学习的单通道语音增强方法。首先,介绍了语音增强的背景;其次,详细描述了四种不同类型神经网络实现语音增强的方法;最后,给出了未来语音增强方法的建议和本文的结论。   相似文献   

3.
针对快速发展的语音情感识别技术,归纳总结了机器学习算法在语音情感识别领域的发展过程并预测语音情感识别技术的发展方向.首先针对语音情感的离散描述模型,总结语音情感识别模型训练和识别算法的一般过程;然后,根据机器学习算法的发展阶段,分别对比分析传统机器学习算法,深度神经网络、卷积神经网络、循环神经网络等深度学习算法与语音情感特征结合在情感识别中优缺点;最后,总结现阶段语音情感识别领域存在的问题,并预测该领域的发展方向.  相似文献   

4.
《现代电子技术》2019,(14):152-156
语音识别作为人工智能研究中不可或缺的一部分已经逐渐渗透到人们的日常生活中。针对传统语音识别方法不能很好地实现并识别复杂多变、非特定人语音的问题,文中提出利用在时间序列上关联性较强的循环神经网络(RNN)建立语音识别模型。考虑到语音信号丰富的时频信息表达,在特征提取环节进行改进,利用具有较好时频分辨率的小波变换(WT)取代快速傅里叶变换(FFT)作为该模型的输入;然后,采用随时间展开的反向传播算法(BPTT)进行特征学习与训练。在实验测试中,首先,对比分析了基于小波变换的特征提取对识别效果的影响;其次,通过与传统的HMM模型及BP神经网络的识别率做对比,验证RNN神经网络可提高语音识别准确率和稳定性。  相似文献   

5.
自从注意力机制在自然语言处理领域取得了巨大成功,其被引入了语音情感识别任务中,使各种语音情感识别模型的性能获得了提高。为了能在深度循环神经网络中更加高效地利用注意力机制,对传统的注意力机制进行了推广,提出了基于分段的注意力机制,并将其应用于深度循环神经网络中。在CASIA语音情感数据集上的实验结果证明,这一方法能够有效提高模型性能,并大幅提高模型训练速度。  相似文献   

6.
《电子世界》2018,(6):25-26
自从2012年Alex~([1])提出了深度卷积神经网络模型AlexNet,相关领域的算法创新使得神经网络学习走出了低谷期,并极大的推动了深度学习在图像识别,文字处理和语音识别等领域的广泛应用。而谷歌不断更新的Tensorflow深度学习开发平台使得快速搭建复杂的极深卷积神经网络成为了可能。本文将对近年来应用广泛的VGGNet和ResNet深度卷积神经网络的模型结构进行阐述和分析,并在谷歌Tensorflow开源框架上对此类模型进行重建,训练和对比。  相似文献   

7.
语音增强技术就是要抑制噪声,从带噪语音信号中尽可能的提取纯净的语音信号,提升其可懂度和清晰度。神经网络能够模拟人脑的工作原理,具有自学习能力和强大的非线性映射能力,故采取BP神经网络以及深度学习两种主流模型来展开研究,在此基础上研究了基于深度学习的反馈网络语音增强方法。通过对神经网络重复预训练和自学习,使之可以实现从带噪语音幅度谱到噪声幅度谱的非线性映射,同时训练了多个阈值和权重下的深度网络。通过真并对比其性能取得了很好的去噪效果。  相似文献   

8.
《中国数据通信》2012,(7):45-45
科大讯飞在北京隆重召开了“语音云”发布暨语音开发者大会,此次发布会以“语音点亮生活”为主题,不仅向我们展示了讯飞“语音云”近几年取得的世界成果,更让媒体和开发者看到了基于语音平台的发展前景。与此同时,科大讯飞还在发布了新一代“语音云”以及最新应用“讯飞语点”,并正式启动了面向开发者的应用创新大赛。希望能在国内掀起一股语音应用的开发高潮。  相似文献   

9.
深度神经网络已经在语音、图像、文本等信息处理领域取得了巨大的成果,本文简述其起源及成果,并介绍现代深度神经网络模型的三种基本结构:序列到序列神经网络、卷积神经网络、对抗式生成网络,最后展望了深度神经网络研究领域所面临的挑战。  相似文献   

10.
《中国新通信》2012,14(7):45
科大讯飞在北京隆重召开了"语音云"发布暨语音开发者大会,此次发布会以"语音点亮生活"为主题,不仅向我们展示了讯飞"语音云"近几年取得的世界成果,更让媒体和开发者看到了基于语音平台的发展前景。与此同时,科大讯飞还在发布了新一代"语音云"以及最新应用"讯飞语点",并正式启动了面向开发者的应用创新大赛。希望能在国内掀起一股语音应用的开发高潮。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号