首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 671 毫秒
1.
储有亮  李梁 《声学技术》2021,40(6):815-821
为了解决人们在强噪声环境下,通过空气途径传递的语音信号会严重失真的问题,提出了一种基于深层双向长短期记忆-深度卷积神经网络(Deep Bidirectional Long and Short Term Memory-Deep Convolutional Neural Network,DBLSTM-DCNN)的骨导语音转气导语音的语音转换模型。该模型利用DBLSTM层收集和保存相邻连续帧的隐藏信息,再通过DCNN层来提取频域方面的特征信息,可以很好地解决由于骨导语音高频成份严重缺失导致的转换语音不够自然的问题。实验结果表明,该模型的语音质量感知评价(Perceptual Evaluation of Speech Quality,PESQ)、短时客观可懂度(Short-Time Objective Intelligibility,STOI)、对数谱距离(Log-spectral Distance,LSD)等客观评价指标均有良好的表现,证明了该模型在骨导语音转气导语音方面具有较好的转换效果。  相似文献   

2.
黄程韦  金赟  赵艳  于寅骅  赵力 《声学技术》2010,29(4):396-399
针对实用语音情感研究的需要,设计并且建立了诱发语音情感数据库。根据刺激评估表,设计了一种基于计算机游戏的情感诱发方式,首次针对汉语音的实用语音情感进行了情感数据的采集和情感语音库的建立。对烦躁、紧张和喜悦等三种具有实际应用意义的语音情感进行了有效的诱发,录制了情感语音数据,并进行了数据的检验与听辩测试。结果显示,采用计算机游戏诱发情感的方法能够有效地采集自然度较高的实用语音情感数据,为实用语音情感的特征分析与识别提供了必要的研究基础。  相似文献   

3.
口腔运动与人们的饮食规律息息相关,该文通过对口腔运动状态的分析识别来监测人们的饮食规律,以此来指导人们的饮食习惯。借助语音识别技术的思想和方法,分析识别口腔运动产生的骨导音,为提升识别效率,采用了传统的隐马尔可夫模型。基于隐马尔可夫模型建立了一套骨导音识别系统,在进行骨导音识别之前,通过分帧加窗、提取梅尔频率倒谱系数,对其进行模型训练;在识别过程中,找出与待测音频信号和模板库中匹配度最高的模型,以其模型输出结果作为最后的识别结果。该方法的识别结果可以达到 84%,实验结果表明该方法具有一定的可行性。  相似文献   

4.
陈雷  杨俊安  王龙  李晋徽 《声学技术》2016,35(2):146-154
大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函数更接近生物神经网络的工作方式,增强了模型的表征能力;同时引入Dropout策略对修正线性深度置信网络进行调整,避免节点之间的协同作用,防止网络出现过拟合。文章利用公开语音数据集进行了实验,实验结果证明了所提出的声学模型构建方法相对于传统方法的优越性。  相似文献   

5.
现有响度模型主要通过滤波器组在传递特性上模拟人耳感声特性,未能真实反映人耳的生理结构。基于新鲜人体颞骨标本微CT扫描影像,通过逆向成型技术及有限元法建立了基于真实生理结构的人耳模型,并基于该模型,研究外、中耳与人耳响度感知的关系。该模型主要包括耳道和中耳两个部分,通过镫骨、鼓膜脐部位移响应,镫骨速度传递函数及鼓膜处声压级对模型进行可靠性验证。最终,基于该模型,系统分析了经过外、中耳传声,传递到镫骨的镫骨底板输出位移、速度、能量与响度感知听阀曲线的关系。研究结果表明,镫骨底板输出的等速曲线及等能量曲线在中、高频段内与听阀曲线较接近,可以用于近似评估人耳在该频段内的响度感知效果。  相似文献   

6.
刘宁  梁奇兵  高晓兰 《声学技术》2019,38(2):170-175
蛙人水下语音通信机是蛙人进行水下行动和作业必不可少的装备,在军事和民用等领域受到越来越多的关注。首先介绍了国内外蛙人水下语音通信机产品和技术的研究现状和成果,然后对蛙人水下语音通信机领域发展面临的关键问题进行了详细讨论。指出了越来越多的基于数字信号处理技术的调制解调技术被运用到蛙人水下语音通信领域中,可有效降低水下蛙人语音使用中多途效应和海洋环境噪声等干扰因素,提高通话质量,并已成为主要的研究方向;在结构方面,蛙人水下语音通信机由分体式、大体积向模块化、小型化、低功耗和一体式转变,这也成为未来发展的趋势。  相似文献   

7.
金赟  赵艳  黄程韦  赵力 《声学技术》2010,29(1):63-68
为了研究耳语音情感识别,制定了耳语音情感数据库的制作流程和制作规范,设计并建立了一个包含4000个单词、5000条语句和600个段落的耳语音情感数据库。利用模糊数学中的隶属度函数和层次分析法对语句的有效性进行了检验,得到一个满足研究要求的耳语音情感数据库。利用库中的语料进行初步的耳语音情感识别,得知正常音语音情感识别所用的音长、能量等参数,在耳语音中仍然可以使用;而正常音的其它涉及基音的一些参数,不适用于耳语音,需要进行改进或者提取新的特征参数。  相似文献   

8.
王仕超 《硅谷》2010,(20):165-165,162
HTK是由剑桥大学开发的语音识别研究工具,此工具实现了语音识别中的诸多算法。我们可以利用该工具建立自己需要的语言模型。讲述如何通过从互联网上得到自己需要的语料,利用搜集的语料训练语言模型。Web信息搜索采用网络爬虫(Web Crawler或称Robot)的技术在万维网上自动漫游,根据其搜索目标尽量多地发现新内容。  相似文献   

9.
驾驶员语音增强质量的评价指标是保证语音增强算法性能的关键,而现有的语音增强质量评价方法不能准确地反映人对声音感知的主观性。针对上述问题,分析了言语可懂度指数对语音增强算法评价的适用性,并在某品牌汽车上进行实验。通过在汽车内建立均匀线性传声器阵列来对驾驶员语音进行信号采集,然后利用波束形成算法对阵列中不同传声器组合的语音信号进行增强,得到汽车在不同行驶速度时不同阵列组合的语音增强结果。使用信噪比和言语可懂度指数分别对实验得到的语音增强结果进行评价,结果表明言语可懂度指数更适合评价汽车内驾驶员的语音增强算法的性能。  相似文献   

10.
本文报导了全国骨导听力计量标准装置由骨导计量基准(GJJ0401)进行量值传递的实验方法.以及由此产生的国内省市级仿真■突装置的准确值。这套数值不仅将作为骨导听力标准的传递依据,且为我国骨导听力零级标准网的长期稳定性考核奠定了基础。  相似文献   

11.
语音增强在语音信号处理的前端非常重要,直接影响后端语音识别等效果。目前用神经网络进行单通道语音分离对于解决鸡尾酒会问题取得了很大的进步,但是用于复杂混合语音时分离效果仍不令人满意。针对单通道情形下的不足,使用多通道结构形成4个方向的超指向波束,结合神经网络算法实现对于指定方向的目标语音增强。仿真和实验结果表明,该算法相较于超指向波束形成算法和谱减法在多种评价指标上均有了明显的提升。  相似文献   

12.
基于改进的Kalman滤波的语音增强算法   总被引:1,自引:1,他引:0       下载免费PDF全文
余华  陈国明  赵力  邹采荣 《声学技术》2009,28(6):763-767
传统的kalman滤波方法在推导过程中假定观测噪声为白噪声。通常对于有色噪声需要用白噪声激励的方法予以模拟,并且需要以牺牲运算量作为代价。本文提出了一种改进的基于kalman滤波的语音增强算法,可以处理白噪声和有色噪声情况,不需要增加计算量,仿真结果表明了该算法对有色噪声的语音增强性能要优于基于传统kalman滤波方法。  相似文献   

13.
许铭  王冬霞  周城旭  张伟 《声学技术》2019,38(5):560-567
针对单通道非负矩阵分解语音增强算法忽略相位信息的问题,提出了一种改进的Kullback-Leibler复非负矩阵分解的语音增强算法。该算法考虑到传统非负矩阵分解算法在复频域中增强语音时目标函数的影响,构建了一种适用于复频域的Kullback-Leibler散度下的目标函数,同时采用频谱一致性约束相位谱补偿算法,使其重构出的语音数据相位谱得到进一步的调制。实验结果表明,对于不同的非平稳噪声,所提出的算法在不同信噪比下均取得了较好的语音增强效果,尤其在低信噪比条件下(0 dB以下)语音增强效果较为明显,性能评估指标的增量较高,较好地克服了由传统相位谱补偿算法造成的信源失真率较低的缺点,进一步减少失真,抑制背景噪声,实现语音增强。  相似文献   

14.
现有区别特征理论缺少相应语音声学参数的支持,尝试从声学参数的角度来建立普通话韵母的区别特征。首先根据语音参数距离,使用层次聚类方法生成韵母决策树。在此基础上,按开尾韵和有尾韵的韵母分类方案,分析其聚类逻辑,提出了基于参数的普通话韵母区别特征。在非介音韵母中,区别特征层次首先根据主元音音位的高低区分;而在介音韵母中首先通过介音进行区分。使用支持向量机检测区别特征,韵母由区别特征节点组成的搜索路径所确定。通过在区别特征树上的搜索过程实现韵母的检测分类,其中非介音韵母的平均准确率为93.1%,介音韵母为92%。  相似文献   

15.
介绍语音增强的原理和从强噪声背景中提取语音信号的方法,并对基于减谱法的增强算法、基于自适应滤波法的增强算法和基于小波变换的增强算法进行对比研究。鉴于语音增强算法的两个目标即增强语音的清晰度与理解度并不是相关联的,有时甚至相互矛盾,因此任何一个语音增强算法都是根据不同的应用做适当的选择和折衷。基于此,对三种算法进行仿真实验的比较研究,实验结果证明应用小波变换的语音增强算法比其它的方法更有效。  相似文献   

16.
基于深度学习的语音增强模型对训练集外语言语音和噪声进行降噪时,性能明显下降。为了解决这一问题,提出一种引入注意力机制的生成对抗网络(Generative Adversarial Network,GAN)语音增强迁移学习模型。在生成对抗语音增强模型的判别模型中引入注意力机制,以高资源场景下的大量语音数据训练得到的语音增强模型为基础增强模型,结合低资源场景下的少量语音训练数据,对基础增强模型进行权重迁移,提升低资源场景下语音增强模型的增强效果。实验结果表明,采用注意力机制的生成对抗语音增强迁移学习模型,对低资源场景下的带噪语音和集外噪声可以进行有效的降噪。  相似文献   

17.
张永锋  田勇  张阳 《声学技术》2015,34(1):51-53
抗噪连续语音识别是当前汉语连续语音识别的重要研究领域。采用通过度量连续语音帧之间频谱的稳定性,将连续语音切分成份,再将切分结果(无论时间长短)变换为与时间无关的大小固定的频谱空间特征,通过与模板库进行比较实现语音识别。新的频谱空间特征,与语音时长无关,同时表现出较好的抗噪声能力。在特定人连续语音识别测试系统中,取得了不错的识别效果。  相似文献   

18.
张建伟  陶亮  周健  王华彬 《声学技术》2015,34(5):424-430
噪声谱估计是单通道语音增强算法的关键步骤,当前大部分语音增强算法旨在提高语音质量,提高语音可懂度的算法却很少。在传统的单通道语音增强算法中,语音质量的提高往往是以牺牲语音的可懂度为代价的。对目前主流的几种噪声谱估计算法对语音可懂度影响进行分析。在不同噪声背景、不同信噪比情况下进行噪声谱估计,并采用谱减法对含噪语音信号作去噪处理,对比分析不同噪声、不同信噪比下增强前后语音的短时客观可懂度(Short-Time Objective Intelligibility,STOI)值,最后根据信噪比,对比分析了不同噪声环境下,语音增强前后语音能量高于噪声能量的时频块所占比例。实验表明,相比其他噪声估计算法,最小统计(Minima Statistics,MS)算法由于保留了更多的以语音能量为主的时频块,使得去噪后的语音有较高的可懂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号