期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

谢怡宁黄金杰《哈尔滨理工大学学报》2013,18(4)

说话人识别系统不可避免地会受到噪声的影响,导致性能急剧降低,针对这一问题采用感知最小方差无畸变响应(PMVDR)技术,提出了一种新的语音特征提取方法.该特征基于平移差分倒谱算法,成功地融入了说话人语音的长时信息.所提取的特征不仅在干净环境下能取得良好性能,而且在混噪语音以及信道失配等声学条件下也优于目前主流的特征.在YOHO数据库和ROSSI数据库上的实验结果表明,新特征在噪声和信道畸变的情况下能有效提高识别系统的鲁棒性. 相似文献

2.

基于HMM/ANN混合模型的带噪语音识别 总被引：1，自引：0，他引：1

齐爱学王洪刚《杭州电子科技大学学报》2007,27(3):17-20

对于含噪语音信号的有效特征提取是语音识别至关重要的一步.该文提出了利用小波调制尺度对语音进行特征提取,结合隐马尔可夫和人工神经网络混合模型进行识别的方法,可进一步反映语音信号的动态特性、增强抗干扰能力和提高识别率.实验证明,该模型适合于对噪声背景下的语音进行识别,同传统的HMM模型相比,具有更好的抗噪鲁棒性,在信噪比较低情况下,识别率比传统的HMM模型有明显的提高. 相似文献

3.

语音特征增强方法综述

何勇军付茂国孙广路《哈尔滨理工大学学报》2014,(2):19-25

经过数十年的发展语音识别取得了长足进步,但各种语音识别系统的性能仍然难以满足现实应用的需求.造成这种情况的一个重要原因在于目前的系统仍然难以适应各种噪声环境.因此,增强语音识别系统的噪声鲁棒性是推动其走向现实应用的关键.系统地阐述了特征增强类方法的国内外研究现状,介绍了信号增强、从听觉层面或可区分层面的提取特征、特征归正和特征补偿等方法,分析了他们存在的局限性.在此基础上,分析了稀疏编码与语音特征增强的基本问题和研究现状,提出了稀疏编码在语音特征增强方面的需要解决的问题,为从事鲁棒语音识别的研究者提供参考. 相似文献

4.

区分性联合稀疏字典交替优化的语音增强

贾海蓉王卫梅王雁裴俊华《西安电子科技大学学报(自然科学版)》2019,46(3):74-81

在联合稀疏字典的语音增强中,由于联合字典的相似性,导致稀疏重构阶段产生语音和噪声混淆进而产生语音失真问题。针对此,在训练阶段提出一个费希尔准则下的目标函数。该函数包含了语音和噪声的区分约束项,并用与信号变化相关的平衡因子去调整各项权值,为尽可能减小混淆误差提供了保障;同时,为了能使目标函数收敛,设计了一种交替优化字典和稀疏系数的算法,迭代寻找所需的字典和稀疏系数,完成语音字典和噪声字典的输出,得到具有非相似即区分性能较好的联合字典。在增强阶段,将带噪语音信号在联合字典上进行稀疏表示,并估计出语音幅度谱和噪声幅度谱。最后,结合维纳滤波器和理想二值掩模的优点,提出了新的软掩模滤波器,进一步消除了残余噪声。通过对不同信噪比的带噪语音进行实验,新算法得到的语音信噪比和听觉感知评价都较高,验证了新算法在提高语音性能方面的有效性。相似文献

5.

利用子空间改进的K-SVD语音增强算法

郭欣贾海蓉王栋《西安电子科技大学学报(自然科学版)》2016,43(6):109-115

在低信噪比的情况下,稀疏表示无法将纯净语音完全从带噪语音中分离出来,针对此问题提出了一种利用子空间改进的K奇异值分解语音增强算法．首先,利用子空间最优估计器跟踪噪声; 其次,通过K奇异值分解算法对噪声进行训练,构建出噪声字典; 最后,用K奇异值分解算法训练语音字典．在训练过程中,如果某个原子对应的稀疏系数低于设定的阈值,并且该原子可在训练得到的噪声字典中找到,就把该原子对应的稀疏系数设为零,即可达到去噪的目的．仿真结果表明,改进算法去除白噪声和babble噪声的效果显著,有效提高信噪比和减少语音失真,同时,该算法也可以很好地应用于消除随机噪声．相似文献

6.

水下目标信号的结构化稀疏特征提取方法

陆晨翔王璐曾向阳《哈尔滨工程大学学报》2018,(8)

为了提取具有噪声鲁棒性的水下目标信号特征用于水下目标识别,通过分析实测水下目标辐射噪声的时频谱,发现其时频谱中往往存在稀疏分布的具有目标区分性信息的强能量窄带线谱。结合稀疏分解理论,利用窄带线谱的结构化稀疏特点,提出一种稀疏特征提取方法。该特征提取方法借助稀疏贝叶斯学习模型,利用相邻帧样本间的相关性信息,能够有效增强窄带线谱成分,提高特征的噪声鲁棒性。并用一组实测数据对该特征的分类性能进行了测试,结果表明该特征在训练样本和测试样本噪声条件不匹配的情况下,能够保持较高的识别正确率,是一种具有噪声鲁棒性的特征。相似文献

7.

一种新的基于小波变换的语音消噪方法 总被引：1，自引：0，他引：1

龙东李从清孙立新戴士杰《河北工业大学学报》2008,37(3):43-47

提出一种新的语音消噪处理方法:二次小波分解全局阈值法.该方法不同于传统阈值消噪方法,首先对语音信号高频部分做了二次分解,然后应用阈值消噪的方法对信号进行消噪处理.该方法在MATLAB上进行了模拟实验.试验结果表明该种方法鲁棒性很好,提高了信噪比,去除了大部分噪声,同时有效信号的能量也相当完整地保留下来,能够很好地解决噪声对语音信号的干扰问题. 相似文献

8.

一种基于信号稀疏表示的语音去噪新方法

韩卫丽邹建成李建伟《北方工业大学学报》2013,25(3)

由于小波阈值在语音去噪中阈值的单一性,本文提出了一种基于稀疏表示理论的新的去噪算法.该算法首先用K-SVD字典学习得到信号在字典下的稀疏表示,其次用形态成分分析(Morphological Component Analysis,MCA)将语音信号分为高幅部分和低幅部分,最后用重构方法对各部分语音信号进行重构及合成.通过实验仿真,并与小波阈值去噪方法比较,本文所提方法的去噪效果更好,鲁棒性更强. 相似文献

9.

一种基于生成对抗网络的语音去噪方法

王华锋王贵显《北方工业大学学报》2019,31(5)

本文提出了维纳滤波算法和生成对抗网络相结合的语音去噪方法.首先用维纳滤波算法对带噪声语音信号进行预处理,提高语音信号的识别度,然后将预处理后的语音信号作为深度学习生成对抗网络的输入,进一步去除噪声信号.实验结果表明,本文提出的去噪方法将带噪声语音信号的分段信噪比从4. 83 db提升到了5. 09 db,去噪效果较为明显. 相似文献

10.

基于稀疏神经网络的说话人分割

马勇鲍长春《北京工业大学学报》2015,(5):662-667

提出一种基于稀疏神经网络的说话人分割方法,利用稀疏的单隐层神经网络提取语音的超矢量特征中说话人因子特征,然后通过K均值聚类得到每帧语音的标号来分割不同说话人,在稀疏网络的训练过程中引入了dropout技术以克服过拟合问题.在TIMIT语音数据库构成的多说话人语音数据上的实验结果表明:通过增加稀疏网络中隐层节点的个数可以提高说话人分割的效果,与贝叶斯信息准则(Bayesian information criterion,BIC)方法和稀疏自编码网络方法相比,所提基于稀疏神经网络的说话人分割方法的性能有明显提高. 相似文献

11.

基于稀疏滤波神经网络的智能调制识别

李润东李立忠李少谦宋熙煜何鹏《电子科技大学学报(自然科学版)》2019,48(2):161-167

针对传统调制识别中特征提取依赖人工经验的问题,该文提出了一种基于抗噪预处理及稀疏滤波卷积神经网络的智能通信调制识别算法。该算法将调制信号的循环谱作为卷积神经网络的输入图像,并引入低秩表示算法去除循环谱图中的噪声及干扰。在有监督训练卷积神经网络之前,该文设计了一种新型的稀疏滤波准则对网络进行无监督的逐层预训练,从而提升了泛化性能。仿真表明算法在信噪比为0 dB时仍可达94.2%的识别准确率,优于传统方法及相关深度学习方法。相似文献

12.

用于语音端点检测的鲁棒性特征提取新方法 总被引：1，自引：0，他引：1

赵彦平赵晓晖《吉林大学学报(工学版)》2006,36(1):77-0081

针对实际噪声环境中的语音端点检测问题,提出了一种适用于不同噪声类型的鲁棒性特征提取方法。该方法把基音检测中的循环平均幅度差函数应用到端点检测的特征提取中,并与基本的谱熵相结合,具有适用范围广和不需要噪声先验知识的优点。仿真实验验证结果表明:该特征对于多种类型的噪声有明显的抑制作用,并且在低信噪比时仍然有效。相似文献

13.

基于自适应心理声学模型的智能语音识别系统

熊笑颜陈栩黄灿英陈艳《沈阳工业大学学报》2017,39(6):675-679

针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能. 相似文献

14.

Algorithm for extraction of features of robot speech control in the factory environment

WANG Xiaohua YAO Pengchao MA Liping WANG Wenjie ZHANG Lei 《西安电子科技大学学报(自然科学版)》1996,47(2):16-22

In the real working environment,the mobile robots have a poor recognition performance to speech control commands due to the noise effect. Aiming at this issue,this paper proposes a new algorithm based on the gammatone frequency cepstral coefficient and the mixed feature extraction of the Teager energy operator. This algorithm replaces the common Mel filter with the Gammatone filter. In the process of extracting gammatone frequency cepstral coefficients,the Teager energy operator reflecting the energy of speech signal is added to form a new feature, with the dynamic characteristics of the speech signal considered. It is combined with the first-order difference parameters to form a mixed feature. And the principal component analysis is made to reduce the dimension,and the final mixed features are used to the speech recognition system for control command of the mobile robot. Experimental results show that,in the environment of the workshop noise and signal-to-noise ratio of 10dB,the recognition rate of mixed features is improved by 12.20% compared with the mel frequency cepstrum coefficient. The recognition rate of the mixed feature is increased by 1.02% when the dimension is reduced by principal component analysis. 相似文献

15.

基于特定方向多尺度稀疏编码的手掌静脉特征识别方法

马欣景晓军《北京邮电大学学报》2017,40(5):98-105

为提高手掌静脉特征识别的准确率和效率,提出了基于特定方向多尺度稀疏编码(DMSC)方法.首先计算全局方向和局部方向,然后利用多尺度Gabor对划分的子区域进行独立的多尺度方向滤波,并使用稀疏编码方法进行特征提取,利用外形编码产生特征矩阵,使用标准化汉明距离方法对特征矩阵进行相似性判断.实验结果表明,DMSC方法的类间区分性较好,识别力和效率高于现有的手掌静脉识别方法. 相似文献

16.

采用多特征联合学习的噪声稳健HRRP识别方法

李龙刘峥《西安电子科技大学学报(自然科学版)》2018,45(4):57-62

为提高低信噪比条件下雷达目标高分辨一维距离像的识别性能,提出一种采用多特征联合学习的噪声稳健目标识别方法．该方法利用核函数实现对稀疏与低秩的联合表示,用来提取目标高分辨一维距离像的局部特征与全局特征．在训练阶段,利用联合可分性分析多分类器综合结构字典学习方法对特征提取字典进行优化,从而提高特征向量的可分性;在测试阶段,利用对消原理对噪声进行自适应抑制,实现噪声干扰下的稳健识别．利用实测数据进行实验,结果表明该方法可有效地对被噪声污染的目标高分辨一维距离像进行恢复,并提高低信噪比下的目标识别准确率,且满足实际应用中的实时性要求．由此可见,该方法可以有效地提高高分辨一维距离像目标识别系统在低信噪比下的总体性能．相似文献

17.

噪声背景下语音识别特征参数选择研究

刘顺兰窦园园应娜《杭州电子科技大学学报》2011,(4):73-76

为提高语音识别系统的实用性与实时性,该文采用缺失特征分量的方法研究了美尔频率倒谱系数静态特征及其一阶差分各分量对识别率的影响.在不同信噪比情况下,分别对含白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声的语音进行了实验研究,结果表明:在保证系统有较高识别率的情况下,在低信噪比时,含白噪声的语音信号缺失美尔频率倒谱系数... 相似文献

18.

基于DTW 和EMD的孤立词语音识别研究

徐必伟苏成利杨微曹江涛《辽宁石油化工大学学报》2018,38(1):74-78

针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。相似文献

19.

基于二维ICA基于二维ICA变换的语音特征提取 总被引：1，自引：0，他引：1

邹欣李万龙刘琚 Peter Jancovic 《山东大学学报(工学版)》2007,37(4):85-88

独立成分分析 (ICA)方法已经被广泛地应用于语音信号处理中. 讨论了ICA方法在语音信号特征提取中的应用.ICA被应用在对数Mel滤波器组变换域中来代替常用的离散余弦变换，后者被应用来得到Mel倒谱系数(MFCC)特征.我们将应用一种新的方法即二维ICA方法来发掘语音信号的时域跟频域的信息，从而提高语音特征的效率跟噪声鲁棒性.这些特征被用于基于高斯混合模型的说话人识别应用中.仿真结果表明我们得到的时频二维特征优于传统的一维特征. 相似文献