期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于小波变换的鲁棒型特征提取及说话人识别 总被引：4，自引：0，他引：4

芮贤义俞一彪《电路与系统学报》2005,10(5):129-132

说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。相似文献

2.

基于多时间尺度复合子带噪声语音识别新方法

下载免费PDF全文

蒋文建韦岗《电子学报》2001,29(Z1):1829-1832

本文根据多时间尺度分析与子带方法,提出了一种多时间尺度复合子带的噪声环境下语音识别新方法.新方法在不同的时间尺度下分别进行子带特征提取和全带特征提取,并分别进行识别,然后在识别概率层相结合得到最终识别结果.本方法兼有多时间尺度方法和子带方法的抗噪性能.此外,进一步引入频谱差分方法提高语音特征的抗噪性能.对E-SET在NoiseX92下白噪声的识别实验表明,新方法具有良好的抗噪性能. 相似文献

3.

多智能体自组织语音识别

下载免费PDF全文

陈俊淇张晓雷《太赫兹科学与电子信息学报》2023,21(9):1163-1170

语音感知是无人系统的重要组成部分,已有的工作大多集中于单个智能体的语音感知,受噪声、混响等因素的影响,性能存在上限。因此研究多智能体语音感知,通过多智能体自组织、相互协作,提高感知性能非常必要。假设每个智能体输出一个通道的语音流条件下,本文提出一种多智能体自组织语音系统,旨在综合利用所有通道提高感知性能;并进一步以语音识别为例,提出能处理大规模多智能体语音识别的通道选择方法。基于Sparsemax算子的端到端语音识别流注意机制,将带噪通道权重置零,使流注意力具备通道选择能力,但Sparsemax算子会将过多通道权重置零。本文提出Scaling Sparsemax算子,只将带噪较强的通道权重置零;同时提出了多层流注意力结构,有效降低了计算复杂度。在30个智能体的无人系统环境下,基于conformer架构的识别系统实验结果表明,在通道数失配的测试环境下,提出的Scaling Sparsemax在仿真数据集上的文字差错率(WER)相比Softmax降低30%以上,在半真实数据集上降低20%以上。相似文献

4.

噪声环境下说话人识别的组合特征提取方法 总被引：1，自引：0，他引：1

芮贤义俞一彪《信号处理》2006,22(5):673-677

针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。相似文献

5.

分数傅里叶变换域上含噪语音的联合滤波

包永强赵力邹采荣《信号处理》2006,22(6):899-902

噪声是影响语音识别和说话人识别性能的主要因素,目前常用的降噪方法多是针对平稳噪声的,而针对非平稳噪声的降噪方法很少。而在实际环境中,通常的噪声是非平稳的。本文将含噪语音变换到分数傅立叶域上,提出了一种在分数傅立叶变换域上进行线性最优滤波和中值滤波的联合滤波降噪方法。实验结果表明,该方法对含非平稳噪声的语音的降噪效果明显优于维纳滤波,能够有效地降低非平稳噪声的影响,提高非平稳噪声环境下的语音识别和说话人识别性能。相似文献

6.

噪声环境下说话人识别性能的研究

张飞云蔡子亮盛胜我《电声技术》2007,31(6):41-43

为了提高噪声环境下说话人识别系统的识别性能,将基于听觉掩蔽效应的语音增强技术作为预处理器,对语音信号首先进行降噪处理,提高输入信号的信噪比。实验证明,经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。相似文献

7.

基于语音识别技术的机载短波应急通信

陈晨胡贝贝《电讯技术》2014,54(1)

通过分析作为机载远程通信主要手段的短波电台在强干扰及超远距离等极限条件下面临的失效风险,针对性地设计了基于语音识别技术的机载短波应急通信方案。该方案通过语音识别技术将语音信号转换为语义信息进行传输。采用提出的嵌入式命令词语音识别技术、说话人自适应技术和噪声鲁棒性语音识别技术提高语音识别的性能,保证基于语音识别技术的机载短波应急通信方法的实现,从而可以在上述情况下为飞行员提供应急通信保障。相似文献

8.

由局部能量确定可靠性加权的抗噪声语音识别方法

许超曹志刚《信号处理》2003,19(3):262-265

噪声情况下的语音识别是个挑战性的问题。目前的处理方法普遍需要估计噪声或者信噪比,从而其性能依赖于噪声估计的好坏。本文提出了一种基于语音信号局部能量的可靠性加权方法,该方法着眼于语音本身的结构,避免了对噪声的估计。另外,带噪语音识别的实验结果证明该方法能很好的提高识别系统的抗噪声性能。相似文献

9.

基于改进语音特征提取方法的语音识别 总被引：1，自引：1，他引：0

李建文张晋平《微电子学与计算机》2009,26(7)

在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值. 相似文献

10.

群延时谱参数在汉语数字语音识别中的应用

下载免费PDF全文

周峰俞一彪《信号处理》2017,33(9):1215-1220

汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果，传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略，先采用MEL谱参数基于HMM进行初级数字语音识别，然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明，通过多参数多级识别方法，数字“2”和“8”的识别率提高了8%，数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能，同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。相似文献

11.

Nonlinear cepstral equalisation method for noisy speech recognition

Lee L.-M. Chen J.-K. Wang H.-C. 《Vision, Image and Signal Processing, IEE Proceedings -》1994,141(6):397-402

The authors deal with the problem of automatic speech recognition in the presence of additive white noise. The effect of noise is modelled as an additive term to the power spectrum of the original clean speech. The cepstral coefficients of the noisy speech are then derived from this model. The reference cepstral vectors trained from clean speech are adapted to their appropriate noisy version to best fit the testing speech cepstral vector. The LPC coefficients, LPC derived cepstral coefficients, and the distance between test and reference, are all regarded as functions of the noise ratio (the spectral power ratio of noise to noisy speech). A gradient based algorithm is proposed to find the optimal noise ratio as well as the minimum distance between the test cepstral vector and the noise adapted reference. A recursive algorithm based on Levinson-Durbin recursion is proposed to simultaneously calculate the LPC coefficients and the derivatives of the LPC coefficients with respect to the noise ratio. The stability of the proposed adaptation algorithm is also addressed. Experiments on multispeaker (50 males and 50 females) isolated Mandarin digits recognition demonstrate remarkable performance improvements over noncompensated method under noisy environment. The results are also compared to the projection based approach, and experiments show that the proposed method is superior to the projection approach under a severe noisy environment 相似文献

12.

嵌入式语音控制选单系统的实现与应用

于春雪《电声技术》2012,36(1):55-59,73

采用ARM处理器$3C2440A构建嵌入式系统，利用音频芯片UDA1341TS对语音信号进行编解码，应用语音识别技术实现语音控制。介绍了系统设计原理和工作机制，并阐述了控制选单的软硬件设计方案和识别算法原理，给出测试方法。实验结果表明，系统能实现特定指令的语音控制，识别率高、实时性好，可适应复杂的工作环境。相似文献

13.

基于谱减的Robust电话语音识别方法 总被引：1，自引：0，他引：1

韩纪庆秦兵王承发《电声技术》2000,(12):35-37

谱减技术是语音增强的有效方法，并被成功地应用到了车辆等环境下的Ｒｏｂｕｓｔ语音识别中。文章对将谱减技术应用到电话语音识别中的加性噪声去除上进行了尝试。实验验证该方法有利于改进电话语音识别的性能，对不特定话音８４个孤立词的实验，误识率下降了２１．８％。相似文献

14.

基于概率DP匹配法的噪声环境下说话人识别方法的研究 总被引：1，自引：0，他引：1

王吉林赵力邹采荣《电声技术》2005,(8):47-49,66

提出了一种在噪声环境下利用复数语音帧段主分量特征输入的概率DP匹配的说话人识别算法。通过对噪吉环境下与文本无关的说话人识别实验，验证了这种方法的有效性。相似文献

15.

并行子带HMM最大后验概率自适应非线性类估计算法 总被引：1，自引：0，他引：1

孙暐吴镇扬刘海滨周琳《电路与系统学报》2005,10(6):20-24

目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化.本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提高识别系统的鲁棒性.本算法利用多种噪声和识别内容功率谱差异,以及噪声在不同频带上对HMM影响的不同,采用多层感知机(MLP)对噪声环境下最大后验概率进行非线性映射,以减少识别系统由于环境不匹配而导致的识别性能下降.实验表明:该算法性能明显优于最大后验线性回归算法和Sangita提出的子带语音识别算法. 相似文献

16.

自适应并行模型组合的鲁棒语音身份识别算法

下载免费PDF全文

李聪葛洪伟《信号处理》2018,34(7):867-875

由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环境与测试环境之间的不匹配现象,从而提高系统识别准确率和抗噪性能。首先,算法从测试语音中估计出噪声特征,然后用一个单高斯模型对噪声特征进行拟合得到噪声均值和协方差。最后,根据得出的噪声均值和协方差,调整训练好的高斯混合模型均值向量和协方差矩阵,使其尽可能地匹配测试环境。实验结果表明,该方法可以准确地重构干净语音的高斯混合模型参数,并且能够显著提高说话人识别的准确率,特别是在低信噪比情况下。相似文献

17.

低信噪比下基于FastIca和MMSE-LSA的语音识别

李世绍高勇《电声技术》2014,(1):62-65

针对在低信噪比环境下语音识别率较低的问题,提出了一种基于FastIca和MMSE-LSA相结合的算法。首先,用FastIca对低信噪比语音进行语音提取,再使用MMSE-LSA方法处理得到信噪比改善的语音信号。用0~9十个数字做孤立词语音识别。仿真实验证明,用本算法增强后的语音识别率达到80%以上,可以有效地提高低信噪比环境下语音识别率。相似文献

18.

基于频谱的语音识别研究——互相关卷积部分

唐艺明《电子质量》2013,(10):43-46

语音识别（speech Recognition）是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。该文通过采用互相关卷积算法,实现对韵母（a,o,e,i,u,ǖ）的识别进行了初步的研究和探讨,实现了在MATLAB环境下对韵母（a,o,e,i,u,ǖ）的语音识别,并针对语音识别系统的频谱与互相关卷积的主要特点做出了总结与分析。相似文献

19.

基于DDBHMM的数字语音识别

全刚肖熙《电声技术》2010,34(6):45-47

数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。相似文献

20.

语音识别的鲁棒性特征提取方法研究

魏勋耿志辉王晓攀《无线电工程》2010,40(8):59-61

训练环境和测试环境的不匹配是造成实际情况下语音识别性能下降的主要原因。在深入研究语音识别的噪声环境和Mel域倒谱系数(MFCC)流程的基础上,基于累计分布函数匹配思想,给出了3种通过减小训练环境和测试环境的不匹配度来提高系统在不同环境下适应性的鲁棒性特征提取方法,分析了它们的理论基础、基本算法,并在Aurora2.0数据库上进行了实现,验证了方法的有效性,为实际应用中如何选择语音识别系统提供了参考。相似文献