期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

谢怡宁黄金杰何勇军《北京邮电大学学报》2013,36(3):83-87

针对机器人的应用场合通常存在各种噪声干扰的问题,提出了一种基于稀疏编码的语音特征提取方法.利用稀疏编码能稀疏表示语音的特性,在梅尔频域对语音增强后提取特征,将稀疏去噪与语音特征提取相融合,实现了混噪语音的有效补偿.在预设场景中的实验结果表明,与现有特征提取方法相比,所提出的语音特征提取方法能有效降低噪声对语音特征的影响,提高机器人语音控制的性能. 相似文献

2.

基于特征值混和提升语音识别鲁棒性技术(英文)

张东谢存禧《陕西科技大学学报》2005,(6)

语音识别技术可以为要求双手同时作业的操作人员和残疾人提供一种便捷的控制方法。作者在文中提出了一种通过结合二阶频率滤波和RASTA技术来增强语音识别鲁棒性的方法,并将这种方法成功应用于机器人化护理床的控制系统中,增强了识别系统在医院、工厂等非稳定噪声环境下语音识别的鲁棒性。通过将HMM/GMM混合模型的传统Mel频率倒谱系数为特征值的识别系统与HMM/GMM混合模型的RASTA-FF2为特征值的识别系统进行比较,并分别在纯语音和带噪语音条件下进行测试,发现经过二阶频率滤波后的FF2特征值再经过RASTA滤波器滤波,特别是在非稳定噪声环境下,以RASTA-FF2为特征值的识别系统比传统的识别系统的识别率更高,这表明FF2特征值与RASTA滤波器技术相结合,一个作用于频域,一个作用于时间域,可以有效地消除语音信号中的不同噪声成份。相似文献

3.

语音识别中的抗噪声方法

崔屹张东《北京邮电大学学报》1998,21(2):10-14

在实验室环境中正确识别率很高的语音识别系统,在生产现场中的性能往往会大幅度下降,严重限制了语音识别技术的实际应用,针对邮政分拣中心的实际生产环境,对语音识别技术中的抗噪声问题进行了实验分析和研究,提出了几种在生产现场中具有较好效果的噪声补偿方法,并给出了部分实验结果。相似文献

4.

基于RASTA-FF2滤波降噪技术的语音识别

张东谢存禧《陕西科技大学学报》2005,23(6):34-39

语音识别技术可以为要求双手同时作业的操作人员和残疾人提供一种便捷的控制方法。作者在文中提出了一种通过结合二阶频率滤波和RASTA技术来增强语音识别鲁棒性的方法，并将这种方法成功应用于机器人化护理床的控制系统中，增强了识别系统在医院、工厂等非稳定噪声环境下语音识别的鲁棒性。通过将HMM／GMM混合模型的传统Mel频率倒谱系数为特征值的识别系统与HMM／GMM混合模型的RASTA—FF2为特征值的识别系统进行比较，并分别在纯语音和带噪语音条件下进行测试，发现经过二阶频率滤波后的FF2特征值再经过RASTA滤波器滤波，特别是在非稳定噪声环境下，以RASTA—FF2为特征值的识别系统比传统的识别系统的识别率更高，这表明FF2特征值与RASTA滤波器技术相结合，一个作用于频域，一个作用于时间域，可以有效地消除语音信号中的不同噪声成份。相似文献

5.

数字语音识别系统 总被引：1，自引：0，他引：1

郑展恒《桂林电子科技大学学报》2011,31(6):439-441

为了较好地实现数字语音的识别,运用隐马尔可夫理论研究数字语音识别系统,通过软件编程研究其在语音识别系统中的应用,在Matlab环境下该系统实现了汉语数字语音的识别.实验结果表明,其达到了较高的识别率. 相似文献

6.

MFCC和LPCC特征参数在说话人识别中的研究

李泽崔宣马雨廷陈俊宇《河南工程学院学报(自然科学版)》2010,22(2):51-55

特征提取是说话人识别系统中的一项关键技术,讨论了在说话人识别中语音特征的提取,详细介绍了求取MEL倒谱系数MFCC和线性预测倒谱系数LPCC的具体步骤和算法,并对MFCC和LPCC语音特征参数做出了理论分析和实验数据比较,通过实验论证了对于低频语音,采用MFCC参数的说话人识别在屏蔽噪音和抗噪声能力都优于采用LPCC参数的说话人识别. 相似文献

7.

变噪声环境下语音增强算法性能比较

范立侯强吴题李娟《武汉理工大学学报(信息与管理工程版)》2009,31(2)

语音增强是影响语音识别系统性能的重要成分.为了比较语音增强算法的性能,采用Matlab软件进行了数值仿真,对不同噪声环境下的语音用3种不同的方法进行降噪,采用信噪比、端点检测等方法来衡量降噪效果,并对几种增强算法的性能进行了比较分析.结果表明,在变噪声环境下短时谱MMSE法最佳,谱减法和维纳滤波法各有优点. 相似文献

8.

基于多核稀疏保持投影的多特征集典型相关分析的水下目标特征融合方法

杨宏晖伊淑珍《西北工业大学学报》2019,(1)

针对水下目标识别特征样本集高维小样本问题,提出了基于多核稀疏保持投影的多特征集典型相关分析的水下目标特征融合方法。该方法用多特征集典型相关分析算法对多域特征的整体相关程度进行定量分析,去除冗余和噪声特征,实现多域特征的融合,并利用多核稀疏保持投影算法,对提取的多域特征样本的稀疏重构性加以约束,增强了特征的判别能力。利用实测舰船辐射噪声数据验证基于核稀疏保持投影的多特征集典型相关分析的水下目标特征融合方法的有效性,与多特征集典型相关分析方法和核稀疏保持投影典型相关分析方法进行了对比,实验研究表明,提出的方法可以有效去除冗余和噪声特征,实现多域水下目标特征的融合,提高水下目标的识别正确率。相似文献

9.

基于SCHMM/ANN噪声背景下的语音识别系统设计 总被引：2，自引：0，他引：2

陈立伟赵春晖姜海丽《哈尔滨工程大学学报》2005,26(1):119-122

语音识别系统一般是将安静环境下训练得到的参数用于实际环境中, 当实际环境是安静的,语音识别系统的工作是令人满意的,然而,当实际环境中有噪声存在时,识别系统的性能就会下降.文中提出将自组织特征映射神经网络与半连续隐马尔可夫模型相结合,训练出适应噪声的隐马尔可夫模型的新方法.把该模型应用于小词汇量的孤立词语音识别系统.实验表明,该模型适合于对噪声背景下的语音进行识别.同传统的HMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2～12dB),识别率比传统HMM模型有明显提高. 相似文献

10.

噪声背景下语音识别特征参数选择研究

刘顺兰窦园园应娜《杭州电子科技大学学报》2011,(4):73-76

为提高语音识别系统的实用性与实时性,该文采用缺失特征分量的方法研究了美尔频率倒谱系数静态特征及其一阶差分各分量对识别率的影响.在不同信噪比情况下,分别对含白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声的语音进行了实验研究,结果表明:在保证系统有较高识别率的情况下,在低信噪比时,含白噪声的语音信号缺失美尔频率倒谱系数... 相似文献

11.

融合非线性幂函数和谱减法的CFCC特征提取

白静史燕燕薛珮芸郭倩岩《西安电子科技大学学报(自然科学版)》2019,46(1):86-92

为提高噪声环境下的语音识别准确率,提出一种改进的语音特征提取算法。该算法采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数,并在特征提取前端引入谱减法对信号进行增强,将提取到的新的特征及其一阶差分组成一种混合特征参数;再联合主成分分析对该混合特征进行降维,将最终得到的特征用于一个非特定人、孤立词、小词汇量的语音识别系统。实验结果表明:采用非线性幂函数提取的耳蜗滤波倒谱系数特征与传统的耳蜗滤波倒谱系数特征相比,明显提高了语音识别准确率;混合特征参数相比单一特征能达到更佳的语音识别性能;结合主成分分析后的特征集在信噪比为0dB时的识别正确率可达到88.10%。相似文献

12.

Algorithm for extraction of features of robot speech control in the factory environment

WANG Xiaohua YAO Pengchao MA Liping WANG Wenjie ZHANG Lei 《西安电子科技大学学报(自然科学版)》1996,47(2):16-22

In the real working environment,the mobile robots have a poor recognition performance to speech control commands due to the noise effect. Aiming at this issue,this paper proposes a new algorithm based on the gammatone frequency cepstral coefficient and the mixed feature extraction of the Teager energy operator. This algorithm replaces the common Mel filter with the Gammatone filter. In the process of extracting gammatone frequency cepstral coefficients,the Teager energy operator reflecting the energy of speech signal is added to form a new feature, with the dynamic characteristics of the speech signal considered. It is combined with the first-order difference parameters to form a mixed feature. And the principal component analysis is made to reduce the dimension,and the final mixed features are used to the speech recognition system for control command of the mobile robot. Experimental results show that,in the environment of the workshop noise and signal-to-noise ratio of 10dB,the recognition rate of mixed features is improved by 12.20% compared with the mel frequency cepstrum coefficient. The recognition rate of the mixed feature is increased by 1.02% when the dimension is reduced by principal component analysis. 相似文献

13.

基于自适应心理声学模型的智能语音识别系统

熊笑颜陈栩黄灿英陈艳《沈阳工业大学学报》2017,39(6):675-679

针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能. 相似文献

14.

侧扫声纳目标自动探测研究

朱殿尧卞红雨《长春邮电学院学报》2008,(6):627-631

为了解决水声图像因受到噪声、多途、混响的影响,使水声图像特征难以提取的问题,针对海底目标的识别,通过对图像处理算法的研究以及大量的实验分析,给出了侧扫声纳图像目标自动识别的有效方法。其中包括图像的增强、二值化、二值开闭操作、特征提取、特征计算及目标识别等内容。通过对面积特征的提取和计算实现了对水下目标的自动探测。相似文献

15.

一种基于小波包主成分分析的语音情感识别方法

朱宗宝王坤侠肖玲玲刘文静《安徽建筑大学学报》2017,25(5):35-39

在语音情感识别中,由于特征参数的提取直接影响到最终的识别效率,从原始语音信号中提取特征参数是非常重要的。但是本文中提取的特征维数太多,导致特征匹配时过于复杂,消耗系统资源,不得不采用特征降维的方法。本文主要是研究一种在小波包变换的基础上通过特征降维来提高语音情感识别效果的方法,为此本文在德国库EMODB的基础上,通过小波包变换提取出语音的情感特征参数,然后利用主成分分析法对特征参数进行降维,最后利用支持向量机进行训练和测试。通过实验,获得了较好的识别效果。相似文献

16.

基于二维ICA基于二维ICA变换的语音特征提取 总被引：1，自引：0，他引：1

邹欣李万龙刘琚 Peter Jancovic 《山东大学学报(工学版)》2007,37(4):85-88

独立成分分析 (ICA)方法已经被广泛地应用于语音信号处理中. 讨论了ICA方法在语音信号特征提取中的应用.ICA被应用在对数Mel滤波器组变换域中来代替常用的离散余弦变换，后者被应用来得到Mel倒谱系数(MFCC)特征.我们将应用一种新的方法即二维ICA方法来发掘语音信号的时域跟频域的信息，从而提高语音特征的效率跟噪声鲁棒性.这些特征被用于基于高斯混合模型的说话人识别应用中.仿真结果表明我们得到的时频二维特征优于传统的一维特征. 相似文献

17.

基于LPC全极点模型增强算法在高噪声背景下命令语音识别的应用

王承发孙立新李俊庆《哈尔滨工业大学学报》1998,(1)

针对语音和噪音的特点,提出在高噪声条件下,用ＬＰＣ全极点模型的增强算法,进行系统实现及比较和测试。系统在较高噪声背景下,该方法具有很好的去噪效果。相似文献

18.

基于DSP的嵌入式语音识别系统的研究与实现 总被引：3，自引：0，他引：3

贾克明陶洪久《武汉理工大学学报(信息与管理工程版)》2006,28(7):156-159

设计并实现了一个特定人、孤立词和小词汇量的嵌入式语音识别系统.系统硬件的核心芯片采用普遍使用的16位定点DSP芯片TMS320VC5416,软件上主要采用动态时间规整算法来实现语音识别.给出了系统整体的软硬件框架,并比较和分析了分别将线性预测倒谱参数和美尔频标倒谱参数作为语音特征参数时系统的性能,为语音识别的嵌入式应用提供了参考依据. 相似文献

19.

一种基于分带谱熵和谱能量的语音端点检测算法 总被引：3，自引：0，他引：3

李如玮鲍长春《北京工业大学学报》2007,33(9):920-924

语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难.信噪比下降,语音端点检测的正确率也随之下降,同时,噪声类型的变化影响端点检测的正确率.为此,提出了一种改进的、适合在电话语音城市名识别系统中应用的端点检测算法,并结合分带谱熵和谱能量形成了一个新的特征参数集,利用该参数集进行端点检测,弥补了分别采用分带谱熵和谱能量进行端点检测的缺陷,提高了检测性能. 相似文献