期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杜俊戴礼荣王仁华《中文信息学报》2010,24(2):104-110

该文提出了一种新的用于鲁棒性语音识别的特征规整方法。我们观察到在噪声环境下语音特征分布的形状相比于干净环境变化很大,因此提出了一种称为倒谱形状规整的新方法,它是利用引入一个指数因子来达到对倒谱分布形状进行规整的目的。这种方法被证明在噪声环境下非常有效,特别是在低信噪比情况下。实验结果表明此新方法在aurora2和aurora3两个标准数据库上比经典的均值方差规整算法在词错误率方面分别有38%和25%的相对降低,并且倒谱形状规整也好于其它传统方法,比如直方图均衡和高阶倒谱矩规整方法。相似文献

2.

基于CHMM语音识别特征参数的选择方法

舒倩李银国《计算技术与自动化》2007,26(4):92-94

基于CHMM的语音识别系统识别率高,但却占用系统资源较大,从而限制了其在资源受限的实际应用环境的有效实现.针对上述问题,给出特征参数选择的理论依据,弥补以往研究仅从实验结果分析,缺少理论依据的不足;同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法.该方法能使系统在训练,识别过程中的计算量和存储量明显减小,同时系统误识率不会显著改变.这为资源受限的语音识别系统,提供新的思路和有效的特征参数选择方法. 相似文献

3.

基于动静态组合特征参数的语音识别 总被引：1，自引：0，他引：1

王旭韩志艳王健薛丽芳《计算机科学》2008,35(7):129-132

基于语音信号的时变特性,本文提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC(Mel-Frequency Cepstrum Coefficient)参数的提取方法,用小波包变换代替傅立叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC(Discrete Wavelet Packet Transform Mel-Frequency Coefficient),然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数,通过试验和仿真,此参数具有很高的识别率,是一种很好的语音特征参数.并且把混沌特性引入到神经元,构成混沌神经网络,把这种神经网络用于语音识别,并与常用的BP神经网络识别方法进行了比较.试验结果表明,混沌神经网络的平均识别率要高于同等条件下常用的神经网络方法的识别率. 相似文献

4.

语音情感识别中特征参数的研究进展

李杰周萍《传感器与微系统》2012,31(2):4-7

语音情感识别是近年来新兴的研究课题之一,特征参数的提取直接影响到最终的识别效率,特征降维可以提取出最能区分不同情感的特征参数。提出了特征参数在语音情感识别中的重要性,介绍了语音情感识别系统的基本组成,重点对特征参数的研究现状进行了综述,阐述了目前应用于情感识别的特征降维常用方法,并对其进行了分析比较。展望了语音情感识别的可能发展趋势。相似文献

5.

基于单边自相关序列的语音特征及其在带噪语音识别中的应用

徐金甫韦岗《计算机工程》2000,26(5):58-59,89

提出了一种抗噪声语音特征。首先计算语音信号单边自相关序列的差分序列,再计算该差分序列的线性预测系数,进一步求出例说系数。实验证明,传统的线性预测例谱系数和边自相关序列的一性预测倒谱数相比,采用单边自相关序列差分序列的线性预测倒谱系数作为语音信号的特征矢量,可以提高语音识别系统对带噪音语音的识别率。相似文献

6.

基于二维PMCC鲁棒特征参数的语音识别

屈百达李金宝徐宝国《计算机应用》2007,27(10):2547-2548

在噪声环境语音识别中,如何提取鲁棒性特征参数是其核心问题之一,首先提出了一种二维根倒谱特征参数,然后,该参数结合基于最小方差无失真响应谱估计的特征参数(PMCC)。最终,发现了一种新颖的鲁棒特征参数,在不同的信噪比下,它能成功地被用于连续语音识别中。试验结果表明,在不同的噪声环境和信噪比下,二维PMCC鲁棒特征参数比传统Mel频率倒谱系数（MFCC）和感知线性预测（PLP）有更好的识别率。相似文献

7.

语音识别前端鲁棒性问题综述

刘放军王仁华《计算机科学》2006,33(4):168-173

随着手持设备的日益小型化以及一些特殊场合的限制,使用语音识别这种自然的人机接口技术愈发显得迫切。基于HMM架构的语音识别技术经过几十年的发展,在实验室环境下已经取得了很高的识别率。当前已经取得的技术要想走向实用化,所面临的最大障碍来自于语音识别前端的鲁棒性问题。本文对语音识别的前端鲁棒性问题做了比较深入细致的分析,并在此基础上比较全面地介绍了解决这些棘手问题所采取的一些措施。文章最后对语音识别前端鲁棒性问题给出了一定的讨论和展望。相似文献

8.

语音识别中动态时间规整和隐马尔可夫统一模型 总被引：1，自引：0，他引：1

张焱张杰《数据采集与处理》1997,12(3):218-222

对于目前在语音识别中广泛使用的两种技术即动态时间规整（ＤＴＷ）技术和隐马尔可夫模型（ＨＭＭ）的本质联系，提出了二者的统一模型（ＤＨＵＭ，ＤＴＷａｎｄＨＭＭＵｎｉ－ｆｉｅｄＭｏｄｅｌ），并分别给出ＤＴＷ和ＨＭ向ＤＨＵＭ的转换关系。文中还提出了用ＤＨＵＭ解决更接近语音实际情况的高阶ＨＭＭ作语音识别时所面临的运算量过大的问题。中等词表的识别实验结果表明，建立在ＤＨＵＭ之上的识别器的识别性能不低于相似文献

9.

基于子带主频率信息的语音特征提取算法

下载免费PDF全文

高明明常太华杨国田李曼《计算机工程》2009,35(18):161-163

提出一种用于语音识别的鲁棒特征提取算法。该算法基于子带主频率信息,实现子带主频率信息与子带能量信息相结合,在特征参数中保留语谱中子带峰值位置信息。使用该算法设计抗噪孤立词语音识别系统,分别在白高斯噪声和背景语音噪声环境下,与传统特征算法做多种信噪比对比实验。试验结果表明该特征算法在2种噪声环境下的识别率有不同程度提高,具有良好的噪声鲁棒性。相似文献

10.

噪声中的语音信号识别 总被引：1，自引：0，他引：1

张正兰《电脑与微电子技术》1989,(3):16-17,20

相似文献

11.

基于特征参数归一化的鲁棒语音识别方法综述

肖云鹏叶卫平《中文信息学报》2010,24(5):106-117

目前,自动语音识别系统往往会因为环境中复杂因素的影响,造成训练环境和测试环境存在不匹配现象,使得识别系统性能大幅度下降,极大地限制了语音识别技术的应用范围。近年来,很多鲁棒语音识别技术成功地被提出,这些技术的目标都是相同的,主要是提高系统的鲁棒性,进而提高识别率。其中,基于特征的归一化技术简单而有效,常常被作为鲁棒语音识别的首选方法,它主要是通过对特征向量的统计属性、累积密度函数或功率谱的归一化来补偿环境不匹配产生的影响。该文主要对目前主流的归一化方法进行介绍,其中包括倒谱矩归一化方法、直方图均衡化方法以及调频谱归一化方法等。相似文献

12.

一种基于调制谱特征的带噪语音识别方法 总被引：1，自引：0，他引：1

马昕杜利民何成林《计算机工程与应用》2005,41(20):53-55

在语音识别过程中,提取语音特征参数是重要的步骤之一。为了提高整个识别系统的性能,要求所选语音参数应具有较好的鲁棒性。文章在时频分析理论基础上,设计了一种基于语音调制谱的特征参数。这种参数利用了语音调制谱的时频集聚性并通过对语音调制谱作适当的滤波及归一化处理以削弱其对加性噪声和通道失真等干扰的敏感性。实验结果表明,该参数在提高语音识别系统的的抗噪性方面有明显的贡献。相似文献

13.

频域动态特征提取中的多层信道正规化

王东朱小燕刘盈《软件学报》2003,14(9):1523-1529

语音识别领域已经取得了稳步发展并出现了众多实用系统,但众所周知,今天的识别技术还远没有达到要求,而"鲁棒性"问题是系统性能提高的一个主要障碍.集中讨论了一种对抗语音识别系统脆弱性的通行方法--信道正规化技术,提出了一种新的正规化策略--多层信道正规化MLCN(multi-layer channel normalization)新的算法应用递归补偿算法,在频谱域和倒谱域两层上进行正规化,降低噪音和去除信道畸变,从而为后续识别过程提供更鲁棒的特征参数.在此基础上,探讨了一种新的语音识别特征参数的提取-频域动态倒谱系数,由于MLCN的引入,频域的动态信息被恰当地集成到最终的特征向量中.在gallina系统中的实验证明了这种新方法的有效性. 相似文献

14.

支票手写体汉字大写金额识别的非线性规范化

朱宁波曾生根娄震杨静宇《计算机辅助设计与图形学学报》2005,17(6):1246-1251

针对银行支票图像大写金额的无限制手写体汉字识别问题,进行了基于密度均衡原则的非线性规范化研究。提出了一种改进的非线性规范化方法．该方法定义的基于笔画间距和宽度的密度函数,不仅能较好地克服笔画变形的局部性、不规则性,而且能使同一字符内以及不同字符之间的笔画粗细趋于一致;同时,确定了图像中字符的有效区域,并据此改进了基于密度均衡原则的通用表达式,有效地解决了字符整体倾斜和单个笔画比较突出的问题,实验结果表明：该方法比其他同类方法效果更佳,可使银行支票图像的大写金额识别系统的识别正确率提高约1．5％。相似文献

15.

基于特征加权的应力影响下顽健语音识别方法 总被引：1，自引：0，他引：1

张磊韩纪庆王承发张文祥《中文信息学报》2002,16(1):8-13

通过对应力影响下语音数据的分析,发现不同的特征维对变异的敏感程度不同。一般低维特征对变异比较敏感,相应的高维特征敏感程度差些。在此基础上,提出一种新的基于特征加权的变异语音识别方法。该方法通过对不同维特征加不同的权值来消除变异因素对语音特征的影响,从而提高系统的识别性能。文中提出对线性权值用最大相对熵估计方法获得权值。对航空模拟飞行器中采集的特定话者小词表孤立词的实验,最大相对熵估计方法的识别率可达到89.9% ,与多重风格训练方法相比,识别率提高了13.1%。相似文献

16.

人耳识别中归一化对特征提取和识别影响的研究

LI Su-juan FENG Jun NIU Jiang-chuan 《数字社区&智能家居》2008,(36)

介绍了常用的归一化方法,对归一化前后的图像进行比较,并通过试验分析不同归一化方法对特征提取和分类识别的影响。相似文献

17.

语音识别特征参数选择方法研究 总被引：11，自引：0，他引：11

杨大利徐明星吴文虎《计算机研究与发展》2003,40(7):963-969

语音识别系统的性能与识别器所用的特征参数密切相关，用正交实验设计进行特征参数选择，提出一种系统性的实用的特征参数选择方法．研究了特征参数排列顺序对识别系统最终识别率的影响，讨论了这种特征参数选择方法的可扩展性．与目前常用识别器相比，新方法的词错误率下降了37％．实验结果表明，正交实验设计用于特征参数选择是有效的，特征参数排列顺序对识别率的影响可以忽略．相似文献

18.

基于SpeechSDK的语音识别技术在三维仿真中的应用

林鸣霄《微机发展》2011,(11):160-162,166

随着三维仿真技术的不断发展,简单的人机交互方式已经不能满足人们对仿真环境真实感和沉浸感的要求。针对于此,提出了将基于SpeechSDK5．1的语音识别技术应用到三维仿真平台的构想,分析了SpeechSDK5．1的工作原理,着重研究了其语音识别接口,对将语音识别应用到三维仿真程序中的可能性和关键技术进行了研究。提出了一种实现动态词汇识别的方法,并通过一个简单的实例展示了实现这类技术的框架和方法,对设计有语音识别功能的三维仿真程序有一定的参考价值。相似文献