期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张亚歌张太镒《微电子学与计算机》2010,27(11)

提出了一种基于双帧动态时间规整(Double Frame Dynamic Time Wrapping)的识别方法,通过缩小帧匹配距离矩阵(Frame Match Distance Matrix)的规模从而减少计算量,提高识别速度.实验表明,基于双帧动态时间规整的识别方法在识别率有所提高的条件下,缩短了识别时间,有很好的实用价值. 相似文献

2.

用于噪声鲁棒语音识别的声学模型及解码策略

张明新张东滨倪宏《电声技术》2006,(6):40-43

提出了一种平行子状态隐马尔可夫模型用作噪声鲁棒语音识别的声学模型。该模型融合了纯净语音和背景噪声信息,模型的每个状态包含平行关系的子状态。在此基础上,提出了两种用于平行子状态隐马尔可夫模型的识别解码策略——子状态最大似然解码和联合转移子状态最大似然解码。实验结果表明,声学模型及其解码策略在各种噪声下取得了良好鲁棒识别效果。相似文献

3.

一种孤立字语音识别的新方法

唐昌文《通信技术》2002,(8):87-88

提出一种基于动态规划的矢量量化方法DPVQ(DynamicProgramBasedVectorQuantiza-tion。新方法既能有效压缩语音特征,又能充分保持时间序列信息,同时又兼顾码语音不同段的统计特性。相似文献

4.

清浊音分离抗噪的语音识别算法的研究

《电子技术与软件工程》2017,(24)

针对噪音环境下,语音识别率严重下降,根据清浊音发音原理的不同,提出一种清浊音分离抗噪的语音识别算法。实验结果表明,该方法能在噪音环境下明显提高语音识别率。相似文献

5.

用于分布式识别的语音参数的提取和性能分析

郑清杨震《南京邮电学院学报(自然科学版)》2003,23(2):31-34

主要研究用于分布式语音识别(DSR)的语音参数的提取方法以及参数性能分析。以前所用到的语音参数大部分是LPC例谱参数，但其抗噪声性能较差。文中主要讨论了MEL倒谱参数。并在移动通信环境下，比较了两者的性能。相似文献

6.

一种抗噪声的语音识别方法研究

任丽娜《电子测试》2021,(13):70-71

语音用于人们日常生活交流、外界信息获取,语音传递了特定信息,这种信息传递方式为生活带来诸多便利.随着信息时代来临,语音识别成为一项关键技术,技术人员提取、分析语音的特征参数,识别不同背景噪声环境中说话人声波,采用不同的识别模型和滤波方法,改进模型算法,通过对比识别效果表明,语音识别系统抗噪声能力得到有效提升. 相似文献

7.

汉语语音识别的抗噪性前端算法及性能分析

林建臻孙甲松王作英《电声技术》2004,(3):45-48,52

讨论了欧洲电信标准委员会ETSI提出的分布式语音识别系统的抗噪前端特征提取算法,该算法融合多种抗噪技术。结合汉语语音的特点,进行了汉语语音识别整体框架下的算法实现,并进行了实验和分析,典型噪声环境下的识别结果证明,相对于基线MFCC特征提取算法,稳健性有较大提高。相似文献

8.

基于小波Mel倒谱系数的抗噪语音识别

张小玫张雪英梁五洲《中国电子科学研究院学报》2008,3(2):187-190

将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFCC特征参数在噪声环境和较大词汇量情况下,其抗噪性和识别率均优于MFCC特征参数的结果。相似文献

9.

语音识别HMM中引入帧间相关信息的一种参数化模型 总被引：4，自引：1，他引：3

杨浩荣王作英陆大《电子学报》1998,26(10):50-54,8

虽然隐马尔可夫模型（ＨＭＭ）是当前最为流行的语音识别模型，但由于一般都采用了状态输出独立假设，因此存在着不能描述语音现象中时间相关性的固有缺陷，本文提出的新模型对语音状态输出特征矢量序列的静态和动态特性信息分别进行参数化建模，然后将它们结合在一起，由此在基于段长分布的ＨＭＭ（ＤＤＢＨＭＭ）中引入了帧间相关信息，这种上引入帧间相关信息的ＨＭＭ能够更为精确地描述真实的语音现象。本文在给出新模型的框架后相似文献

10.

一种改进精简的语音识别模型

刘鑫罗幼喜《电子测试》2022,(24):67-69

为解决深度学习模型在语音识别芯片上内存占用过大的问题,训练时间长,训练深度不够等问题,本文在Transformer语音识别模型的基础上,提出一种减少Transformer计算复杂度的模型,新的模型参数仅有原模型的1/10,模型训练速度大大提升。此外本文在对模型进行参数调整的过程中还对Transformer模型结构中add&norm这一结构结合残差神经网络进行修改,针对模型在训练过程中因为模型深度太深（容易产生梯度消失和梯度爆炸）导致的模型收敛速度过慢或者模型不收敛等问题,在保证词错率下降的同时,加快模型的收敛速度和训练速度,修改结构之后的模型在词错率上相比原有模型词错率更低,并且收敛速度也比未修改结构的模型收敛速度更快。相似文献

11.

噪声下差分复合子带语音识别方法 总被引：4，自引：0，他引：4

蒋文建韦岗《通信学报》2002,23(1):18-24

本文根据子带特征反映语音信号局部特性和全带特征反映语音信号整体特性的事实，提出了一种差分复合子带语音识别新方法。先用频谱差分减少噪声的干扰，再将多子带特征识别概率与全带特征识别概率相结合进行综合判决，以得到最终识别结果。将新方法应用于TIMIT数据包0－9十个英文数字和E－Set在NoiseX92的白噪声和F16战机噪声下的识别实验。实验结果表明新方法比传统方法识别性能有很大提高。相似文献

12.

基于混合模型状态修正算法的非母语语音识别

张晴晴潘接林颜永红《数字通信》2009,36(1):33-37

非母语语音识别的性能较低,对于刚开始学习目标语言的说话人或者口音很重的说话人而言,性能下降更为明显。本文提出一种新型的双语模型修正算法用于提高非母语语音的识别性能。在该算法中,基线声学模型的每个状态都将被代表说话人母语特点的辅助模型状态所修正。文章给出了状态修正准则以及不同候选修正状态数下的性能比较。相比已用非母语训练数据自适应以后的基线声学模型,通过双语模型修正的声学模型在保证识别实时率的前提下,短语错误率相对下降了11．7％。相似文献

13.

语音情感识别的研究进展 总被引：11，自引：0，他引：11

林奕琳韦岗杨康才《电路与系统学报》2007,12(1):90-98

情感在人类的感知、决策等过程扮演着重要角色.长期以来情感智能研究只存在于心理学和认知科学领域,近年来随着人工智能的发展,情感智能跟计算机技术结合产生了情感计算这一研究课题,这将大大的促进计算机技术的发展.情感自动识别是通向情感计算的第一步.语音作为人类最重要的交流媒介,携带着丰富的情感信息.如何从语音中自动识别说话者的情感状态近年来受到各领域研究者的广泛关注.本文从语音情感识别所涉及的几个重要问题出发,包括情感理论及情感分类、情感语音数据库、语音中的情感特征和语音情感识别算法等,介绍了当前的研究进展,并讨论了今后研究的几个关键问题. 相似文献

14.

Improved perceptually non-uniform spectral compression for robust speech recognition

ZHANG Yi HE Chun-jiang LUO Yuan CHEN Kai XING Wu-chao 《中国邮电高校学报(英文版)》2013,20(4):122-126,132

According to the decline of recognition rate of speech recognition system in the noise environments, an improved perceptually non-uniform spectral compression feature extraction algorithm is put forward in this paper. This method can realize an effective compression of the speech signals and make the training and recognition environments more matching, so the recognition rate can be improved in the noise environments. By experimenting on the intelligent wheelchair platform, the result shows that the algorithm can effectively enhance the robustness of speech recognition, and ensure the recognition rate in the noise environments. 相似文献

15.

一种RNN-T与BERT相结合的端到端语音识别模型

郭家兴韩纪庆《智能计算机与应用》2021,11(2):169-173

端到端语音识别模型由于结构简单且容易训练,已成为目前最流行的语音识别模型.然而端到端语音识别模型通常需要大量的语音-文本对进行训练,才能取得较好的识别性能.而在实际应用中收集大量配对数据既费力又昂贵,因此其无法在实际应用中被广泛使用.本文提出一种将RNN-T(Recurrent Neural Network Trans... 相似文献

16.

基于GMM的语音情感信息识别

孙红进《信息技术》2008,32(12)

实际的研究表明,语音情感识别方法有多种.介绍了一种基于GMM的语音情感识别方法,包括该方法的优点、存在的问题或不足等,并对此进行了思考,给出了一些处理办法. 相似文献

17.

Discriminative tonal feature extraction method in mandarin speech recognition

HUANG Hao ZHU Jie 《中国邮电高校学报(英文版)》2007,14(4):126-130

To utilize the supra-segmental nature of Mandarin tones, this article proposes a feature extraction method for hidden markov model (HMM) based tone modeling. The method uses linear transforms to project F0 (fundamental frequency) features of neighboring syllables as compensations, and adds them to the original F0 features of the current syllable. The transforms are discriminatively trained by using an objective function termed as "minimum tone error", which is a smooth approximation of tone recognition accuracy. Experiments show that the new tonal features achieve 3.82% tone recognition rate improvement, compared with the baseline, using maximum likelihood trained HMM on the normal F0 features. Further experiments show that discriminative HMM training on the new features is 8.78% better than the baseline. 相似文献

18.

基于LPCC参数的语音识别系统

王彪《电子设计工程》2012,20(7):18-20

为了识别简单语音,设计了一个基于LPCC参数的语音识别系统。该系统其主要功能有语音信号的录制、播放、预处理、分段滤波、特征提取以及识别语音。最后通过仿真实验验证了本系统能够达到识别简单语音的要求,但仍有需改进的地方,如:能否在复杂环境下识别比较复杂的语音。相似文献

19.

Nonlinear cepstral equalisation method for noisy speech recognition

Lee L.-M. Chen J.-K. Wang H.-C. 《Vision, Image and Signal Processing, IEE Proceedings -》1994,141(6):397-402

The authors deal with the problem of automatic speech recognition in the presence of additive white noise. The effect of noise is modelled as an additive term to the power spectrum of the original clean speech. The cepstral coefficients of the noisy speech are then derived from this model. The reference cepstral vectors trained from clean speech are adapted to their appropriate noisy version to best fit the testing speech cepstral vector. The LPC coefficients, LPC derived cepstral coefficients, and the distance between test and reference, are all regarded as functions of the noise ratio (the spectral power ratio of noise to noisy speech). A gradient based algorithm is proposed to find the optimal noise ratio as well as the minimum distance between the test cepstral vector and the noise adapted reference. A recursive algorithm based on Levinson-Durbin recursion is proposed to simultaneously calculate the LPC coefficients and the derivatives of the LPC coefficients with respect to the noise ratio. The stability of the proposed adaptation algorithm is also addressed. Experiments on multispeaker (50 males and 50 females) isolated Mandarin digits recognition demonstrate remarkable performance improvements over noncompensated method under noisy environment. The results are also compared to the projection based approach, and experiments show that the proposed method is superior to the projection approach under a severe noisy environment 相似文献

20.

语音识别组件转化为控件的方法

夏俊杰杨青赵刚《电子设计工程》2012,20(14):59-61

在使用一些专用开发工具如Authorware时,常遇到不支持COM组件调用的问题。文中介绍了将COM组件和ActiveX控件的转化方法以解决这种问题。根据组件的函数和数据成员在控件中添加相应的属性、方法和事件来设计控件。文中以一个语音识别组件来详细说明转化方法和流程。最后,在Authorware工具中调用语音识别控件并能够识别出文本。相似文献