期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张丽王福忠张涛《河南理工大学学报(自然科学版)》2007,26(6):694-699

为解决语音识别过程中的抗噪声及抗干扰问题,提高系统的识别精度,利用隐马尔可夫模型HMM优异的时序建模能力及小波变换可以对信号进行多尺度分析并有效提取信号的局部信息的特点,建立了混合语音识别模型.考虑到在语音信号识别过程中信号的非平稳性,采用并行的识别方法分别获取分类信息,根据混合模型的识别算法做出识别决策,减小了系统对环境的依赖性,提高了其自适应能力.仿真实验结果表明,混合模型识别结果比单一HMM模型或小波模型识别结果更佳,提高了整体的识别速度和识别率. 相似文献

2.

基于HMM/ANN混合模型的带噪语音识别 总被引：1，自引：0，他引：1

齐爱学王洪刚《杭州电子科技大学学报》2007,27(3):17-20

对于含噪语音信号的有效特征提取是语音识别至关重要的一步.该文提出了利用小波调制尺度对语音进行特征提取,结合隐马尔可夫和人工神经网络混合模型进行识别的方法,可进一步反映语音信号的动态特性、增强抗干扰能力和提高识别率.实验证明,该模型适合于对噪声背景下的语音进行识别,同传统的HMM模型相比,具有更好的抗噪鲁棒性,在信噪比较低情况下,识别率比传统的HMM模型有明显的提高. 相似文献

3.

基于隐马尔可夫模型的语音单字识别研究

董湘君黄智伟《南华大学学报(理工版)》2002,16(2):76-78,87

本文针对线性模型在语音识别中的不足，进行了隐马尔可夫模型（HMM）在语音单字识别中的研究，主要对观察输出概率求解、最佳状态序列寻找、参数估计和模型参数的选择进行了探讨。相似文献

4.

最大互信息用于语音识别 总被引：3，自引：0，他引：3

张春涛《北京邮电大学学报》1998,21(3):82-85

将最大互信息理论用于语音识别,最大互信息估计作为目标函数。在隐马尔可夫模型参数调整过程中运用了泛化概率下降方法,保证了统计意义上实现目标函数的优化。最大互信息估计用于连接数字语音识别,识别率得到了提高。相似文献

5.

采用连续混合密度隐马洋柯夫模型的语音识别

石洪波《华北工学院学报》1997,18(4):304-309

介绍了采用连续Ｍ元高斯混合密度的隐式马尔柯夫模型的语音识别实验系统，对语音特征矢量用非线性归一化算法进行预处理。另一，还提出一种基于语音识别的模型初始化方法。实验证明：语音的预处理和模型初始化方法都取得了较明显的效果。相似文献

6.

采用连续混合密度隐马尔柯夫模型的语音识别

石洪波《中北大学学报(自然科学版)》1997,(4)

介绍了采用连续Ｍ元高斯混合密度的隐式马尔柯夫模型的语音识别实验系统，对语音特征矢量用非线性归一化算法进行预处理．另外，还提出一种基于语音知识的模型初始化方法．实验证明：语音的预处理和模型初始化方法都取得了较明显的效果．相似文献

7.

小波去噪在语音识别中的应用 总被引：7，自引：1，他引：6

胡惠英《北京邮电大学学报》1999,22(3):31-34

将小波应用于语音识别的预处理中,对带噪语音信号在小波域内区分语音的清,浊音,分别用门限进行不同的处理,将去噪后的小波系数反变换后再进行语音识别。实验结果表明,小波去噪对在噪声环境下的语音识别性能有很大的改进。相似文献

8.

听觉模型用于噪声环境下语音识别的研究

李雪耀花栅杨崇林《哈尔滨工程大学学报》1999,20(2):52-57

在吸收听觉生理学研究成果基础上,建立了一个模拟外国听觉系统和部分中枢听觉神经系统功能的听觉模型,以该模型作为前端处理来提取特征参数,后处理采用模式匹配的方法,进一步研究了听觉模型用于语音识别的抗噪声问题。根据听觉生理特点提出了几个抗噪声方案,实验结果表明,基于文中的听觉模型和所提抗噪声方案的语音识别系统,在噪声环境下具有很好的鲁棒性（Ｒｏｂｕｓｔｎｅｓｓ）。相似文献

9.

小波预处理与语音识别 总被引：4，自引：4，他引：0

彭玉华姜响应《山东工业大学学报》1998,28(5):428-430,435

利用小波的带通性质,给出了一种新的小波预处理方法,实验表明,经过小波预处理后提取的特征,提高了语音的识别率。相似文献

10.

基于小波分析的汉语语音识别 总被引：4，自引：0，他引：4

许开宇张曙《哈尔滨工程大学学报》1996,17(4):20-26

将小波分析这一崭新的理论工具应用于汉语语音识别中，并提出了一些应用于语音处理的方法。相似文献

11.

Improved hidden Markov model for speech recognition and POS tagging

袁里驰《中南工业大学学报(英文版)》2012,19(2):511-516

In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language processing. The speaker independently continuous speech recognition experiments and the part-of-speech tagging experiments show that Markov family model has higher performance than hidden Markov model. The precision is enhanced from 94.642% to 96.214% in the part-of-speech tagging experiments, and the work rate is reduced by 11.9% in the speech recognition experiments with respect to HMM baseline system. 相似文献

12.

基于SCHMM/ANN噪声背景下的语音识别系统设计 总被引：2，自引：0，他引：2

陈立伟赵春晖姜海丽《哈尔滨工程大学学报》2005,26(1):119-122

语音识别系统一般是将安静环境下训练得到的参数用于实际环境中, 当实际环境是安静的,语音识别系统的工作是令人满意的,然而,当实际环境中有噪声存在时,识别系统的性能就会下降.文中提出将自组织特征映射神经网络与半连续隐马尔可夫模型相结合,训练出适应噪声的隐马尔可夫模型的新方法.把该模型应用于小词汇量的孤立词语音识别系统.实验表明,该模型适合于对噪声背景下的语音进行识别.同传统的HMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2～12dB),识别率比传统HMM模型有明显提高. 相似文献

13.

HMM-based noise estimator for speech enhancement

许春冬夏日升应冬文李军锋颜永红《北京理工大学学报(英文版)》2014,23(4):549-556

A noise estimator was presented in this paper by modeling the log-power sequence with hidden Markov model （HMM）. The smoothing factor of this estimator was motivated by the speech presence probability at each frequency band. This HMM had a speech state and a nonspeech state, and each state consisted of a unique Gaussian function. The mean of the nonspeech state was the estimation of the noise logarithmic power. To make this estimator run in an on-line manner, an HMM parameter updated method was used based on a first-order recursive process. The noise signal was tracked together with the HMM to be sequentially updated. For the sake of reliability, some constraints were introduced to the HMM. The proposed algorithm was compared with the conventional ones such as minimum statistics （MS） and improved minima controlled recursive averaging （IM- CRA）. The experimental results confirms its promising performance. 相似文献

14.

基于平均路径长度的语音识别算法的研究与仿真

张艳萍张延盛 《南京信息工程大学学报》2011,3(1):62-66

提出了一种基于平均路径长度的语音识别算法.采用的识别方法属于小词汇量孤立词语音识别,主要包括端点检测、特征提取和模式识别.首先,在对语音信号预处理的基础上,采用梅尔频率倒谱系数(MFCC)为特征参数提取算法,动态时间规整(DTW)作为识别算法;然后,结合基于平均路径长度的模板训练方法,即采用少量样本,通过计算平均路径长... 相似文献

15.

基于语音识别的朝鲜语语音检索方法

徐博文金小峰《延边大学学报(自然科学版)》2021,(3):273-278

针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型; 其次通过语音文档分割方法构建了语音文档索引库; 最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时, top -k评价方法的检索均值平均精度达到86.74%, 召回率达到95.25%, 该结果表明本文提出的方法是有效的,具有一定的实际应用价值. 相似文献

16.

便于语音识别的汉语音素发音口形定型化处理

黄中伟刘明辉徐明冯杉杉高建伟《深圳大学学报(理工版)》2007,24(4):404-405

分析汉语普通话发音的29个基本音素,对m,n,l等3个音素的发音进行改造,形成了由16个定口型音和13个动口型音组成的音素体系,有助于减轻非母语系者学习中文及智障人士语音识别的学习负担. 相似文献

17.

Novel acoustic features for speech emotion recognition

ROH Yong-Wan KIM Dong-Ju LEE Woo-Seok HONG Kwang-Seok 《中国科学E辑(英文版)》2009,52(7):1838-1848

This paper focuses on acoustic features that effectively improve the recognition of emotion in human speech. The novel features in this paper are based on spectral-based entropy parameters such as fast Fourier transform (FFT) spectral entropy, delta FFT spectral entropy, Mel-frequency filter bank (MFB) spectral entropy, and Delta MFB spectral entropy. Spectral-based entropy features are simple. They reflect frequency characteristic and changing characteristic in frequency of speech. We implement an emotion rejection module using the probability distribution of recognized-scores and rejected-scores. This reduces the false recognition rate to improve overall performance. Recognized-scores and rejected-scores refer to probabilities of recognized and rejected emotion recognition results, respectively. These scores are first obtained from a pattern recognition procedure. The pattern recognition phase uses the Gaussian mixture model (GMM). We classify the four emotional states as anger, sadness, happiness and neutrality. The proposed method is evaluated using 45 sentences in each emotion for 30 subjects, 15 males and 15 females. Experimental results show that the proposed method is superior to the existing emotion recognition methods based on GMM using energy, Zero Crossing Rate (ZCR), linear prediction coefficient (LPC), and pitch parameters. We demonstrate the effectiveness of the proposed approach. One of the proposed features, combined MFB and delta MFB spectral entropy improves performance approximately 10% compared to the existing feature parameters for speech emotion recognition methods. We demonstrate a 4% performance improvement in the applied emotion rejection with low confidence score. Supported by MIC, Korea under ITRC IITA-2009-(C1090-0902-0046) and the Korea Science and Engineering Foundation (KOSEF) funded by the Korea government (MEST) (Grant No. 20090058909) 相似文献

18.

基于非齐次隐马尔可夫模型的特定人元音的识别方法

陈立伟赵春晖白玉孙岩《哈尔滨工程大学学报》2006,27(2):296-300

针对特定人汉语元音的语音识别,提出一种基于非齐次隐马尔可夫模型的识别方法.该方法首先提取声道频率响应作为特征参数,然后建立非齐次隐马尔可夫模型来更为精确地刻画真实的语音现象,接着进行语音识别实验,并与齐次隐马尔可夫模型进行比较.实验结果表明该方法可以使特定人的元音的识别率达到98.73%,明显改变了识别系统的性能.该方法具有很好的理论研究前景和实际应用价值. 相似文献

19.

语音识别中的加性噪声补偿研究

田斌田红心等《西安电子科技大学学报(自然科学版)》2001,28(3):292-296

针对语音识别中的加性噪声进行研究，提出了动态自适应多模板谱减法和多模板谱加训练补偿法。动态自适应多模板谱减法和噪声动态自适应方法的有效结合，使谱减法既能适应环境中存在多种噪声的情况，又能有效利用当前得到的噪声环境信息。而多模板谱补偿法从谱减法的逆向角度，并基于多模式训练的思想，有效地使模板适应多种噪声情况，该方法不增加识别时的运算量，有利于考虑噪声的各种复杂情况。相似文献