共查询到19条相似文献,搜索用时 46 毫秒
1.
在SEED-DEC5502 DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,与传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数;对状态输出概率计算进行了分析和优化,进一步降低了计算负担.实验表明系统在100词条的情况下识别率达到98%,识别时间为1.03倍实时. 相似文献
2.
3.
隐马尔可夫模型(HMM)已成为语音识别中的主流技术,首先介绍了语音识别技术的原理和结构,然后介绍了HMM的三个基本问题及其解决方法,最后利用Matlab仿真工具设计了一个孤立词的语音识别系统,实现了数字0~9的识别. 相似文献
4.
语音识别是人杌通信技术的基础之一,目前正广泛应用于控制、通信、消费等行业.介绍一种基于DSP的孤立词语音识别系统.对以TMS320VC5402芯片为核心的系统硬件设计进行了研究,通过TLC320AD50C对语音信号进行A/D转换,通过TMS30VC5402对语音信号进行训练和识别,并由LCD显示结果;该系统核心识别算法采用动态时间规整(DTW)算法.主要流程包括预处理、端点检测、提取特征值、模式匹配和模板训练,取得了很好的识别效果.所做的研究工作,是为汉语孤立词语音识别进入商业化进行有效的探索. 相似文献
5.
6.
基于连续HMM的孤立语音鲁棒性识别方法 总被引:5,自引:1,他引:5
对于基于连续稳马尔可夫模的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Mel倒谱参数(RAS_MFCC+△RAS_MFCC),进行特征参数级的去噪,明显地改善了系统的噪声鲁棒性。 相似文献
7.
8.
在VC++的编程环境下设计了一个小词汇量孤立词非特定人的汽车语音识别系统,系统中的识别词汇都是汽车驾驶员在驾驶过程中可能做的一些手控操作.语音预处理采用的是改进后的端点检测算法.实验分析时,在测试数据中加入噪声库(NoiseX-92)中的车内噪声来模拟汽车驾驶环境,并提出随机映射梅尔频率倒谱系数来增强噪声环境下系统的鲁棒性.测试数据表明,使用随机映射特征参数使得系统的抗噪声能力得到了很大的提升. 相似文献
9.
一种适于非特定人语音识别的并行隐马尔可夫模型 总被引:2,自引:0,他引:2
为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语非特定人孤立数字的识别实验表明,PHMM较之传统CHMM使识别性能及噪声鲁棒性都得到了改善。 相似文献
10.
11.
基于经典隐马尔可夫模型的汉语连续语音识别系统 总被引:1,自引:0,他引:1
该文构造了基于经典隐马尔可夫模型(Hidden Markov Model,HMM)的汉语连续语音识别系统,定量地分析与评价了经典HMM的性能。 相似文献
12.
We investigate the performance of an isolated word speech recognition (IWSR) system for degraded speech. We propose a recognition scheme which adapts itself to mild degradations in speech and improves the reliability of recognition significantly. The scheme does not use a priori information regarding the nature and extent of noise. We suggest techniques which adaptively discriminate between noisy and noise-free parameters by using a selective weighting procedure in the final distance calculation. A new measure of performance is adopted to compare several recognition schemes using small data sets. Our scheme lends itself to greater flexibility in handling degradations in speech input than do the existing recognition schemes. 相似文献
13.
14.
详细介绍一种基于神经网络的自学习非特定人语音识别方法,首次介绍一种语音识别知识的自动检验方法——LVV法,给出系统原理图和知识库的自动完善原理;介绍一种LEA判别法,实现梯度牛顿有效结合神经网络快速学习方法,并给出了实验结果。 相似文献
15.
16.
A technique for smoothing hidden Markov model parameters based on the concepts of deleted estimation and probabilistic mapping is proposed. The proposed algorithm is closely related to deleted interpolation in its approach and is shown to yield higher recognition rate than the distance-based smoothing and co-occurrence smoothing methods.<> 相似文献
17.
Zhao Li 《电子科学学刊(英文版)》2000,17(1):9-14
This paper describes a method for recognizing Chinese tones in continuous speech. The first and second order differentials of the fundamental frequency logarithmically converted are used as feature parameters. A left-to-right hidden Markov modeling with five states, each of which is modeled by a single Gaussian distribution, expresses each of Chinese tones. Non-voiced portions are coded by random values normally distributed to uniformly deal with all the time frames in an utterance. Speaker dependent tone recognition was conducted for ten speakers. The average rate of 81.8% was obtained for these speakers. 相似文献
18.
随着语音编码技术的不断发展,出现了各种不同的编解码方案,在进行应用不同编码系统的相互通信过程中,两种系统的连接就很麻烦,或者为了适应不同的通信环境需要改变编解码方式时,更改编码方式也是一件费时费力的事情。主要提出了使用DSP的TMS320C54X 和配合一些外围电路,实现一种通用编解码器的方案,能够很简单地更改不同编解码方式,满足不同的通信要求。 相似文献
19.
在数字电视节目制作中,抠像是一种应用广泛的电视特技,它能将人们置身于各种奇妙的环境中,极大丰富了电视节目的表现形式.从抠像的基本原理入手,通过改进抠像算法,设计了一款基于FPGA的数字色键器,并在Quanus Ⅱ中对设计进行了仿真验证,最后通过硬件测试证明了系统设计方法的正确性和可靠性.该色键器能较好地应用于日常的电视节目制作过程中. 相似文献