首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
张晨燕  孙成立 《电信科学》2006,22(10):60-63
在SEED-DEC5502 DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,与传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数;对状态输出概率计算进行了分析和优化,进一步降低了计算负担.实验表明系统在100词条的情况下识别率达到98%,识别时间为1.03倍实时.  相似文献   

2.
采用离散HMM的孤立词识别系统   总被引:3,自引:0,他引:3  
探讨了离散马尔可夫模型的基本原理及在孤立词识别中的应用,并且实现了一个文本有关的孤立词识别系统,其正确识别率达到96.3%。  相似文献   

3.
沈泉波 《电声技术》2012,36(10):56-57,70
隐马尔可夫模型(HMM)已成为语音识别中的主流技术,首先介绍了语音识别技术的原理和结构,然后介绍了HMM的三个基本问题及其解决方法,最后利用Matlab仿真工具设计了一个孤立词的语音识别系统,实现了数字0~9的识别.  相似文献   

4.
何翔  刘大健 《现代电子技术》2009,32(17):118-120,123
语音识别是人杌通信技术的基础之一,目前正广泛应用于控制、通信、消费等行业.介绍一种基于DSP的孤立词语音识别系统.对以TMS320VC5402芯片为核心的系统硬件设计进行了研究,通过TLC320AD50C对语音信号进行A/D转换,通过TMS30VC5402对语音信号进行训练和识别,并由LCD显示结果;该系统核心识别算法采用动态时间规整(DTW)算法.主要流程包括预处理、端点检测、提取特征值、模式匹配和模板训练,取得了很好的识别效果.所做的研究工作,是为汉语孤立词语音识别进入商业化进行有效的探索.  相似文献   

5.
介绍了一种基于连续M元高斯混合密度的隐马尔可夫模型(HMM)的非特定人孤立词语音识别仿真系统。通过研究模型状态数、训练时间以及特征参数选取对语音识别率的影响,得出HMM状态数取4,训练次数为20次,特征参数选取48维LPCC和MFCC的混合参数,可使语音识别系统对于汉语孤立词的识别率达到90%。  相似文献   

6.
基于连续HMM的孤立语音鲁棒性识别方法   总被引:5,自引:1,他引:5  
对于基于连续稳马尔可夫模的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Mel倒谱参数(RAS_MFCC+△RAS_MFCC),进行特征参数级的去噪,明显地改善了系统的噪声鲁棒性。  相似文献   

7.
嵌入式系统正逐渐成为语音识别实际应用的首选平台。该文在嵌入式平台上研究HMM连续语音识别的计算复杂度要素,提出特征系数屏蔽方法和综合剪枝相结合的瘦身计算方法,降低计算复杂度并保持识别率。该方法在嵌入式平台上研究的实验数据表明,HMM连续语音识别瘦身系统与基线系统相比,计算时间从基线系统的100%降低到27.91%,识别率仅从基线系统的89.65%下降到89.41%。  相似文献   

8.
陈慧  芮贤义 《电声技术》2016,40(8):36-39
在VC++的编程环境下设计了一个小词汇量孤立词非特定人的汽车语音识别系统,系统中的识别词汇都是汽车驾驶员在驾驶过程中可能做的一些手控操作.语音预处理采用的是改进后的端点检测算法.实验分析时,在测试数据中加入噪声库(NoiseX-92)中的车内噪声来模拟汽车驾驶环境,并提出随机映射梅尔频率倒谱系数来增强噪声环境下系统的鲁棒性.测试数据表明,使用随机映射特征参数使得系统的抗噪声能力得到了很大的提升.  相似文献   

9.
一种适于非特定人语音识别的并行隐马尔可夫模型   总被引:2,自引:0,他引:2  
为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语非特定人孤立数字的识别实验表明,PHMM较之传统CHMM使识别性能及噪声鲁棒性都得到了改善。  相似文献   

10.
设计了一种基于连续概率密度隐含马尔科夫模型的汉语语音识别系统。在实时录音的情况下,利用该语音识别系统,不同的人对10条2~4个字的语音命令进行识别,准确率可达到90%,识别时间1.5~3s。  相似文献   

11.
基于经典隐马尔可夫模型的汉语连续语音识别系统   总被引:1,自引:0,他引:1  
该文构造了基于经典隐马尔可夫模型(Hidden Markov Model,HMM)的汉语连续语音识别系统,定量地分析与评价了经典HMM的性能。  相似文献   

12.
We investigate the performance of an isolated word speech recognition (IWSR) system for degraded speech. We propose a recognition scheme which adapts itself to mild degradations in speech and improves the reliability of recognition significantly. The scheme does not use a priori information regarding the nature and extent of noise. We suggest techniques which adaptively discriminate between noisy and noise-free parameters by using a selective weighting procedure in the final distance calculation. A new measure of performance is adopted to compare several recognition schemes using small data sets. Our scheme lends itself to greater flexibility in handling degradations in speech input than do the existing recognition schemes.  相似文献   

13.
ADPCM语音解码合成输出系统的设计   总被引:3,自引:0,他引:3  
杨白  唐宁  汪洋  屈星 《光通信研究》2009,35(1):33-35
文章介绍了自适应差分脉冲编码调制(ADPCM)技术的编解码和脉冲宽度调制(PWM)技术的基本原理,研究在现场可编程门阵列(FPGA)上通过有限状态机方式实现ADPCM语音解码算法,利用PWM技术将解码后的数字语音信号转化为PWM波,以此直接驱动喇叭发出声音,输出的合成语音质量良好.  相似文献   

14.
详细介绍一种基于神经网络的自学习非特定人语音识别方法,首次介绍一种语音识别知识的自动检验方法——LVV法,给出系统原理图和知识库的自动完善原理;介绍一种LEA判别法,实现梯度牛顿有效结合神经网络快速学习方法,并给出了实验结果。  相似文献   

15.
提出了一种基于单片机的非特定人语音控制系统,介绍了系统的硬件结构及设计方法.该控制系统以STC12LE5A60S2单片机作为处理器,利用ICRoute公司的LD3320模块进行语音识别,并通过RF905进行无线通信实现对L298N电机驱动模块的控制从而实现了对玩具车行驶的语音控制.该玩具车能够在按键和语音2种方式的控制下实现前进、后退、左转和右转等功能.在车体的前方和两侧各安放1个红外探头,可以实现行驶中自动避障功能.此方案对于智能玩具及相关研究具有较高的价值.  相似文献   

16.
Kim  N.S. Un  C.K. 《Electronics letters》1993,29(9):735-736
A technique for smoothing hidden Markov model parameters based on the concepts of deleted estimation and probabilistic mapping is proposed. The proposed algorithm is closely related to deleted interpolation in its approach and is shown to yield higher recognition rate than the distance-based smoothing and co-occurrence smoothing methods.<>  相似文献   

17.
This paper describes a method for recognizing Chinese tones in continuous speech. The first and second order differentials of the fundamental frequency logarithmically converted are used as feature parameters. A left-to-right hidden Markov modeling with five states, each of which is modeled by a single Gaussian distribution, expresses each of Chinese tones. Non-voiced portions are coded by random values normally distributed to uniformly deal with all the time frames in an utterance. Speaker dependent tone recognition was conducted for ten speakers. The average rate of 81.8% was obtained for these speakers.  相似文献   

18.
随着语音编码技术的不断发展,出现了各种不同的编解码方案,在进行应用不同编码系统的相互通信过程中,两种系统的连接就很麻烦,或者为了适应不同的通信环境需要改变编解码方式时,更改编码方式也是一件费时费力的事情。主要提出了使用DSP的TMS320C54X 和配合一些外围电路,实现一种通用编解码器的方案,能够很简单地更改不同编解码方式,满足不同的通信要求。  相似文献   

19.
在数字电视节目制作中,抠像是一种应用广泛的电视特技,它能将人们置身于各种奇妙的环境中,极大丰富了电视节目的表现形式.从抠像的基本原理入手,通过改进抠像算法,设计了一款基于FPGA的数字色键器,并在Quanus Ⅱ中对设计进行了仿真验证,最后通过硬件测试证明了系统设计方法的正确性和可靠性.该色键器能较好地应用于日常的电视节目制作过程中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号