首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
嵌入式语音识别系统性能分析   总被引:1,自引:1,他引:0  
语音识别技术在嵌入式系统上的应用是当前的热点和难点。本文在三种不同的嵌入式系统上建立了基于HMM的非特定人大词汇表连续语音识别的实验平台,对语音识别的实时性能进行了测试分析,讨论了非特定人连续语音识别系统在不同嵌入式平台上的可行性。  相似文献   

2.
左琳  陈鑫铎 《福建电脑》2005,(12):27-28,35
本文主要介绍了HMM与自组织神经网络结合的语音识别方法的模型及其算法。并且在该模型和算法的基础上,通过试验。对比了HMMNN模型和CDHMM模型在特定人语音识别和非特定人语音识别两个方面的识别效果,验证了HMMNN模型的优越性。最后分析了HMMNN的识别优越性从何而来。  相似文献   

3.
提出了Braille立体盲文的平面化输入方法,研究了非特定人孤立词语音识别技术,建立了一种新型盲人专用信息输入方法。该方法将Braille立体盲文抽象为平面符号,实现盲文的平面化输入及识别,并将连续隐马尔可夫模型的语音识别算法应用于非特定人孤立词语音系统中,利用嵌入式DSP系统实现了语音与盲文信号采集、处理和识别,为盲人信息输入提供了新的途径。实验结果表明,该系统语音指令识别率>92%,盲文字符识别率>91%。  相似文献   

4.
一种机器人智能语音识别算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
周璐璐  邓江洪 《计算机测量与控制》2014,22(10):3267-32693273
针对智能机器人在非特定人语音识别中识别率偏低的问题,提出了一种双门限的端点检测算法,精确地检测出了语音端点,对分形维数和Mel频率倒谱系数(MFCC)进行结合,同时基于隐马尔可夫(HMM)模型,提出了智能机器人命令识别系统;在实验室环境下,利用Cool Edit软件录制了5男5女的语音,采样率为8kHz,精度为16位,内容为5个命令词,每个词均被采集6次,将每人的前3次发音作为模板语音,后3次发音作为测试语音,实验结果表明,系统识别率可以达到85%以上,MFCC与分形维数混合的语音特征参数的算法提高了系统识别率,优化了系统性能;该方法用于非特定人语音智能识别是可行的、有效的。  相似文献   

5.
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音。目前最新发展水平的手语识别系统在实际应用中应该解决非特定人手语识别问题。该文在分析非特定人手语识别特点-数据多且差异大、模型训练难收敛、对不同人数据的特征提取需求更迫切-的基础上,提出了SOFM/HMM模型,将自组织特征映射(SOFM)很强的特征提取功能和隐马可夫模型(HMM)良好的处理时间序列属性结合在一个新颖的框架下,并把该模型应用到非特定人中国手语识别中,实验结果表明,SOFM/HMM模型手语识别率比传统的HMM模型提高近5%。  相似文献   

6.
针对盲人与低视力患者群体,提出并设计了一种基于非特定人语音识别技术的嵌入式盲人手机音控系统;系统采用AD1836A为语音信号采集单元、Blackifn533 DSP为语音信息处理单元核心,通过建立连续隐马尔可夫模型(CHMM)、选取美尔频率倒谱系数(MFCC)为语音特征参数,采用Baum-Welch算法及最小误差分类(MCE)方法改进HMM模型参数,设计实现了包含10个数字(0~9)和25条语音指令的全语音手机控制平台,并通过指令分级识别方式大大提高了语音指令的整体识别率。  相似文献   

7.
现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型(CDCPM)的维吾尔语非特定人语音识别。CDCPM用中心距离正态(CDN)分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明:恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97.90%(集内)和94.76%(集外),取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。  相似文献   

8.
本文提出了一种基于模糊自适应Hamming网络的连续汉语识别方法,用模糊自适应Hamming网络来估计HMM中的状态观测概率。结合HMM对动态时间序列极强的建模能力和神经网络的分类决策能力来提高语音识别的准确率。通过对非特定人汉语连续词的语音识别实验,证实了该方法的有效性。  相似文献   

9.
在基于隐Markov模型(Hidden Markov Model,HMM)的统计参数藏语语音合成中引入了DAEM(Deterministic Annealing EM)算法,对没有时间标注的藏语训练语音进行自动时间标注。以声母和韵母为合成基元,在声母和韵母的声学模型的训练过程中,利用DAEM算法确定HMM模型的嵌入式重估的最佳参数。训练好声学模型后,再利用强制对齐自动获得声母和韵母的时间标注。实验结果表明,该方法对声母和韵母的时间标注接近手工标注的结果。对合成的藏语语音进行主观评测表明,该方法合成的藏语语音和手工标注声、韵母时间的方法合成的藏语语音的音质接近。因此,利用该方法可以在不需要声、韵母的时间标注的情况下建立合成基元的声学模型。  相似文献   

10.
本文提出了类声母类韵母概念, 并将两段码书的矢量量化技术应用于孤立汉字语音识别系统。考虑到类圣母与类韵母的短时谱属两种不同类型, 各采用不同的帧长和帧间隔进行分析, 相应生成类声母段码书和类韵母段码书用以压缩数据量。理论分析和实验表明, 该方法优于通用码书识别方法, 使系统性能有明显改善, 而且计算代价下降, 便于进一步扩大大词汇量。用这一思想构成字表为16个单音的识别系统, 特定人语音识利精度达98%以上, 非特定人语音识利精度为91.3%  相似文献   

11.
基于SCHMM非特定人关键词检出语音识别系统   总被引:1,自引:0,他引:1  
乔跃刚  赵铁军  李生  朱莉 《计算机应用》2005,25(Z1):295-296
设计了一个基于半连续隐马尔可夫模型(SCHMM)以音节为基元的非特定人汉语小词表关键词确认语音识别系统.系统采用类似于Baum_Welch算法对VQ码书和HMM参数一起优化得到可靠的声学模型,并通过利用基于前向-后向搜索策略,来充分利用上下文相关信息,使关键词检出率在每个词每小时虚警率为10时已达到93%以上.还分析了码书大小对系统识别率的影响,并提出了以音节模型归一化算术均值作为关键词置信度的语音验证策略.  相似文献   

12.
用于拟人机器人的嵌入式语音交互系统研究   总被引:3,自引:0,他引:3  
陈斌  郭大勇  施克仁 《机器人》2003,25(5):452-455
本文介绍了一种用于拟人机器人的嵌入式语音交互系统.系统采用高质量的语音 采集模块及语音输出模块,以高性能数字信号处理器(DSP)TMS320VC5402为硬件核心.HMM语音识别引擎以LPC倒谱及其差分分量作为语音特征表达,改进的Baum Welch重估算法完成了多观察值序列下的语音模板训练.同时进行了语音特征不同表达形式对识别结果影响的对比实验.系统外围控制程序完成识别结果提示以及与上位机的通讯.系统在词汇量为200的非特定人、孤立词识别上取得了很好的效果.  相似文献   

13.
基于HTK的维吾尔语连续数字语音识别   总被引:2,自引:0,他引:2  
根据HTK工作原理,设计了维吾尔语连续数字识别的训练步骤,进行嵌入式重估训练,建立了基于音素级单位的HMM模型,建立了语言模型,实现了维吾尔语非特定人小词汇量亿以内的数字语音识别.  相似文献   

14.
姜莹  俞一彪 《计算机工程与设计》2012,33(4):1482-1485,1490
提出一种新的基于语音结构化模型的语音识别方法,并应用于非特定人数字语音识别.每一个数字语音计算倒谱特征之后提取语音中存在的对说话人差异具有不变性的结构化特征——全局声学结构(acoustical universal structure,AUS),并建立结构化模型,识别时提取测试语音的全局声学结构,然后与各数字语音的结构化模型进行匹配.测试了少量语料训练下的识别性能并与传统HMM (hidden Markov model)方法进行比较,结果表明该方法可以取得优于HMM的性能,语音结构化模型可以有效消除说话人之间的差异.  相似文献   

15.
针对语音识别系统对实时性和便携性的要求,提出一种基于MFCC/SVM在DM6446嵌入式系统开发平台上的实现方法,实现了一个面向非特定人的语音识别系统,将有向无环图多类分类支持向量机算法移植到该平台。并在该平台用DAG方法对非特定人孤立词和连接词进行语音识别,比隐马尔可夫模型有明显优势。通过样本预选取算法对训练样本进行预选取处理,并且应用到嵌入式语音识别系统中,大大降低了训练时间和测试时间。  相似文献   

16.
方高林  高文  陈熙霖  王春立  马继勇 《软件学报》2002,13(11):2169-2175
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音。目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题。提出一种将连续手语识别分解成各弧立词识别的分治方法,用于非特定人连续手语识别。把精简循环网(simple recurrent network,简称SRN)作为连续手语的段边界检测器,把SRN分段结果作为隐马可夫模型(hidden Markov models,简称HMM)框架中的状态输入,在HMM框架里使用网格Viterbi算法搜索出一条最佳手语词路径。实验结果表明,该方法的识别效果比单纯使用HMM要好。  相似文献   

17.
基于HMM的安多藏语非特定人孤立词语音识别研究   总被引:1,自引:0,他引:1  
以VC++6.0为开发平台,实现一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的安多藏语孤立词语音识别系统。对有声段语音进行MFCC参数的提取,对提取后的MFCC参数进行矢量量化后训练HMM模型,形成特征模板库,最后进行识别。根据安多藏语的特点,改进端点检测的方法,提高了孤立词语音信号检测的准确性,并进一步提高了识别率。  相似文献   

18.
设计一个基于ADSP-BF531的语音识别系统,该系统采用矢量量化的离散隐马尔可夫模型(DHMM)检测和识别算法完成对非特定人的孤立词语音识别.试验结果表明,该系统对非特定人的孤立词的综合识别率在90%以上.该系统具有小型、高速、可靠以及扩展性好等特点;可应用于许多特定场合,有很好的市场前景.本文介绍该系统CODEC、片外RAM、ROM以及CPLD等与DSP的接口设计,语音识别运用的矢量量化、Mel倒谱参数、Viterbi等有关算法及其实际应用效果.  相似文献   

19.
本文主要研究利用改进的HMM模型从非特定人的连续语音中识别出声母、韵母,以及每个音的持续时间,提出了这些语音信息与嘴巴的扩张程度、嘴型和持续时间等口型信息的关系,以便把它们传送给步进电机,(以驱动实物模型。  相似文献   

20.
在SEED-DEC5502DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,和传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用。系统采用改进的基于语音对数域能量变化率的实时端点检测算法,只对检测的有声段语音进行特征提取,从而减少了要处理的语音帧数;提出了改进的共享声学单元状态发射概率共享的解码策略,进一步降低了计算负担。实验表明系统在100词条的情况下识别率达到98.1%,识别时间为1.03倍实时。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号