首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
数字语音识别是语音识别一个极其重要的分支,其在现实生活中的应用愈加广泛。HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。从HTK的基本原理和软件结构出发,设计了一个基于HTK的数字语音识别系统,并验证了其识别效率。随后,通过更换识别单元,更改特征参数的维数和增加高斯混合分量的个数来考虑不同因素对系统性能的影响。最后,通过比较试验,验证了识别单元、高斯混合分量的数目以及MFCC维数的适当组合可提高系统的正确识别率。  相似文献   

2.
基于HTK的语音识别系统设计   总被引:3,自引:0,他引:3  
石现峰  张学智  张峰 《微机发展》2006,16(10):37-38
HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。文中主要介绍了HTK的基本原理和软件结构,并且针对HTK工具箱进行了二次开发,设计开发了一套完整的语音识别输入系统及其相应的测试平台,并验证了该语音识别系统的识别率,实验表明,该系统取得了较好的语音输入效果。  相似文献   

3.
本文简单介绍了几种减少噪音带来的待识别信号特征与模型特征不匹配的方法,针对噪音环境下语音特征的变化特点,重点分析了归一化方法,并对动态范围调整方法做了重点的介绍。通过分析孤立词识别中存在的问题,提出了在连续语音特征曲线中基于动态范围调整的新方法。  相似文献   

4.
语音识别也称自动语音识别,是将人类语音中的词汇转换为计算机可读的输入,而HTK(HMM ToolKit)是构建隐马尔可夫模型和识别的工具包,最早是由英国剑桥大学工程系设计和开发的,目前广泛应用于语音识别、语音合成、字符识别等多个领域。本文主要是使用语音识别工具HTK建立语音识别系统。  相似文献   

5.
介绍一个连续语音识别系统的构成以及HTK工具的使用.然后尝试利用该工具搭建一个连续语音识别系统,使用该系统在一个非特定人的大词汇量连续语音数据库——TIMIT上进行实验,讨论如何选择不同的声学单元进行建模.并且对模型的参数进行一系列的改进。  相似文献   

6.
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolKit)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。  相似文献   

7.
语音识别技术经过半个世纪的发展,目前已日趋成熟,其在语音拨号系统、数字遥控、工业控制等领域都有了广泛的应用。由于目前常用的声学模型和语言模型的局限性,计算机只能识别一些词汇或一些句子。语音识别系统在语种改变时,往往会出现错误的识别结果。针对上述问题,结合隐马尔可夫模型原理,在HTK语音处理工具箱的基础上构建了中英文特定词语音识别系统。该系统通过代码控制整个构建过程,使其在更换新的训练数据和词典后能快速生成对应的识别模型。  相似文献   

8.
隐马尔可夫模型(HMM)基本技术是语音识别中较为成功的算法,HMM具有较强的对时间序列结构的建模能力。文章在HMM Tool Kit(HTK)的基本技术之上,建立了一个以HMM为基础的提供连续语音识别服务的网站系统。该网络系统前台界面程序主要通过ASP.NET 2.0和Visual C#在Windows server 2003平台上建立,后台识别程序通过ATL实现。经过测试,该系统展示出其在语音数据检索中的应用价值。  相似文献   

9.
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法:在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。  相似文献   

10.
HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成以及字符识别等领域。文章在详细介绍了语音识别的过程、原理及相关概念的基础之上,介绍了HTK的基本原理和软件结构,以及使用HTK完成语音识别任务的整个过程。最后,讨论声学单元等一系列的模型参数的选择,使用HTK搭建一个简单连续汉语语音输入系统。  相似文献   

11.
随着机器人技术不断发展,本文提出机器人的语音识别这一智能人机交互方式。在研究了基于HMM语音识别基本原理的情况下,在实验室的机器人平台上,利用HTK和Julius开源平台,构建了一个孤立词的语音识别系统。利用该语音识别系统可以提取语音命令用于机器人的控制。  相似文献   

12.
基于HTK的维吾尔语连续语音声学建模   总被引:2,自引:1,他引:2  
维吾尔语属于阿勒泰语系突厥语族,是黏着性语言。本文根据维吾尔语的特点,分析设计了维吾尔语语音识别系统的总体结构,讨论了维吾尔语最佳识别基元的选择方法,提出建立基于决策树聚类的上下文相关模型,并采用混合高斯分布(GMD)拟合观测概率分布,优化维吾尔语连续语音中HMM模型系统以提高识别性能。最后给出实验对比,得出结论,为今后维吾尔语连续语音识别研究提供依据。  相似文献   

13.
基于HTK的语音识别的并行化研究与实现   总被引:1,自引:0,他引:1  
刘勇进  史晓东 《计算机应用》2009,29(4):1052-1055
详细地分析了语音识别的过程,给出了相应的算法描述,并分析了语音识别并行化的可能性。将并行计算的思想应用于语音识别的算法中,使用多线程技术,并引入避免竞争条件的机制,在多核计算机上并行地计算HMM模型节点的似然率,从而得到语音识别的并行化算法。分析了该并行化算法的性能,同时在语音识别工具包HTK 3.4上实现了这种并行化算法。基于WSJ0语料库的实验结果表明该并行化算法在不影响识别结果的前提下能够有效地提高语音识别的实时性能。  相似文献   

14.
基于HTK的汉语语音售票系统的设计与实现   总被引:1,自引:0,他引:1  
为了解决火车站售票系统处理售票业务效率低、速度慢和低智能化等问题,提出了一种基于HTK(HMM Tool Kit,隐马尔科夫模型工具箱)的汉语语音售票系统。详细阐述了基于HTK的语音识别等关键技术的基本原理,并给出了系统实现的关键代码。在语音识别测试中,语句级识别正确率为98.00%;字词级识别正确率达到了98.67%。实验结果表明所提出的语音售票系统具有较高的可行性与实用性。  相似文献   

15.
语音驱动唇形动画的同步是人脸动画的难点之一。首先以音节为识别单位,通过严格的声韵母建模方法,利用HTK工具包,识别得到语音文件中的音节序列与时间信息;然后利用基本唇形库和音节到唇形映射表,获得与音节序列对应的唇形序列;利用唇形序列的时间信息插值播放唇形序列,实现语音驱动的唇形动画。实验表明,该方法不仅大大减少了模型数目,而且能准确识别音节序列以及时间信息,可有效地实现语音与唇动的同步。  相似文献   

16.
语音识别技术在嵌入式系统上的应用是当前的热点和难点。本文在三种不同的嵌入式系统上建立了基于HMM的非特定人大词汇表连续语音识别的实验平台,对语音识别的实时性能进行了测试分析,讨论了非特定人连续语音识别系统在不同嵌入式平台上的可行性。  相似文献   

17.
对嵌入式语音识别系统所涉及的硬件、外围接口电路作了分析比较,重点分析了S3C2410和存储模块;对嵌入式操作系统Windows CE和Linux作了介绍,重点分析了Linux及其引导程序BootLoader;对嵌入式系统识别算法的选取作了分析研究。  相似文献   

18.
本文主要研究利用改进的HMM模型从非特定人的连续语音中识别出声母、韵母,以及每个音的持续时间,提出了这些语音信息与嘴巴的扩张程度、嘴型和持续时间等口型信息的关系,以便把它们传送给步进电机,(以驱动实物模型。  相似文献   

19.
隐马尔可夫模型工具包(HTK)的HParse命令根据用户以正则表达式形式定义的任务语法来生成HTK可用的底层表示的语音识别网络,但不是每个语句都能用正则表达式表示出来。针对该问题,提出基于HTK的语音识别网络算法用于识别网络的优化问题,给出该算法的具体实现过程。实验结果表明,在保证识别率的前提下,优化后的语音识别网络在语音识别系统中所用的时间比较短,算法是有效的。  相似文献   

20.
基于HTK的维吾尔语连续数字语音识别   总被引:4,自引:0,他引:4  
根据HTK工作原理,设计了维吾尔语连续数字识别的训练步骤,进行嵌入式重估训练,建立了基于音素级单位的HMM模型,建立了语言模型,实现了维吾尔语非特定人小词汇量亿以内的数字语音识别.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号