排序方式: 共有29条查询结果,搜索用时 15 毫秒
1.
杨嵩 《计算机与数字工程》2012,40(4):35-38
HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成以及字符识别等领域。文章在详细介绍了语音识别的过程、原理及相关概念的基础之上,介绍了HTK的基本原理和软件结构,以及使用HTK完成语音识别任务的整个过程。最后,讨论声学单元等一系列的模型参数的选择,使用HTK搭建一个简单连续汉语语音输入系统。 相似文献
2.
语音驱动唇形动画的同步是人脸动画的难点之一。首先以音节为识别单位,通过严格的声韵母建模方法,利用HTK工具包,识别得到语音文件中的音节序列与时间信息;然后利用基本唇形库和音节到唇形映射表,获得与音节序列对应的唇形序列;利用唇形序列的时间信息插值播放唇形序列,实现语音驱动的唇形动画。实验表明,该方法不仅大大减少了模型数目,而且能准确识别音节序列以及时间信息,可有效地实现语音与唇动的同步。 相似文献
4.
随着三维操作系统的发展与应用,人机交互方式需要有新的发展,而语音技术作为最自然和最便捷的人机交互方式之一自然得到越来越多的重视。怎样在三维操作系统中进行便捷的人机交互是三维操作系统发展和应用必须解决的一大难题,语音识别功能采用声韵母作为识别基元,使用HTK训练声学模型,语音合成功能采用简单但强大的eSpeak开源软件,语音交互策略使用简单的识别结果确认,采用ATK实现与Space OS的集成。实验结果表明,系统能很好地应用到Space OS中,以语音的方式较好地完成常用的计算机操作。 相似文献
5.
基于HTK实时中文语音路名查询系统的设计和实现 总被引:2,自引:0,他引:2
HTK是英国剑桥大学开发的一个用于创建和处理隐马尔可夫模型的实验工具包,由一整套基于C语言的库函数组成。由于其在语音识别方面处于相对领先地位,且源代码公开便于系统开发调试,所以是进行语音识别研究的一个理想平台。本文介绍了HTK语音识别系统处理流程,提出了基于HTK的实时中文语音路名查询系统的设计和实现,可实现用户实时中文语音输入路名的情况下,系统将识别结果以汉字方式显示在屏幕上。本系统小巧快速,且具有较高的识别率。 相似文献
6.
结合维吾尔语的语音特征和语义信息,在大量电话语音语料库的基础上,以建立维吾尔语连续音素识别平台为目标,通过构建隐马尔科夫模型工具HTK(Hidden Markov Model Toolkit)工具实现了维吾尔语连续音素识别算法:首先根据具体技术指标完成了较大规模电话语音语料库的录制和标注工作;确定音素为基元,通过训练获得了每个音素的HMM(Hidden Markov Model)声学模型,随后对输入的语音进行识别,声学模型在不同的高斯混合数目下,得出了识别结果;统计了32个音素的识别率并对它进行分析,为了进一步提高识别率奠定了基础。 相似文献
7.
8.
基于HTK的连续语音识别系统及其在TIMIT上的实验 总被引:1,自引:1,他引:0
介绍一个连续语音识别系统的构成以及HTK工具的使用.然后尝试利用该工具搭建一个连续语音识别系统,使用该系统在一个非特定人的大词汇量连续语音数据库——TIMIT上进行实验,讨论如何选择不同的声学单元进行建模.并且对模型的参数进行一系列的改进。 相似文献
9.
在2006年年底中央电视台曾经曝光了浙江工商行政管理局披露的4款不合格笔记本电脑,富士通的一款型号为LBP7120的机型便名列其中,然而就在315来临之际,本刊却收到多名读者爆料,反映这款笔记本目前在广州各大IT卖场并未受到任何管束,仍旧有大量产品在进行销售。对此我们也感到非常纳闷,为何一款被曝质量不合格的笔记本仍能在市场上大量销售,而且如此明目张胆呢?为了了解其中的真实情况,本刊记者特别对此展开了深入调查。[编者按] 相似文献
10.