首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
在查询类对话语音识别系统中,词汇中的少数几类词往往占有词汇量的很大部分,利用这一重要特点,可以对传统的基于单树结构的搜索算法进行改进。本文在采用基于类的语言模型的条件下,在查询类对话语音识别系统中,对词汇中的若干大类单独建树,从而免除了多数词汇的语言模型look-ahead计算时间和存储空间,并实现了语言分的提前精确运用。针对机票预订口语对话系统的实验表明,该搜索策略与单树方法相比,在同样的计算资源条件下,时间效率有显著提高。  相似文献   

2.
在查询类对话语音识别系统中,词汇中的少数几类词往往占有词汇量的很大部分,利用这一重要特点,可以对传统的基于单树结构的搜索算法进行改进。本文在采用基于类的语言模型的条件下,在查询类对话语音识别系统中,对词汇中的若干大类单独建树,从而免除了多数词汇的语言模型look—ahead计算时间和存储空间,并实现了语言分的提前精确运用。针对机票预订口语对话系统的实验表明,该搜索策略与单树方法相比,在同样的计算资源条件下,时间效率有显著提高。  相似文献   

3.
具有确定词表的词组语音识别是语音识别研究的一个重要方面,应用相当广泛。本文在简单介绍词组语音识别之后给出了一个基于连续语音识别算法和词树约束的汉语词组语音识别方法。这种方法通过在束搜索连续语音识别算法中引入词树约束信息,发挥了连续语音识别算法的优点,并且充分利用了确定词表的约束信息,提高了计算和搜索的效率。然后介绍了约束词树和它的高效存储结构,这种结构提高了约束词树的存储效率和在识别搜索中的检索效率;最后给出实验的结果和讨论并进行简要的总结。  相似文献   

4.
5.
基于HTK的语音识别系统设计   总被引:11,自引:0,他引:11  
HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。文中主要介绍了HTK的基本原理和软件结构,并且针对HTK工具箱进行了二次开发,设计开发了一套完整的语音识别输入系统及其相应的测试平台,并验证了该语音识别系统的识别率,实验表明,该系统取得了较好的语音输入效果。  相似文献   

6.
语音识别技术近些年来发展非常迅速,并且在许多方面已经有了很好的应用。以语音识别技术在对话娃娃中的应用为例,阐述如何利用语音识别技术来设计智能控制系统,并详细介绍了系统的结构和原理。该系统具有很好的扩展性,稍微做些改动,就可以设计出各种各样的语音控制系统。  相似文献   

7.
精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。  相似文献   

8.
《计算机工程》2018,(1):199-205
为提高普米语语音识别系统的性能,引入深度学习模型进行普米语语音识别,该模型是一个高容量复杂的网络模型。以Kaldi语音识别工具包为实验平台,分别训练5种不同的声学模型,且这5种模型中包含一个有4隐层的深度神经网络模型。比较不同声学模型得到的语音识别率发现,G-DNN模型比Monophone模型的语音识别率平均提升49.8%。实验结果表明,当增加训练集的普米语语音语料量时,基于深度学习的普米语语音识别率会提升,而基于深度学习的普米语语音识别系统的鲁棒性比其余4个声学模型的普米语语音识别系统的鲁棒性更强。  相似文献   

9.
基于性别识别的分类CHMM语音识别   总被引:2,自引:0,他引:2       下载免费PDF全文
对语音识别进行了探讨,提出一种通过性别识别对连续隐马尔可夫模型(CHMM)分类的方法,在此基础上进行语音识别。首先,通过计算性别判定语音信号的Mel频率倒谱系数(MFCC)使用CHMM对说话人性别进行识别,然后再根据不同性别使用分类CHMM进行语音识别。最后通过实验验证了方法的有效性。  相似文献   

10.
基于粒子群优化神经网络的语音情感识别   总被引:1,自引:0,他引:1  
提出了一种基于粒子群优化算法的人工神经网络,并把它应用到语音情感识别系统中。依据情感的维度空间模型,分别提取了韵律特征与音质特征,研究了谐波噪声比特征随情感类别的变化。利用粒子群优化算法(PSO)训练随机产生的初始数据,优化神经网络的连接权值和阈值,快速地实现网络的收敛。在实验中比较了BP神经网络、RBF神经网络与PSO神经网络分别用于语音情感识别的识别率,PSO神经网络的平均识别率高于BP神经网络6.7%,高于RBF神经网络5.4%。结果显示,粒子群优化神经网络用于语音情感识别提高了识别性能。  相似文献   

11.
隐马尔可夫模型工具包(HTK)的HParse命令根据用户以正则表达式形式定义的任务语法来生成HTK可用的底层表示的语音识别网络,但不是每个语句都能用正则表达式表示出来。针对该问题,提出基于HTK的语音识别网络算法用于识别网络的优化问题,给出该算法的具体实现过程。实验结果表明,在保证识别率的前提下,优化后的语音识别网络在语音识别系统中所用的时间比较短,算法是有效的。  相似文献   

12.
针对语音识别的特点,对BP神经网络在语音识别技术中的应用进行了探索性研究,进而结合人工智能领域较为有效的方法——遗传(GA)算法,针对传统BP算法识别准确率高但训练速度慢的缺点,对BP网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。  相似文献   

13.
针对语音识别的特点,对BP神经网络在语音识别技术中的应用进行了探索性研究,进而结合人工智能领域较为有效的方法——遗传(GA)算法,针对传统BP算法识别准确率高但训练速度慢的缺点,对BP网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。  相似文献   

14.
基于神经网络的语音识别技术研究   总被引:5,自引:0,他引:5  
对BP神经网络在特定人语音识别技术中的应用进行了探索性的研究,进而对非特定人语音识别做了一定的实验和研究。通过对比分析了传统的语音识别方法——模板匹配法和人工神经网络语音识别方法的优缺点。神经网络可以得到较高的识别准确度,但是训练速度慢是它的弱点,因此,针对经典的BP算法训练速度慢的缺点,对BP网络加以改进,提高网络训练速度,通过改进使神经网络用于语音识别的各种优越性充分发挥。  相似文献   

15.
本文采用语音识别和无线网络技术设计一种具有语音识别功能的无线网络节点,实现语音识别与理解功能,并通过ZigBee技术实现了网络节点间的互联和控制。测试结果表明,语音识别率可达到98%以上,具有较高的应用价值。  相似文献   

16.
基于模糊聚类神经网络的语音识别方法   总被引:8,自引:0,他引:8  
刘宇红  刘桥  任强 《计算机学报》2006,29(10):1894-1900
提出了一种基于模糊神经网络的语音识别方法.该方法以模糊系统模型为基础,利用改进的模糊聚类辨识算法,构成一种新型的模糊聚类神经网络(FCNN),并将其作为概率密度函数的估计器,对每个状态的输出进行预测.它不仅能有效地在语音识别中引入帧间相关信息,而且能克服状态输出概率密度函数为混合高斯分布的束缚.通过对非特定人汉语孤立词和连续音节的语音识别实验,证实了该方法的有效性.  相似文献   

17.
基于语音识别技术和无线传感网络,设计了一套能够通过远程语音遥控进行便捷控制的智能家居系统;分析了语音识别技术的基本原理和无线传感网络在智能家居中的应用,重点阐述了系统的设计方案以及主要硬件组成和软件设计思路;通过对特定人语音识别的训练和测试,该系统能够以较高的识别率和灵敏度完成对智能家电的远程控制;系统实时输出识别结果,识别速度快,抗干扰能力强,识别率可以达到98%,在语音远程控制领域具有广阔的市场前景和应用推广价值。  相似文献   

18.
随着语音识别研究的深入,提高通用识别引擎的精度变得越来越困难。但对具体的语音识别任务,结合相应的背景,采取相应的措施,有可能达到很理想的识别精度。在已知语音输入为某有限集元素之一的情形,利用文本在发音上的相似度可以大大提高识别的精度。本文首先介绍了文音相似度的概念,然后给出了利用文音相似度设计开发语音查询系统的过程和例子。  相似文献   

19.
语音情感识别是计算机理解人类情感最直接的方式,是实现人机交互智能化的重要渠道,但识别模型的性能需要进一步提升。为实现这一目标,提出一种基于循环卷积神经网络的语音情感识别模型ARCNN-GAP。其中,循环卷积层具有弹性路径,在确保网络深度的同时能保证优化时的梯度回传,提取更加有效的情感特征;全局平均池化运算可以在减少计算复杂度的同时降低过拟合风险;而注意力机制能够使模型更多关注情感相关特征。使用韵律特征和谱特征的融合特征在CASIA和EMO-DB数据库上进行研究,分别取得了83.29%和75.28%的识别率。实验结果表明:ARCNN-GAP具有更好的识别性能和泛化性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号