共查询到19条相似文献,搜索用时 109 毫秒
1.
讨论由说话人引起的声学差异基础上,研究两种基于模型的自适应算法最大似然线性回归(MLLR)和最大后验概率(MAP)。实验结果表明,不论采用哪种自适应都能使识别率有一定的提升。两种算法之间的差异性在于MAP具有良好的渐进性,但收敛性较差,而MLLR在很大程度上改善了收敛特性,但其渐进特性却不如MAP。 相似文献
2.
WANG Kun-qing 《数字社区&智能家居》2008,(34)
语音识别是人工智能最基础性课题,该课题研究者通过对隐马尔可夫模型这一数学模型的扩领域应用,解决了声学、语言学、句法等统计知识相关性问题。文章系统阐述了隐马尔可夫模型原理以及在语音识别中的应用过程,从而为更多研究者了解和认识。 相似文献
3.
本文主要介绍了HMM与自组织神经网络结合的语音识别方法的模型及其算法。并且在该模型和算法的基础上,通过试验。对比了HMMNN模型和CDHMM模型在特定人语音识别和非特定人语音识别两个方面的识别效果,验证了HMMNN模型的优越性。最后分析了HMMNN的识别优越性从何而来。 相似文献
4.
基于混合模型HMM/RBF的数字语音识别 总被引:5,自引:0,他引:5
提出一种离散隐马尔科夫模型(hidden Markov model,HMM)和径向基函数(radial basis function,RBF)神经网络相结合应用于汉语数码语音识别(Mmandarin Ddigit Speech Recognition,MDSR)的方法,同时采用了一系列改进方法,使汉语数码语音的识别率达到了99.7%。 相似文献
5.
6.
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法:在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。 相似文献
7.
8.
基于MFCCs滤波的电话语音识别的通道补偿方法 总被引:4,自引:0,他引:4
本文提出一种基于MFCCs滤波的通道补偿方法RMFCC。它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价。RMFCC的性能也优于CMS和二级CMS。通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证实了抑制非常低的调制频率是进行顽健的电话语音识别的有效途径。 相似文献
9.
彭靓 《计算机光盘软件与应用》2012,(24):110+127
随着计算机技术的不断发展和信息技术的不断进步,各类智能机器也逐步进入到人们的生活中.语音识别是一种前景广阔、社会效益广泛、经济效益明显的技术,在快速发展的同时也不可避免地产生了一些问题.本文主要针对基于HMM和神经网络的语音识别系统进行了细致的分析,期待能对我国语音识别系统的研究和实践提供有效的借鉴和参考. 相似文献
10.
VQ/HMM二级音节识别的研究 总被引:1,自引:0,他引:1
HMM技术在语音识别是得到较为成功的应用,然而VQ/HMM对在词表的识别速度及识别率仍不理想,文中根据系统实现中的实时性和识别率的要求,提出了初始码本均匀法,对参加训练的各音先对其求平均,然后用各音的平均值组成初始矢量的空间,并采用码本快速迭代法以及标号直方图法与HMM识别相结合的二级识别方法,提高了系统的识别率和识别速度,此方法简单,易于实时化。 相似文献
11.
该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。
相似文献
相似文献
12.
该文讨论了不同非母语条件下的语音识别说话人自适应问题,提出了说话人分类和声学模型合并两种不同的自适应方法,并用实验说明了所提方法的有效性和实用性。 相似文献
13.
14.
介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点是计算量极大,较难实用,对此本文提出了两个改进技术:(1)利用后验概率压缩词网;(2)利用单词的时间信息限制状态统计量的计算范围。实验测定Lattice-MLLR的误识率比传统MLLR相对下降了3.5%,改进技术使Lattice-MLLR计算量下降幅度超过了87.9%。 相似文献
15.
针对Baum—Welch算法依赖于初始值的选取而容易陷入局部最优解的问题,基于全局优化的思想,提出了一种改进的HMM语音识别算法。该算法将遗传算法应用到HMM模型训练中,得到了全局最优解。实验结果表明,所提出的算法使用有效,识别率显著提高。 相似文献
16.
汉语连续语音识别中经典HMM的实验评测 总被引:1,自引:1,他引:1
定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率这两个自由度上的各种组合,研究了经典HMM模型的复杂度、稳健性、精确性与训练集合的数据量、训练时间、解码效率等特性之间的关系;并且通过实验分析了多候选的构造和剪枝的意义。该文构造的系统与具有国内最高水平的 THEESP系统的识别率相当,所得实验结果和结论为汉语语音识别的深入研究提供了必要的参考和依据。 相似文献
17.
利用HMM嵌入训练方法建立汉语电话连续语音声学模型 总被引:2,自引:0,他引:2
文章介绍了用HMM嵌入训练方法来建立连续语音的声学模型,并对基于音素的HMM和基于音节的HMM进行了比较,并以此为基础建立了一个实用的银行电话语音服务系统。 相似文献
18.
本文提出一种基于词格信息的置信度计算方法,估计自适应语音识别结果的可靠性,将不可靠的语音从自适应训练集中去掉,从而减小无监督自适应与有监督自适应间的性能差异,提高无监督自适应的性能。 相似文献