共查询到19条相似文献,搜索用时 109 毫秒
1.
一种改进的隐马尔可夫模型在语音识别中的应用 总被引:1,自引:0,他引:1
提出了一种新的马尔可夫模型——异步隐马尔可夫模型.该模型针对噪音环境下语音识别过程中出现丢失帧的情况,通过增加新的隐藏时间标示变量Ck,估计出实际观察值对应的状态序列,实现对不规则或者不完整采样数据的建模.详细介绍了适合异步HMM的前后向算法以及用于训练的EM算法,并且对转移矩阵的计算进行了优化.最后通过实验仿真,分别使用经典HMM和异步HMM对相同的随机抽取帧的语音数据进行识别,识别结果显示在抽取帧相同情况下异步HMM比经典HMM的识别错误率低. 相似文献
2.
隐马尔可夫模型初值选择是语音识别中一个至关重要的问题,通常的解决办法有两种,一是将参数的初值设置为均匀分布之值,另一种方法是采用“分段K平均法”,这两种方法可能在数收敛于局部最优解或使算法的计算量增大。为了解决以上问题,本文首先在一些特定条件下分析观察序列与HMM参数的关系,然后给出一般情况下HMM初值的估计方法。 相似文献
3.
4.
5.
语音识别中动态时间规整和隐马尔可夫统一模型 总被引:1,自引:0,他引:1
对于目前在语音识别中广泛使用的两种技术即动态时间规整(DTW)技术和隐马尔可夫模型(HMM)的本质联系,提出了二者的统一模型(DHUM,DTW and HMM Uni-fied Model),并分别给出DTW和HM向DHUM的转换关系。文中还提出了用DHUM解决更接近语音实际情况的高阶HMM作语音识别时所面临的运算量过大的问题。中等词表的识别实验结果表明,建立在DHUM之上的识别器的识别性能不低于 相似文献
6.
语音识别中隐马尔可夫模型状态数的选取原则及研究 总被引:13,自引:0,他引:13
文章建立了隐马尔可夫模型(HMM)状态数研究的简单模型,并从信息论的角度出发,对HMM中状态数的选择进行研究,得出HMM信息熵的三个结论,指出了HMM的信息熵由固有熵和附加熵两部分组成,而附加熵又由正附加熵和负重叠附加熵构成。在一定重叠程度下,随着状态数的增加,附加熵逐渐趋向零,从而导致HMM的信息熵渐趋于固有熵。考虑到信息熵的变化趋势,得出语音识别时HMM状态数并非越多越好的结论;指出了汉语单字HMM的状态数取6为宜。 相似文献
7.
8.
9.
10.
提出一种捆绑子空间分布隐马尔可夫模型的训练方法。该方法利用多变量相关系数将语音信号的特征向量进行子空间划分;利用k均值算法捆绑特征向量子空间的高斯分布,得到子空间高斯分布的原型,减少模型的参数。通过实验,用该方法训练的捆绑子空间隐马尔可夫模型,不仅提高了识别器的精确度和识别速度,而且节省了存储空间。 相似文献
11.
本文提出了一种基于模糊自适应Hamming网络的连续汉语识别方法,用模糊自适应Hamming网络来估计HMM中的状态观测概率。结合HMM对动态时间序列极强的建模能力和神经网络的分类决策能力来提高语音识别的准确率。通过对非特定人汉语连续词的语音识别实验,证实了该方法的有效性。 相似文献
12.
一种基于HMM和ANN的语音情感识别分类器 总被引:2,自引:0,他引:2
针对在语音情感识别中孤立使用隐马尔科夫模型(HMM)固有的分类特性较差的缺点,本文提出了利用隐马尔科夫模型和径向基函数神经网络(RBF)对惊奇,愤怒,喜悦,悲伤,厌恶5种语音情感进行识别的方法。该方法借助HMM规整语音情感特征向量,并用RBF作为最终的决策分类器。实验结果表明在本文的实验条件下此方法和孤立HMM相比具有更好的性能,厌恶的识别率有了较大改进。 相似文献
13.
基于隐马尔克夫模型的现代汉语句法分析 总被引:2,自引:0,他引:2
该文以小学生语文课本7万真实语料为基础,建立了一个基于隐马尔可夫模型的现代汉语完全句法分析模型。实验结果表明,该模型具有一定的创新性和高效性,其句法分析完全正确率在封闭测试中可达92.43%,在开放测试中达到65.374%。 相似文献
14.
目前,蒙古语语音识别的研究尚处于空白阶段,因此蒙古语语音识别系统的研究与开发具有重要意义。而语言模型的确立是语音识别系统中最重要的环节之一。本文根据自己的实践,通过实验的方法最终确立了蒙古语、大量词汇语音识别系统中适宜的语言模型。 相似文献
15.
利用上下文相关信息的汉字文本识别 总被引:5,自引:1,他引:4
为了改善汉字文本识别率, 本文提出了一种基于语料库统计概率的后处理方法, 该方法利用上下文相关信息, 超过词汇对于汉字文本识别, 把具有确定性边界的一个汉字序列多数情况为一个句子作为一个处理单元, 利用统计获得的字字同现概率,采用动态规划方法, 获得了令人满意的效果。 相似文献
16.
17.
维吾尔语连续语音识别技术研究 总被引:1,自引:0,他引:1
维吾尔语连续语音识别技术研究主要阐述维吾尔语连续语音的识别技术.主要包括声学模型和语言模趋。在声学模型中,主要介绍基于隐马尔可夫模型(Hidden Markov Model,HMM)的维吾尔语筵续语音识别声学建模。在语言模型中,主要对比基于文法和基于统计这两种方法的优劣。 相似文献
18.
提出了一种抗噪声语音特征。首先计算语音信号单边自相关序列的差分序列,再计算该差分序列的线性预测系数,进一步求出例说系数。实验证明,传统的线性预测例谱系数和边自相关序列的一性预测倒谱数相比,采用单边自相关序列差分序列的线性预测倒谱系数作为语音信号的特征矢量,可以提高语音识别系统对带噪音语音的识别率。 相似文献
19.
尽管作为当前最为流行的语音识别模型,隐马尔可夫模型(HMM)由于采用了状态输出独立同分布假设,因此不能描述语音现象中固有的时间相关性。文章介绍了一个更为灵活的基于段长分布HMM(DDBHMM)的研究帧相关性的框架,并在此基础上提出了一个混合模型,采用一种将语音特征静态信息和动态变化信息分别描述又有机结合在一起的方式,以较小的计算代价更为合理地刻划了真实的语音现象。汉语大词汇量非特定人连续语音识别的实验表明,通过利用帧相关性识别系统的性能得到了明显改善。 相似文献