共查询到18条相似文献,搜索用时 156 毫秒
1.
为了充分利用语音信号中的段长信息,该文提出了一种具有一般拓扑结构的非齐次隐含Markov模型(Hidden Markov Model, HMM),并将其应用于中、英文语种辨识(Language IDentification, LID)系统。非齐次HMM既很好地描述了语音信号的发生过程,又准确地利用了状态的段长信息和语言中的上下文连接结构信息,对于中、英文语种辨识系统,非齐次的HMM系统辨识性能好于齐次的HMM模型。而在非齐次的HMM中,同段长为均匀分布相比,段长分布为正态分布时系统的辨识性能更好,表明段长确实是一种重要的语种区分信息之一,且正态分布较均匀分布更接近于真实的段长分布。 相似文献
2.
本文从语音状态驻留长度分布出发,建立了一个非齐次隐含马尔可夫(Markov)语音识别模型。这个模型更接近语音信号物理实际,训练和识别的时间、空间复杂性比经典的HMM模型有很大的改进。文中描述了新模型的训练和识别算法,介绍了根据这一模型所设计的一个汉语孤立字全字表的实时识别和理解系统。 相似文献
3.
4.
数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。 相似文献
5.
线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式. 相似文献
6.
7.
基于状态码本的准连续隐马尔可夫模型 总被引:1,自引:0,他引:1
本文针对经典HMM模型对训练数据要求多且算法复杂的问题,提出了一种改进的模型一基于状态码本的准连续HMM模型(SCBHMM),该模型在有限训练数据的条件下能更加有效地描述语音信号的声学特征.通过将状态转移概率与动态谱变化量相关联,使得SCBHMM能有效地将语音信号的静态特征和动态特征相结合.通过在标准语音数据库USTC94上的大量实验表明了SCBHMM在汉语音节识别中的有效性,它缓减了模型对训练数据的要求,并大大降低了训练、识别的计算量,但同样取得了相当高的识别率. 相似文献
8.
本文提出了一种新的汉语语音模型-多组状态转移顺序聚类模型(MSSC).该模型采用了马尔可夫过程的状态转移方式,描述汉语语音的特征矢量序列的时序过程,同时采用了动态时间匹配DTW的比对概念和直接特征状态而不是HMM法的隐状态.新的模型具有多组子模型特点,从而对语音速度的变化,语音轻重的变化等有较强的适应能力.在描述状态转移方面,增加了记录各状态的自转移次数,用其作权重可更好地利用特征信息,提高识别率.另外,该方法的物理意义明显,故可以根据不同的特征矢量,进行合理的加权评判,且可以方便地扩充特征矢量的种类,更好的利用了汉语语音中的有用信息,进一步提高识别的正确率.本文从原理上及实际的测算结果证实了新方法的有效性. 相似文献
9.
10.
本文提出了一种基于HMM和匹配追踪的多参数语音识别新算法。首先构建局部余弦基表示语音信号,对其进行匹配追踪(MP)分解。然后,应用改进后的算法对语音信号进行特征提取,得到余弦基原子参数和魏格纳-维利(WVD)分布,并结合语音信号的美尔频率倒谱系数(MFCC)一起作为该信号的特征向量,通过隐马尔科夫模型(HMM)进行识别。最后通过实验验证了方法的有效性,仿真实验表明,改进后的多参数语音识别算法比仅使用MFCC作为特征向量的HMM算法,提高了语音识别的速度和准确度。 相似文献
11.
12.
语音识别隐马尔可夫模型的改进 总被引:7,自引:1,他引:6
由于在语音识别中被广泛应用的隐马尔可夫模型是一重马尔可夫模型,它不能充分地描述语音信号的时间相依性。虽然理论上可将HMM扩展成多重马尔可夫模型,但由于所需运算量和存储量将成指数增长而使其难以应用。因此,本文提出一种新模型,它是由HMM与一个能描述语音信号时间相依性的多维高斯密度函数相结合构成的。本文从理论上论证了新模型的合理性。对汉语不计声调的全部409个单音节的识别实验结果表明:新模型的识别率显 相似文献
13.
基于HMM/VQ的认人的中等词表连续语音识别 总被引:2,自引:2,他引:0
本文讨论基于隐马尔可夫模型(HMM)和矢量量化(VQ)的连续语音识别方法。用这种方法,对每个单词作成一个HMM,对多个模型组合成的状态转移网络搜索其状态转移的最佳路径,从而实现不预先进行单词切分的连续语音的识别,使用有限态文法约束及其它一些改善识别性能的措施,演示系统能识别特定人的18种英语句式,150个单词,用312个话句(共有2710个单词)进行测试,识别延迟时间为发音时长的62%,发音速度平均为每秒2.32个单词,单词识准率为97.3%。 相似文献
14.
Speaker-dependent phoneme recognition experiments were conducted using variants of the semicontinuous hidden Markov model (SCHMM) with explicit state duration modeling. Results clearly demonstrated that the SCHMM with state duration offers significantly improved phoneme classification accuracy compared to both the discrete HMM and the continuous HMM; the error rate was reduced by more than 30% and 20%, respectively. The use of a limited number of mixture densities significantly reduced the amount of computation. Explicit state duration modeling further reduced the error rate 相似文献
15.
16.
This study proposes a hybrid model of speech recognition parallel algorithm based on hidden Markov model (HMM) and artificial neural network (ANN). First, the algorithm uses HMM for time-series modeling of speech signals and calculates the voice to the HMM of the output probability score. Second, with the probability score as input to the neural network, the algorithm gets information for classification and recognition and makes a decision based on the hybrid model. Finally, Matlab software is used to train and test sample data. Simulation results show that using the strong time-series modeling ability of HMM and the classification features of neural network, the proposed algorithm possesses stronger noise immunity than the traditional HMM. Moreover, the hybrid model enhances the individual flaws of the HMM and the neural network and greatly improves the speed and performance of speech recognition. 相似文献
17.
Lee Tranzai Zheng Fang Wu Wenhu Chen Daowen 《电子科学学刊(英文版)》2000,17(3):242-247
The co-articulation is one of the main reasons that makes the speech recognition difficult. However, the traditional Hidden Markov Models(HMM) can not model the co-articulation, because they depend on the first-order assumption. In this paper, for modeling the co-articulation, a more perfect HMM than traditional first order HMM is proposed on the basis of the authors' previous works(1997, 1998) and they give a method in that this HMM is used in continuous speech recognition by means of multilayer perceptrons(MLP), i.e. the hybrid HMM/MLP method with triple MLP structure. The experimental result shows that this new hybrid HMM/MLP method decreases error rate in comparison with authors' previous works. 相似文献
18.
将隐含马尔可夫模型(HMM:Hidden Markov Model)引入到语音识别中来是一个巨大的贡献.但是在经典的HMM中关于状态转移概率aij(#em/em#≠j)与自转移概率aii的独立性假设,导致了这个模型的不协调性.事实上,段长分布概率与状态转移概率并非相互独立的,由其中的一个就可以唯一的确定另外一个.本文从段长分布概率出发说明了以上关于转移概率独立性假设的不合理性,并得到了转移概率新的重估算法.这个新算法比经典HMM的Baum-Welch迭代算法重估转移概率效果更好,前者比后者相对误识率下降了大约5%. 相似文献