期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王作英孙健《电子与信息学报》2007,29(4):867-869

为了充分利用语音信号中的段长信息,该文提出了一种具有一般拓扑结构的非齐次隐含Markov模型(Hidden Markov Model, HMM),并将其应用于中、英文语种辨识(Language IDentification, LID)系统。非齐次HMM既很好地描述了语音信号的发生过程,又准确地利用了状态的段长信息和语言中的上下文连接结构信息,对于中、英文语种辨识系统,非齐次的HMM系统辨识性能好于齐次的HMM模型。而在非齐次的HMM中,同段长为均匀分布相比,段长分布为正态分布时系统的辨识性能更好,表明段长确实是一种重要的语种区分信息之一,且正态分布较均匀分布更接近于真实的段长分布。相似文献

2.

非齐次语音识别HMM模型和THED语音识别与理解系统

王作英《电信科学》1993,(4)

本文从语音状态驻留长度分布出发,建立了一个非齐次隐含马尔可夫(Markov)语音识别模型。这个模型更接近语音信号物理实际,训练和识别的时间、空间复杂性比经典的HMM模型有很大的改进。文中描述了新模型的训练和识别算法,介绍了根据这一模型所设计的一个汉语孤立字全字表的实时识别和理解系统。相似文献

3.

汉语连续语音识别中多项式拟合语音轨迹模型的研究

下载免费PDF全文

欧智坚王作英《电子学报》2003,31(4):608-611

尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能. 相似文献

4.

基于DDBHMM的数字语音识别

全刚肖熙《电声技术》2010,34(6):45-47

数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。相似文献

5.

从线性预测HMM到一种新的语音识别的混合模型 总被引：1，自引：0，他引：1

下载免费PDF全文

欧智坚王作英《电子学报》2002,30(9):1313-1316

线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式. 相似文献

6.

分布式语音识别系统的架构分析和具体实现

孟建庭吴及王作英《电声技术》2004,(8):51-53

研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端／服务器架构的分布式语音识别系统。系统采用基于段长分布的隐含马尔可夫模型(DDBHMM)的识别算法,使用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到稳定高效的性能。相似文献

7.

基于状态码本的准连续隐马尔可夫模型 总被引：1，自引：0，他引：1

王仁华江辉《信号处理》1996,(2)

本文针对经典HMM模型对训练数据要求多且算法复杂的问题，提出了一种改进的模型一基于状态码本的准连续HMM模型（SCBHMM），该模型在有限训练数据的条件下能更加有效地描述语音信号的声学特征．通过将状态转移概率与动态谱变化量相关联，使得SCBHMM能有效地将语音信号的静态特征和动态特征相结合．通过在标准语音数据库USTC94上的大量实验表明了SCBHMM在汉语音节识别中的有效性，它缓减了模型对训练数据的要求，并大大降低了训练、识别的计算量，但同样取得了相当高的识别率．相似文献

8.

一种汉语语音识别的新模型

范京陈永宁刘惠华《信号处理》2005,21(Z1):180-183

本文提出了一种新的汉语语音模型-多组状态转移顺序聚类模型(MSSC).该模型采用了马尔可夫过程的状态转移方式,描述汉语语音的特征矢量序列的时序过程,同时采用了动态时间匹配DTW的比对概念和直接特征状态而不是HMM法的隐状态.新的模型具有多组子模型特点,从而对语音速度的变化,语音轻重的变化等有较强的适应能力.在描述状态转移方面,增加了记录各状态的自转移次数,用其作权重可更好地利用特征信息,提高识别率.另外,该方法的物理意义明显,故可以根据不同的特征矢量,进行合理的加权评判,且可以方便地扩充特征矢量的种类,更好的利用了汉语语音中的有用信息,进一步提高识别的正确率.本文从原理上及实际的测算结果证实了新方法的有效性. 相似文献

9.

基于HMM和PNN的混合语音识别模型

李战明苏敏赵正天李二超《电声技术》2007,31(12):44-46,50

基于隐马尔可夫模型(HMM)和改进后的概率神经网络(PNN)模型提出了一种用于语音识别的混合模型,该模型首先利用HMM生成最佳语音状态序列,然后对最佳状态序列进行时间规整,最后通过PNN神经网络进行分类识别。给出了HMM参数训练及时间规整的算法。实验结果表明这种模型比HMM具有更好的识别效果。相似文献

10.

基于HMM和匹配追踪的多参数语音识别

郭昕《电子世界》2013,(19):92-93

本文提出了一种基于HMM和匹配追踪的多参数语音识别新算法。首先构建局部余弦基表示语音信号,对其进行匹配追踪(MP)分解。然后,应用改进后的算法对语音信号进行特征提取,得到余弦基原子参数和魏格纳-维利(WVD)分布,并结合语音信号的美尔频率倒谱系数(MFCC)一起作为该信号的特征向量,通过隐马尔科夫模型(HMM)进行识别。最后通过实验验证了方法的有效性,仿真实验表明,改进后的多参数语音识别算法比仅使用MFCC作为特征向量的HMM算法,提高了语音识别的速度和准确度。相似文献

11.

语音识别HMM中引入帧间相关信息的一种参数化模型 总被引：4，自引：1，他引：3

杨浩荣王作英陆大《电子学报》1998,26(10):50-54,8

虽然隐马尔可夫模型（ＨＭＭ）是当前最为流行的语音识别模型，但由于一般都采用了状态输出独立假设，因此存在着不能描述语音现象中时间相关性的固有缺陷，本文提出的新模型对语音状态输出特征矢量序列的静态和动态特性信息分别进行参数化建模，然后将它们结合在一起，由此在基于段长分布的ＨＭＭ（ＤＤＢＨＭＭ）中引入了帧间相关信息，这种上引入帧间相关信息的ＨＭＭ能够更为精确地描述真实的语音现象。本文在给出新模型的框架后相似文献

12.

语音识别隐马尔可夫模型的改进 总被引：7，自引：1，他引：6

战普明王作英《电子学报》1994,22(1):9-15

由于在语音识别中被广泛应用的隐马尔可夫模型是一重马尔可夫模型，它不能充分地描述语音信号的时间相依性。虽然理论上可将ＨＭＭ扩展成多重马尔可夫模型，但由于所需运算量和存储量将成指数增长而使其难以应用。因此，本文提出一种新模型，它是由ＨＭＭ与一个能描述语音信号时间相依性的多维高斯密度函数相结合构成的。本文从理论上论证了新模型的合理性。对汉语不计声调的全部４０９个单音节的识别实验结果表明：新模型的识别率显相似文献

13.

基于HMM／VQ的认人的中等词表连续语音识别 总被引：2，自引：2，他引：0

林道发罗万伯《电子学报》1992,20(7):59-65

本文讨论基于隐马尔可夫模型(HMM)和矢量量化(VQ)的连续语音识别方法。用这种方法,对每个单词作成一个HMM,对多个模型组合成的状态转移网络搜索其状态转移的最佳路径,从而实现不预先进行单词切分的连续语音的识别,使用有限态文法约束及其它一些改善识别性能的措施,演示系统能识别特定人的18种英语句式,150个单词,用312个话句(共有2710个单词)进行测试,识别延迟时间为发音时长的62％,发音速度平均为每秒2.32个单词,单词识准率为97.3％。相似文献

14.

Phoneme classification using semicontinuous hidden Markov models

Huang X.D. 《Signal Processing, IEEE Transactions on》1992,40(5):1062-1067

Speaker-dependent phoneme recognition experiments were conducted using variants of the semicontinuous hidden Markov model (SCHMM) with explicit state duration modeling. Results clearly demonstrated that the SCHMM with state duration offers significantly improved phoneme classification accuracy compared to both the discrete HMM and the continuous HMM; the error rate was reduced by more than 30% and 20%, respectively. The use of a limited number of mixture densities significantly reduced the amount of computation. Explicit state duration modeling further reduced the error rate 相似文献

15.

MATLAB下的基于HMM模型的语音识别技术的实现

马帅高岳何翔宇《电子质量》2011,(4):17-18,21

HMM模型(隐含马尔科夫模型)由于对时间序列结构具有较强的建模能力.而逐步成为主流的语音识别技术.该文首先深入浅出地概述了基于HMM的语音识别技术,然后介绍了三个基本问题,最后在MATLAB下实现了孤立词语音识别系统. 相似文献

16.

Speech recognition algorithm based on neural network and hidden Markov model

Zhao Jianhui Gao Hongbo Liu Yuchao Cheng Bo 《中国邮电高校学报(英文版)》2018,25(4):28-37

This study proposes a hybrid model of speech recognition parallel algorithm based on hidden Markov model (HMM) and artificial neural network (ANN). First, the algorithm uses HMM for time-series modeling of speech signals and calculates the voice to the HMM of the output probability score. Second, with the probability score as input to the neural network, the algorithm gets information for classification and recognition and makes a decision based on the hybrid model. Finally, Matlab software is used to train and test sample data. Simulation results show that using the strong time-series modeling ability of HMM and the classification features of neural network, the proposed algorithm possesses stronger noise immunity than the traditional HMM. Moreover, the hybrid model enhances the individual flaws of the HMM and the neural network and greatly improves the speed and performance of speech recognition. 相似文献

17.

The Hidden Markov Model of co-articulation and its application to the continuous speech recognition

Lee Tranzai Zheng Fang Wu Wenhu Chen Daowen 《电子科学学刊(英文版)》2000,17(3):242-247

The co-articulation is one of the main reasons that makes the speech recognition difficult. However, the traditional Hidden Markov Models(HMM) can not model the co-articulation, because they depend on the first-order assumption. In this paper, for modeling the co-articulation, a more perfect HMM than traditional first order HMM is proposed on the basis of the authors' previous works(1997, 1998) and they give a method in that this HMM is used in continuous speech recognition by means of multilayer perceptrons(MLP), i.e. the hybrid HMM/MLP method with triple MLP structure. The experimental result shows that this new hybrid HMM/MLP method decreases error rate in comparison with authors' previous works. 相似文献

18.

HMM转移概率的新的重估算法 总被引：1，自引：0，他引：1

下载免费PDF全文

李健王作英《电子学报》2001,29(Z1):1833-1835

将隐含马尔可夫模型(HMM:Hidden Markov Model)引入到语音识别中来是一个巨大的贡献.但是在经典的HMM中关于状态转移概率a_ij(#em/em#≠j)与自转移概率a_ii的独立性假设,导致了这个模型的不协调性.事实上,段长分布概率与状态转移概率并非相互独立的,由其中的一个就可以唯一的确定另外一个.本文从段长分布概率出发说明了以上关于转移概率独立性假设的不合理性,并得到了转移概率新的重估算法.这个新算法比经典HMM的Baum-Welch迭代算法重估转移概率效果更好,前者比后者相对误识率下降了大约5%. 相似文献