首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
本文主要介绍了连续语音识别系统的构建过程,分析了连续语音识别系统构建的方式和采用音素构建连续语音识别声学模型的基本方法。阐述了利用隐马尔可夫工具包搭建的连续语音识别系统,给出了系统评估方法,系统使用日本标准JNAS数据库进行建模并使用北海道大学日本学生的发音进行实验,验证模型的有效性。  相似文献   

2.
基于HTK的连续语音识别系统及其在TIMIT上的实验   总被引:1,自引:1,他引:0  
介绍一个连续语音识别系统的构成以及HTK工具的使用.然后尝试利用该工具搭建一个连续语音识别系统,使用该系统在一个非特定人的大词汇量连续语音数据库——TIMIT上进行实验,讨论如何选择不同的声学单元进行建模.并且对模型的参数进行一系列的改进。  相似文献   

3.
维吾尔语广播新闻连续语音敏感词检索系统   总被引:1,自引:0,他引:1  
首先介绍语音信号来源于新疆人民广播电台维吾尔语新闻的敏感词语音语料库的建设。然后用该语料库进行基于HMM的模型训练。模型训练中详细介绍识别基元端点检测、特征提取、矢量量化、码本构建、HMM模型训练过程和结果。最后用该语料库和HMM训练模型对维吾尔语广播新闻连续语音信号进行敏感词检索,并对检索结果进行分析。  相似文献   

4.
基于HTK的维吾尔语连续数字语音识别   总被引:4,自引:0,他引:4  
根据HTK工作原理,设计了维吾尔语连续数字识别的训练步骤,进行嵌入式重估训练,建立了基于音素级单位的HMM模型,建立了语言模型,实现了维吾尔语非特定人小词汇量亿以内的数字语音识别.  相似文献   

5.
基于HTK的维吾尔语连续语音声学建模   总被引:2,自引:1,他引:2  
维吾尔语属于阿勒泰语系突厥语族,是黏着性语言。本文根据维吾尔语的特点,分析设计了维吾尔语语音识别系统的总体结构,讨论了维吾尔语最佳识别基元的选择方法,提出建立基于决策树聚类的上下文相关模型,并采用混合高斯分布(GMD)拟合观测概率分布,优化维吾尔语连续语音中HMM模型系统以提高识别性能。最后给出实验对比,得出结论,为今后维吾尔语连续语音识别研究提供依据。  相似文献   

6.
现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型(CDCPM)的维吾尔语非特定人语音识别。CDCPM用中心距离正态(CDN)分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明:恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97.90%(集内)和94.76%(集外),取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。  相似文献   

7.
语音识别也称自动语音识别,是将人类语音中的词汇转换为计算机可读的输入,而HTK(HMM ToolKit)是构建隐马尔可夫模型和识别的工具包,最早是由英国剑桥大学工程系设计和开发的,目前广泛应用于语音识别、语音合成、字符识别等多个领域。本文主要是使用语音识别工具HTK建立语音识别系统。  相似文献   

8.
介绍实现语音识别系统的一些基本概念,对双门限端点检测过程用流程图的形式做详细介绍.该系统采用连续隐马尔科夫模型(HMM)进行建模,对实现过程遇到的三个基本问题进行分析并给出了解决方案.利用该系统对不同人的语音命令进行识别,准确率可达95%.  相似文献   

9.
维吾尔语音节语音识别与识别基元的研究   总被引:1,自引:0,他引:1  
王昆仑 《计算机科学》2003,30(7):182-184
1 引言现代维吾尔语(以下简称维语)是维吾尔族人民的主要交际工具,是我国新疆维吾尔自治区的法定工作用语之一,也是新疆其它少数民族共同的交际用语之一。维语属阿尔泰语系,突厥语族。维语语音有元音8个、辅音24个。由辅音和元音构成维语语音音节,每个音节必须且只能有一个元音,单元音可构成音节。维语句子由词构成。句子中有意群重音和句重音。部分音节在语流中产生语流音变现象,常见的有同化、弱化、脱落以及元音和谐等现象。  相似文献   

10.
基于HTK 的特定词语音识别系统   总被引:1,自引:1,他引:0  
语音识别技术经过半个世纪的发展,目前已日趋成熟,其在语音拨号系统、数字遥控、工业控制等领域都有了广泛的应用。由于目前常用的声学模型和语言模型的局限性,计算机只能识别一些词汇或一些句子。语音识别系统在语种改变时,往往会出现错误的识别结果。针对上述问题,结合隐马尔可夫模型原理,在HTK语音处理工具箱的基础上构建了中英文特定词语音识别系统。该系统通过代码控制整个构建过程,使其在更换新的训练数据和词典后能快速生成对应的识别模型。  相似文献   

11.
在分析语音识别原理的基础上采用TMS320DM642 DPS芯片,利用前向-后向HMM声学模型和Viterbi算法进行模式训练和识别,设计了一种连续的、小词量的语音识别系统.实验结果表明,该语音识别系统具有较高的识别率和一定程度的鲁棒性,实验室识别率和室外识别率分别达到96.8%及91.2%,该语音识别系统具有良好的实用性和可移植性.  相似文献   

12.
近年来大词汇量连续语音识别技术得到了迅速的发展,国内外研究机构加大了对汉语和英语语音识别技术的研究,然而,维吾尔语语音识别技术的研究工作最近才起步。建立了面向大词汇量的维吾尔语语音语料库,研究了维吾尔语声学模型和语言模型建模技术、解码技术,进行了面向大词汇量的维吾尔语连续语音识别实验。对维吾尔语大词汇量连续语音识别技术进一步发展中存在的问题进行了讨论。  相似文献   

13.
为了进一步提高语音识别系统的准确率,使语音产品应用更加方便,提出了一种隐马尔可夫模型和代数神经网络相结合的语音识别方法.利用隐马尔可夫模型生成最佳语音状态序列,将最佳状态序列的输出概率作为前馈型神经网络的输入,通过代数神经网络进行分类识别.使用Matlab7.0实验平台进行仿真,实验结果表明,与传统神经网络相比,该方法在收敛速度、鲁棒性和识别率方面都有改善.  相似文献   

14.
15.
综合了语音识别中常用的高斯混合模型和人工神经网络框架优点的Tandem特征提取方法应用于维吾尔语声学模型训练中,经过一系列后续处理,将原始的MFCC特征转化为Tandem特征,以此作为基于隐马尔可夫统计模型的语音识别系统的输入,并使用最小音素错误区分性训练准则训练声学模型,进而完成在测试集上的识别实验。实验结果显示,Tandem区分性训练方法使识别系统的单词错误率比原先的基于最大似然估计准则的系统相对减少13%。  相似文献   

16.
17.
在维吾尔文联机手写识别过程的训练阶段,单词被切分成字母,经过特征提取和聚类形成特征向量作为模型的输入。构造出以字符为基元的隐马尔可夫模型(HMM),将其嵌入到识别字典网络中。通过基于HMM的分类识别器,最终得到识别结果。首次将消除延迟笔画、建立有延迟笔画和无延迟笔画的字典的方法应用于维吾尔文手写识别中,取得了较高的识别率。  相似文献   

18.
19.
This paper presents a method for reconstructing unreliable spectral components of speech signals using the statistical distributions of the clean components. Our goal is to model the temporal patterns in speech signal and take advantage of correlations between speech features in both time and frequency domain simultaneously. In this approach, a hidden Markov model (HMM) is first trained on clean speech data to model the temporal patterns which appear in the sequences of the spectral components. Using this model and according to the probabilities of occurring noisy spectral component at each states, a probability distributions for noisy components are estimated. Then, by applying maximum a posteriori (MAP) estimation on the mentioned distributions, the final estimations of the unreliable spectral components are obtained. The proposed method is compared to a common missing feature method which is based on the probabilistic clustering of the feature vectors and also to a state of the art method based on sparse reconstruction. The experimental results exhibits significant improvement in recognition accuracy over a noise polluted Persian corpus.  相似文献   

20.
Automatic speech recognition is a technology that allows a computer to transcribe in real time spoken words into readable text. In this work an HMM automatic speech recognition system was created to detect smoker speaker. This research project is carried out using Amazigh language for comparison of the voice of normal persons to smokers one. To achieve this goal, two experiments were performed, the first one to test the performance of the system for non-smokers for different parameters. The second experiment concern smokers speakers. The corpus used in this system is collected from two groups of speaker, non-smokers and smokers native Morocan tarifit speakers aged between 25 and 55 years. Our experimental results show that we can use our system to make diagnostic for smoking people and confirm that a speaker is smoker when the observed recognition rate is below 50%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号