首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
研究一种应用小波特征向量和多类支持向量机进行病态语音识别的方法,该方法基于连续小波变换提取语音特征向量,利用多类支持向量机进行病态语音分类。为了简化二分类支持向量机进行多类分类时所带来的计算复杂性,根据一类支持向量机分类思想提出一种多类分类算法。该算法能够使每一类样本都独立地获得一个决策函数,通过决策函数的最大值来判断样本所属的类。实验表明,在病态语音识别系统中,多类支持向量机与小波特征向量相结合具有良好的识别效果和应用价值。  相似文献   

2.
汉语是一种带声调的语言,声调信息在汉语语音识别中具有非常重要的意义。提出了emt}eaaea声调模型与explicit声调模型相结合的方法用以识别汉语连续语音的声调。该方法能够将逐帧的基频信息和较强时长的基频信息相结合来识别声调。在“863-Test”和“TestCorpus98"测试集上的实验表明,该方法分别能够达到96. 12%和93.78 %的声调识别正确率。  相似文献   

3.
孙成立 《计算机应用研究》2010,27(10):3841-3843
介绍了一种基于分而治之的语音识别错误纠正方案,首先利用混淆网络把连续语音识别问题转换为顺序的、独立的分类子任务。每个分类子任务可看做是孤立词识别问题,通过训练专门的支持向量机来区分混淆网络的识别候选。提出了一种快速的基于码本转换的语音向量对齐方法,解决了变长语音向量无法直接作为支持向量机输入的问题。通过一个普通话音节识别任务的实验结果表明,该方案能有效提高系统的正确率。  相似文献   

4.
在油气勘探领域中,当使用测井资料进行油气层分类识别时,运用传统的方法具有一定的局限性。本文使用了数据挖掘分类算法中的支持向量机(SVM)方法,并实际应用到新疆塔里木盆地油气层识别中。实验中分别采用了支持向量机算法和BP神经网络算法进行对比检验,结果表明通过支持向量机算法建立的油气层识别模型具有更高的识别检验性能,体现了支持向量机在处理多类分类问题中的优越性。  相似文献   

5.
基于SVM的非特定人声调识别的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
在建立非特定人普通话四声语调语音数据库的基础上,采用Mel频率倒谱系数(MFCCs)对语音数据进行特征参数的提取,并利用支持向量机(SVM)对语音中的四种声调进行了训练和识别研究。实验结果表明MFCCs和SVM的结合得到的平均识别率达到了97.6%。  相似文献   

6.
语音情感信息具有非线性、信息冗余、高维等复杂特点,数据含有大量噪声,传统识别模型难以消除冗余和噪声信息,导致语音情感识别正确率十分低.为了提高语音情感识别正确率,利用小波分析去噪和神经网络的非线性处理能力,提出一种基于过程神经元网络的语音情感智能识别模型.采用小波分析对语音情感信号进行去噪处理,利用主成分分析消除语音情感特征中的冗余信息,采用过程神经元网络对语音情感进行分类识别.仿真结果表明,基于过程神经元网络的识别模型的识别率比K近邻提高了13%,比支持向量机提高了8.75%,该模型是一种有效的语音情感智能识别工具.  相似文献   

7.
一种基于曲线拟合的二音节汉语声调识别方法   总被引:1,自引:0,他引:1  
本文提出了一种利用曲线拟合的方法,对连续二音节汉语语音进行了声调识别,并且加以实现。它采用倒频谱分析技术提取语音的基音周期,并利用倒频谱参数及短时功率进行音节分界。实验证明.基于曲线拟合的汉语声调识别方法,具有算法简单,可适用不同的说话人、高识别正确率等优点,是一种行之有效的方法。  相似文献   

8.
为提高连续语音识别中的识别准确率,采用高斯伯努利受限玻尔兹曼机进行语音训练和识别。通过结合并行回火算法的思想,采样、交换不同的温度链下的重构数据,实现在全局范围内对整个分布进行采样,提出一种基于并行回火改进的高斯伯努利受限玻尔兹曼机(GRBM-PT)的建模方法。该方法通过对语音信号的连续数据进行预训练分析、建模,最后使用支持向量机作为语音识别的分类器。在TI-Digits数字语音训练和数字测试数据库上的实验结果表明,语音识别率能够达到83.14%,基于GRBM-PT模型下的语音识别率明显优于RBM,RBM-PT以及GRBM模型的性能。  相似文献   

9.
本文以音节作为声调识别基元,以简化FUZZY ARTMAP作为声调识别系统模型,研究了具有连续语音音节特征的三字词的声调识别问题.在此基础上,对三字词进行了声调识别规则的自动抽取,经网络剪枝、权值量化和规则合并后,得到了若干条与声调模式的统计分布一致的规则.这些规则具有一定的普遍意义,可用于声调识别和声调模式分析.获取规则的方法可直接应用于连续语音  相似文献   

10.
汉语语音识别中的区分性声调建模方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的性能。声调识别实验表明区分性的声调模型训练以及特征提取方法显著提高了声调识别率。区分性模型权重训练能够在声调模型加入之后进一步连续语音识别系统的识别率。  相似文献   

11.
汉语是一种有调语言,因此在汉语语音识别中,调型信息起着非常关键的作用。在现有的隐马尔可夫模型(Hidden Markov Model)框架下,如何有效地利用调型信息是有待研究的问题。现有的汉语语音识别系统中主要采用两种方式来使用调型信息 一种是基于Embedded Tone Model,即将调型特征向量与声学特征向量组成一个流去训练模型;一种是Explicit Tone Model,即将调型信息单独建模,再利用此模型优化原有的解码网络。该文将两种方法统一起来,首先利用Embedded Tone Model采用双流而非单流建模得到Nbest备选,再利用Explicit Tone Model对调进行左相关建模并对Nbest得分重新修正以得到识别结果,从而获得性能提升。与传统的无调模型相比,该文方法的识别率的平均绝对提升超过了3.0%,在第三测试集上的绝对提升达到了5.36%。  相似文献   

12.
Tone study is very important for Mandarin speech recognition. In this paper, a Mixture Stochastic Polynomial Tone Model (MSPTM) is proposed for tone modeling in continuous Mandarin speech. In this model the pitch contour, main representative of tone pattern, is described as a mixed stochastic trajectory. The mean trajectory is represented by a polynomial function of normalized time while the variance is time varying. Effective training and tone recognition algorithms were developed. The experimental results based on the proposed MSPTM showed 40.7% tone recognition error rate reduction relative to the traditional Hidden Markov Model (HMM) tone model. We also present a decision tree based approach to learning the tone pattern variation in continuous speech. The phonetic and linguistic factors that may affect the tone patterns were taken into consideration while constructing the tree. After the tree was established, 28 different tone patterns were obtained. We found that in addition to the tone of the neighboring syllable, Consonant/Vowel type of the syllable and the position of the syllable in the utterance also made important contributions to tone pattern variations in continuous speech. Finally, a new approach of integrating tone information into the search process at word level is discussed. Experiments on continuous Mandarin speech recognition showed that the new tone model and tone information integration method were efficient, achieving a 16.2% relative character error rate reduction.  相似文献   

13.
王改良  武妍 《计算机应用》2010,30(10):2709-2711
基音频率轨迹能比较真实地反映汉语普通话中的声调特性,通过识别不同的基音轨迹来识别声调,是一种较好的方法。根据仿生模式识别理论,提出用迭代自组织数据分析算法(ISODATA)寻找覆盖区中心,运用多权值神经网络对每个聚类中心实现覆盖的方法,实现四种声调的识别。通过实验与隐马尔科夫模型(HMM)和支持向量机(SVM)算法比较,在少量样本的情况下,能得到相对较高的识别率。  相似文献   

14.
针对目前噪声环境下电子耳蜗汉语声调和语句识别率急剧下降问题,提出了一种基于时间精细结构过零刺激方案(FSZC)。利用语音信号时间精细结构的过零点时刻产生高速脉冲刺激序列,从而不仅将时间精细结构编码到电子耳蜗语音算法中,同时采用过零点时刻非均匀的采样脉冲刺激序列,确保了语音的空间编码和时间编码。声学模拟实验表明,相比于连续交替采样策略(CIS)和过零点时刻刺激策略(ZCT),FSZC方案在汉语声调和语句识别率上都有较大程度的提高,而且在噪声环境下对于声调和语句识别具有相对较强的抗噪性。  相似文献   

15.
提出基于发音特征的声调建模改进方法,并将其用于随机段模型的一遍解码中。根据普通话的发音特点,确定了用于区别汉语元音、辅音信息的7种发音特征,并以此为目标值利用阶层式多层感知器计算语音信号属于发音特征的35个类别后验概率,将该概率作为发音特征与传统的韵律特征一起用于声调建模。根据随机段模型的解码特点,在两层剪枝后对保留下来的路径计算其声调模型概率得分,加权后加入路径总的概率得分中。在“863-test”测试集上进行的实验结果显示,使用了新的发音特征集合中声调模型的识别精度提高了3.11%;融入声调信息后随机段模型的字错误率从13.67%下降到12.74%。表明了将声调信息应用到随机段模型的可行性。  相似文献   

16.
We describe a system for highly accurate large-vocabulary Mandarin speech recognition. The prevailing hidden Markov model based technologies are essentially language independent and constitute the backbone of our system. These include minimum-phone-error discriminative training and maximum-likelihood linear regression adaptation, among others. Additionally, careful considerations are taken into account for Mandarin-specific issues including lexical word segmentation, tone modeling, phone set design, and automatic acoustic segmentation. Our system comprises two sets of acoustic models for the purposes of cross adaptation. The systems are designed to be complementary in terms of errors but with similar overall accuracy by using different phone sets and different combinations of discriminative learning. The outputs of the two subsystems are then rescored by an adapted n-gram language model. Final confusion network combination yielded 9.1% character error rate on the DARPA GALE 2007 official evaluation, the best Mandarin recognition system in that year.  相似文献   

17.
基于韵律信息的连续语流调型评测研究   总被引:2,自引:2,他引:0  
汉语连续语流中的调型评测是汉语语音评测的一个重要环节,利用连续语流中韵律耦合效应和韵律结构紧密相关这一特性,以韵律词为基本建模单元,建立基于多空间概率分布的HMM调型模型(MSD-HMM),使得汉语普通话水平评测系统针对标准连续语流的调型识别率从82.0% 提升至84.6%;针对有方言背景的非标准发音,机器评分与专家评分的相关度绝对提升超过3.0%。  相似文献   

18.
黄浩  哈力旦 《计算机工程》2010,36(3):197-199
针对大间隔高斯混合模型基于LBFGS参数更新算法收敛速度慢的不足,提出一种快速参数更新算法。采用构造弱意义辅助函数的方法,得到扩展Baum-Welch算法形式的快速参数更新公式。利用大词汇汉语语音库上的声调分类任务来验证训练速度与分类性能。实验结果表明快速参数更新算法只需数次迭代就能收敛至最优结果,较LBFGS优化方法在识别性能相当的情况下具有更快的训练速度。  相似文献   

19.
一种使用声调映射码本的汉语声音转换方法   总被引:3,自引:0,他引:3  
在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成源、目标声调码本,根据时间对准原则建立了一个由源特征空间到目标特征空间的声调模式映射码本。声音转换实验评估了声调码本映射算法的性能。实验结果表明,该算法较好地反映出源说话人与目标说话人基频曲线之间的映射关系,改善了声音转换性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号