首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
为获得较为鲁棒的识别性能,一般的语音识别系统中都会在后端加入一个置信度判决模块,以实现识别错误检测和集外词拒识等功能。针对命令词语音识别系统,传统的基于Filler模型的置信度方法由于自身模型结构的限制,性能相对有限,尤其是对集外词的检测效果不好。为此,使用了一种基于音节循环的置信度判决方法,并对该方法的解码网络进行精简,以满足实用化的效率要求。在中文命令词测试集上的实验结果表明,该方法相对于基于Filler模型的置信度方法对识别效果与识别效率都有了较大的提升。  相似文献   

2.
置信度的原理及其在语音识别中的应用   总被引:5,自引:2,他引:5  
由于置信度模型可以有效地判断观测数据与语音模型之间的匹配程度,因此可以用来对语音识别结果进行假设检验,定位识别结果中的错误,从而提高系统的识别率和稳健笥,讨论了语音识别中置信度的基本原理,、在值方法、模型性能评价方法、比较全面地介绍了置信度在语音识别中的各种,实验结果表明,置信度在语音识别的搜索的剪枝过程、说话人自适应以及拒识和验证方法面都有显的作用。  相似文献   

3.
一种基于联合得分的孤立词语音识别系统   总被引:2,自引:0,他引:2       下载免费PDF全文
邝航宇  张军  季飞  韦岗 《计算机工程》2006,32(10):186-188
介绍了一种基于联合得分的实时孤立词语音识别系统。在识别阶段,通过内插向最得到两种改进的DTW算法,并且和基本的DTW联合起来对语音进行识别,得出各自的识别结果,最后把所有的结果联合起来得到最终的识别结果。通过在TI46语音库和实时运行的实验表明,系统在低信噪比的环境下和实时运行的环境中,都可以获得比一般只应用DTW算法的识别系统更高的识别率。  相似文献   

4.
语音拒识技术是实现一个实用语音识别系统的关键。提出了一种新颖的基于置信度的非特定人语音识别拒识算法,该算法同时考虑了备选假设模型和多候选的信息,适用于拒识不正确的识别结果和词表外(OOV)语音。在一个非特定人英语命令词识别系统中做了一些相关的实验来评估这个算法的性能。实验结果表明,该算法可以有效地去除识别不可靠的语音,提高语音识别的整体性能。  相似文献   

5.
提出一种基于改进GMM模型的耳语情感语音识别方法.该方法在GMM的每个成员通过用矢量量化误差值取代传统GMM的输出概率值来计算模型的得分,使得建模时所需训练数据量减少,并且识别速度有所提高.实验结果表明当训练数据较少时,提出的新的识别方法的实验结果明显好于传统的GMM方法,证明了该方法的有效性.  相似文献   

6.
正(2014-169-英国-85)大多自动语音识别系统(ASR)是基于统计模型技术,需要来自数千个被录音者的大量培训,以掌握一种方言内部的差异。牛津大学的Flex SR系统在个别单词的识别上超越现有的许多ASR系统,其轻量的特性很适合于融入现有的技术或移动部署。该实验室成果在国内外有很大市场,外方期望以技术转让等方式开展合作。  相似文献   

7.
语音识别技术经过半个世纪的发展,目前已日趋成熟,其在语音拨号系统、数字遥控、工业控制等领域都有了广泛的应用。由于目前常用的声学模型和语言模型的局限性,计算机只能识别一些词汇或一些句子。语音识别系统在语种改变时,往往会出现错误的识别结果。针对上述问题,结合隐马尔可夫模型原理,在HTK语音处理工具箱的基础上构建了中英文特定词语音识别系统。该系统通过代码控制整个构建过程,使其在更换新的训练数据和词典后能快速生成对应的识别模型。  相似文献   

8.
正(2014-169-英国-85)大多自动语音识别系统(ASR)是基于统计模型技术,需要来自数千个被录音者的大量培训,以掌握一种方言内部的差异。牛津大学的FlexSR系统在个别单词的识别上超越现有的许多ASR系统,其轻量的特性很适合于融入现有的技术或移动部署。该实验室成果在国内外有很大市场,外方期望以技术转让等方式开展合作。  相似文献   

9.
置信度判决用于确定语音数据与模型之间的匹配程度,可以发现语音命令系统中的识别错误,提高其可靠性.近年来,基于身份矢量(identity vector,i-vector)以及概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)的方法在说话人识别任务中取得了显著效果.本文尝试将i-vector以及PLDA模型作为一种命令词识别结果置信度分析方法,其无需声学模型、语言模型支撑,且实验表明性能良好.在此基础上,针对i-vector在刻画时序信息方面的不足,尝试将该系统与DTW融合,有效提升了系统对音频时序的鉴别能力.  相似文献   

10.
本文提出一种基于词格信息的置信度计算方法,估计自适应语音识别结果的可靠性,将不可靠的语音从自适应训练集中去掉,从而减小无监督自适应与有监督自适应间的性能差异,提高无监督自适应的性能。  相似文献   

11.
研究了情绪的维度空间模型与语音声学特征之间的关系以及语音情感的自动识别方法。介绍了基本情绪的维度空间模型,提取了唤醒度和效价度对应的情感特征,采用全局统计特征减小文本差异对情感特征的影响。研究了生气、高兴、悲伤和平静等情感状态的识别,使用高斯混合模型进行4种基本情感的建模,通过实验设定了高斯混合模型的最佳混合度,从而较好地拟合了4种情感在特征空间中的概率分布。实验结果显示,选取的语音特征适合于基本情感类别的识别,高斯混合模型对情感的建模起到了较好的效果,并且验证了二维情绪空间中,效价维度上的情感特征对语音情感识别的重要作用。  相似文献   

12.
介绍了一种嵌入式系统上的孤立词语音识别算法.该算法基于连续隐含马尔可夫模型,根据嵌入式系统的特点,简化了经典的连续隐含马尔可夫模型,在主流个人数字助理(PDA)上实现了中等规模语音识别的实时处理,采用最大后验概率(MAP)自适应方法解决训练数据采集信道和PDA信道的不匹配问题.在系统的后端处理中,提出了一种基于置信测度的拒识方法改善系统的稳健性,最终使610个孤立词的识别任务,系统的等错误率小于5%;对集内发音拒识率为5%时,集内发音识别率达到95%.  相似文献   

13.
针对经典隐马尔可夫模型对状态持续时间的函数表达与实际语音的物理事实不相符合这一缺点,在通常隐马尔可夫的基础上引入状态持续时间参数,建立基于状态持续时间的HMM语音识别模型(SDHMM),并用其进行语音识别实验,与经典隐马尔可夫模型相比,识别率有所提高。  相似文献   

14.
基于片上系统的孤立词语音识别算法设计   总被引:1,自引:0,他引:1       下载免费PDF全文
介绍了孤立词语音识别系统,针对片上系统进行了语音识别算法的选择。对基于语音帧的端点检测算法、线性预测编码倒谱系数LPCC算法和动态时间规整DTW算法进行了分析和设计。对于新型语音识别SoC芯片的开发研制和推动片上可编程系统(SoPC)的研究与发展具有一定的理论和实践意义。  相似文献   

15.
介绍了Mircosoft Speech SDK中与语音识别有关的接口,讨论了在Visual Basic编程环境下,使用该开发包进行孤立词语音识别的方法,最终结合具体的项目给出了实践过程。  相似文献   

16.
针对实际问题中训练数据不足的特点,在对说话人建模时采用的是高斯混合模型—通用背景模型GMM-UBM,针对MCE训练算法中计算量大的显著问题,对其进行改进,改进的MCE算法不仅能使计算量减小,而且识别性能更佳。实验结果表明,在高斯混合数与说话人数不同的情况下,改进的MCE比传统MCE算法都要节省训练时间,且随着高斯混合数与说话人数的增长,节省的时间越多。针对采用MAP、MLLR、MAP\MLLR、EigenVoice方法作自适应得到的说话人模型,然后应用MCE算法与改进的MCE算法,改进的MCE算法比传统MCE方法识别率更高。  相似文献   

17.
目前语音跟踪在说话人干扰的条件下,即一段语音中存在多个说话人的混合语音信号时,语音跟踪质量会严重下降。针对这种情况,提出一种基于聚类分析与说话人识别的语音跟踪算法。算法首先使用改进的聚类分析方法进行语音分离,具体包括在K-means聚类中对质心进行缓存并降低采样率,以及在embedding特征空间引入正则项。其次,算法采用GMM-UBM说话人模型进行语音跟踪。实验结果表明改进的聚类分析方法可以有效提高算法的实时性及其语音分离质量,GMM-UBM模型在3 s语音的测试中具有84%的识别率。  相似文献   

18.
近几年来,基于端到端模型的语音识别系统因其相较于传统混合模型的结构简洁性和易于训练性而得到广泛的应用,并在汉语和英语等大语种上取得了显著的效果.本文将自注意力机制和链接时序分类损失代价函数相结合,将这种端到端模型应用到维吾尔语语音识别上.考虑到维吾尔语属于典型的黏着语,其丰富的构词形式使得维吾尔语的词汇量异常庞大,本文引入字节对编码算法进行建模单元的生成,从而获得合适的端到端建模输出单元.在King-ASR450维吾尔语数据集上,提出的算法明显优于基于隐马尔可夫模型的经典混合系统和基于双向长短时记忆网络的端到端模型,最终识别词准确率为91.35%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号