首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对当前尚无建立简约高效语音识别系统标准方法的情形,提出了通过贝叶斯信息准则(Bayesian Information Criterion,BIC)中的权衡系数折中选择系统识别率与复杂度,利用改进的粒子群优化(Particle Swarm Optimization,PSO)算法优化声学模型拓扑结构,进而创建高效简约语音识别系统的新方法。TIDigits上的实验表明,与传统方法创建的同复杂度的基线系统相比,用该方法建立的新系统句子正确率提升了7.85%,与同识别率的基线系统相比,系统复杂度降低了51.4%,说明新系统能够以较低的复杂度获得较高的识别率。  相似文献   

2.
3.
提出了一种基于语种模型混淆度的模型参数估计方法,并结合贝叶斯信息准则(Bayesian information criterion,BIC)来进行模型的选取,避免了大量标注信息的需求.在NIST-07语种识别30,10和3s的测试任务中,分别给出了在最大似然(Maximum likelihood,ML)准则和最大互信息...  相似文献   

4.
本文提出了一个基于心理声学理论和实验的听觉感知模型,它模拟了人对声音响度的听觉感知特征。该模型可在数字信号处理器(DSP)或计算机上实现,模型的输出参数已被用于语音识别。实验表明,用该模型参数表示语音信号可在环境有噪声的情况下保持较高的识别率。  相似文献   

5.
针对当前保密监管的技术现状,本文分析了当前保密信息监管的主要监管范围及其局限性,提出并论述了语音信息保密监管的必要性与重要性,同时对语音信息保密监管的核心技术——语音识别技术的基本原理进行了分析,对语音信息保密监管的具体方法及技术路线进行了讨论,选择基于大规模连续语音识别的方法作为语音信息保密监管的底层支撑技术,并在此基础之上提出一种基于置信度的语音信息保密监管匹配算法,通过同音词扩展的方法提升监管数据的召回率,通过类别置信度计算的方法提升召回监管数据的准确率,以实现在提升监管数据召回率的同时,更好的兼顾监管的准确率。  相似文献   

6.
提出了一种采用最小贝叶斯信息准则(Minimum Bayesian Information Criterion,MBIC)来最优化控制决策树结点分裂程度的算法。首先在理论上证明了MBIC能够较好地解决模型参数复杂度与训练数据集规模之间的权衡问题,然后给出了基于MBIC的决策树分裂停止准则的计算公式。汉语连续语音全音节识别实验表明:与传统的最大似然准则(Maximum Likeihood Criterion,MLC)相比,MBIC对声学模型参数和训练数据集的变化具有更好的适应能力。  相似文献   

7.
近年来在大词汇连续语音识别的研究取得了长足的进步,隐马尔柯夫模型(HMM)是连续语音识别的核心部分。但是HMM对语音信号的描述不完善,为此人们提出了很多替代模型,其中一类将语音信号描述为长度随机的特征矢量序列,称为随机分段模型(Stochastic Segment Models),简称为分段模型(SM)。该文将首先阐述分段模型的原理,并将分段模型和隐马尔柯夫模型进行比较,其次给出基于分段模型的识别和模型训练算法,最后给出实验结果并进行了讨论。  相似文献   

8.
一种改进的基于说话者的语音分割算法   总被引:13,自引:1,他引:13  
卢坚  毛兵  孙正兴  张福炎 《软件学报》2002,13(2):274-279
语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的阈值选取方法;(2) 引入BIC可测度概念来度量其适用范围;(3) BIC信息准则校准非冗余的候选分割点的偏差.实验结果表明,此改进算法优于原算法.  相似文献   

9.
随着网络科技的进步,音频分割技术广泛应用于音频检索、语音识别、语义内容分析等领域,对音频深度处理具有重要意义.使用两种基于BIC准则的音频分割算法进行仿真实验,证明滑动窗口的BIC分割算法在广播新闻语料和访谈性质的电话交谈中,检测到的正确音频分割点数目更多,可取得较好的分割效果.  相似文献   

10.
语音识别技术分析及展望   总被引:2,自引:0,他引:2  
通过对语音识别原理进行研究与探讨,总结目前语音识别领域的技术,分析市场上的语音识别产品类型并展望语音识别在商业领域应用的发展前景.  相似文献   

11.
基于贝叶斯网络的多传感器目标识别算法研究   总被引:4,自引:0,他引:4  
基于贝叶斯网络能够组合多种证据进行不确定性表达和推理的特点,提出以贝叶斯网络为基本结构的目标融合识别模型.通过详细分析空中目标识别的推理规则,建立了空中目标识别的贝叶斯网络拓扑结构.首先对各传感器的数据分别进行融合,然后应用贝叶斯网络推理算法对多种传感器融合结果进行融合计算,最后根据假定变量各状态的概率取值来判断目标平台类型.仿真结果证明了该方法直观、形象,计算速度快,降低了实用的复杂度,提高了目标识别的可靠性.  相似文献   

12.
人脸识别是计算机视觉和图像模式识别领域的一个重要技术。主成分分析(PCA)是人脸图像特征提取的一个重要算法。而支持向量机(SVM)有适合处理小样本问题、高维数及泛化性能强等多方面的优点。文章将两者结合,先用PCA算法进行人脸图像特征提取,再用SVM进行分类识别。通过基于ORL人脸数据库的计算机仿真实验表明,该方法具有很好的可行性和实际意义。  相似文献   

13.
基于SCEC的信息特征压缩算法   总被引:1,自引:0,他引:1  
对交互熵理论进行了研究,提出了对称交互熵的概念,并论证了它是一种距离测度,可以用以度量两个随机变量的差异程度,我们把它作为信息特征压缩的类别可分性判据,称之为对称交互熵判据(SCEC),建立了基于SCEC的信息特征压缩算法.模拟应用表明,提出的算法是一种有效的、可靠的算法,为模式识别理论的研究提供了一种新的数据压缩方法.  相似文献   

14.
基于稀疏贝叶斯分类器的汽车车型识别   总被引:2,自引:0,他引:2  
稀疏贝叶斯方法在处理分类问题上具有良好的推广性,并且使用较少的核函数,介绍了一个实时的车型识别系统.它以每点色彩信息的高斯混合模型来实现对视频图像的背景估计,从而实现对汽车的检测;利用稀疏贝叶斯分类器对检测到的汽车进行车型分类,实验结果表明稀疏贝叶斯分类器不仅具有支持向量机的性能,而且比SVM使用更少的核函数.实验取得了较好的分类效果.  相似文献   

15.
基于数据融合的贝叶斯人脸识别方法   总被引:2,自引:0,他引:2  
分析了反对称双正交小波分解细节系数在光照条件变化下的稳定性,提出了一种基于数据融合的贝叶斯人脸识别方法,利用AR人脸图像库进行了对比实验,实验结果验证了本文方法的有效性。  相似文献   

16.
杨占栋  解梅 《计算机工程》2011,37(24):150-151
在进行人脸识别时,光照、表情、角度等因素的影响会大幅增加数据计算的时空复杂度。为此,提出一种新的图像外观统计模型,在动态形状模型中引入灰度共生矩阵(GLCM),通过计算图像形状对齐情况下的GLCM,建立半动态外观模型。基于ORL人脸数据库的实验结果表明,该模型相比动态外观模型,识别准确率更高,速度更快。  相似文献   

17.
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AFAV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步.在音视频语音数据库上的语音识别实验表明,通过调整发音特征之问的异步约束,AF- AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有...  相似文献   

18.
近年来,由于动态贝叶斯网络(DBN)相对于传统的隐马尔可夫模型(HMM)更具可解释性、可分解性以及可扩展性,基于DBN的语音识别引起学者们越来越多的关注.但是,目前关于基于DBN的语音识别的研究主要集中在孤立语音识别上,连续语音识别的框架和识别算法还远没有HMM成熟和灵活.为了解决基于DBN的连续语音识别的灵活性和可扩展性,将在基于HMM的连续语音识别中很好地解决了上述问题的Token传递模型加以修改,使之适用于DBN.在该模型基础上,为基于DBN的连续语音识别提出了一个基本框架,并在此框架下提出了一个新的独立于上层语言模型的识别算法.还介绍了作者开发的一套基于该框架的可用于连续语音识别及其他时序系统的工具包DTK.  相似文献   

19.
基于约束最大信息熵的贝叶斯网络结构学习算法   总被引:3,自引:0,他引:3  
贝叶斯网络的学习可分为结构学习和参数学习.基于约束最大信息熵的结构学习算法是一种以搜索最高记分函数为原则的方法.本文以KL距离、相互信息以及最大相互信息为基础,通过附加合适的约束函数降低变量维数和网络结构的复杂度,提出了一种附加约束的最大熵记分函数,并结合爬山法设计一种贝叶斯网络结构学习的启发式算法.通过与著名的K2和B&B-MDL算法的实验比较,结果表明该算法在时间和精度上都具有较好的效果.  相似文献   

20.
针对调度语音识别过程中单遍解码词图生成算法所生成词图精度较差的问题,研究基于语言模型的调度语音智能识别方法。构建由训练过程和识别过程组成的调度语音智能识别模型,训练过程中该模型提取语音数据的语音向量序列构建声学子模型,利用语言子模型训练文本数据构建语音词图,识别过程中对声学子模型、语音词图以及发音词典实施语音解码与搜索获取最优词序列,基于最优词序列完成调度语音智能识别。测试结果显示研究方法所生成的词图精度较高,可准确识别调度语音。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号