共查询到20条相似文献,搜索用时 62 毫秒
1.
针对当前尚无建立简约高效语音识别系统标准方法的情形,提出了通过贝叶斯信息准则(Bayesian Information Criterion,BIC)中的权衡系数折中选择系统识别率与复杂度,利用改进的粒子群优化(Particle Swarm Optimization,PSO)算法优化声学模型拓扑结构,进而创建高效简约语音识别系统的新方法。TIDigits上的实验表明,与传统方法创建的同复杂度的基线系统相比,用该方法建立的新系统句子正确率提升了7.85%,与同识别率的基线系统相比,系统复杂度降低了51.4%,说明新系统能够以较低的复杂度获得较高的识别率。 相似文献
2.
3.
4.
本文提出了一个基于心理声学理论和实验的听觉感知模型,它模拟了人对声音响度的听觉感知特征。该模型可在数字信号处理器(DSP)或计算机上实现,模型的输出参数已被用于语音识别。实验表明,用该模型参数表示语音信号可在环境有噪声的情况下保持较高的识别率。 相似文献
5.
针对当前保密监管的技术现状,本文分析了当前保密信息监管的主要监管范围及其局限性,提出并论述了语音信息保密监管的必要性与重要性,同时对语音信息保密监管的核心技术——语音识别技术的基本原理进行了分析,对语音信息保密监管的具体方法及技术路线进行了讨论,选择基于大规模连续语音识别的方法作为语音信息保密监管的底层支撑技术,并在此基础之上提出一种基于置信度的语音信息保密监管匹配算法,通过同音词扩展的方法提升监管数据的召回率,通过类别置信度计算的方法提升召回监管数据的准确率,以实现在提升监管数据召回率的同时,更好的兼顾监管的准确率。 相似文献
6.
提出了一种采用最小贝叶斯信息准则(Minimum Bayesian Information Criterion,MBIC)来最优化控制决策树结点分裂程度的算法。首先在理论上证明了MBIC能够较好地解决模型参数复杂度与训练数据集规模之间的权衡问题,然后给出了基于MBIC的决策树分裂停止准则的计算公式。汉语连续语音全音节识别实验表明:与传统的最大似然准则(Maximum Likeihood Criterion,MLC)相比,MBIC对声学模型参数和训练数据集的变化具有更好的适应能力。 相似文献
7.
近年来在大词汇连续语音识别的研究取得了长足的进步,隐马尔柯夫模型(HMM)是连续语音识别的核心部分。但是HMM对语音信号的描述不完善,为此人们提出了很多替代模型,其中一类将语音信号描述为长度随机的特征矢量序列,称为随机分段模型(Stochastic Segment Models),简称为分段模型(SM)。该文将首先阐述分段模型的原理,并将分段模型和隐马尔柯夫模型进行比较,其次给出基于分段模型的识别和模型训练算法,最后给出实验结果并进行了讨论。 相似文献
8.
9.
随着网络科技的进步,音频分割技术广泛应用于音频检索、语音识别、语义内容分析等领域,对音频深度处理具有重要意义.使用两种基于BIC准则的音频分割算法进行仿真实验,证明滑动窗口的BIC分割算法在广播新闻语料和访谈性质的电话交谈中,检测到的正确音频分割点数目更多,可取得较好的分割效果. 相似文献
10.
11.
12.
刘学胜 《计算机与数字工程》2011,39(7):124-126,143
人脸识别是计算机视觉和图像模式识别领域的一个重要技术。主成分分析(PCA)是人脸图像特征提取的一个重要算法。而支持向量机(SVM)有适合处理小样本问题、高维数及泛化性能强等多方面的优点。文章将两者结合,先用PCA算法进行人脸图像特征提取,再用SVM进行分类识别。通过基于ORL人脸数据库的计算机仿真实验表明,该方法具有很好的可行性和实际意义。 相似文献
13.
基于SCEC的信息特征压缩算法 总被引:1,自引:0,他引:1
对交互熵理论进行了研究,提出了对称交互熵的概念,并论证了它是一种距离测度,可以用以度量两个随机变量的差异程度,我们把它作为信息特征压缩的类别可分性判据,称之为对称交互熵判据(SCEC),建立了基于SCEC的信息特征压缩算法.模拟应用表明,提出的算法是一种有效的、可靠的算法,为模式识别理论的研究提供了一种新的数据压缩方法. 相似文献
14.
基于稀疏贝叶斯分类器的汽车车型识别 总被引:2,自引:0,他引:2
稀疏贝叶斯方法在处理分类问题上具有良好的推广性,并且使用较少的核函数,介绍了一个实时的车型识别系统.它以每点色彩信息的高斯混合模型来实现对视频图像的背景估计,从而实现对汽车的检测;利用稀疏贝叶斯分类器对检测到的汽车进行车型分类,实验结果表明稀疏贝叶斯分类器不仅具有支持向量机的性能,而且比SVM使用更少的核函数.实验取得了较好的分类效果. 相似文献
15.
基于数据融合的贝叶斯人脸识别方法 总被引:2,自引:0,他引:2
分析了反对称双正交小波分解细节系数在光照条件变化下的稳定性,提出了一种基于数据融合的贝叶斯人脸识别方法,利用AR人脸图像库进行了对比实验,实验结果验证了本文方法的有效性。 相似文献
16.
17.
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AFAV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步.在音视频语音数据库上的语音识别实验表明,通过调整发音特征之问的异步约束,AF- AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有... 相似文献
18.
近年来,由于动态贝叶斯网络(DBN)相对于传统的隐马尔可夫模型(HMM)更具可解释性、可分解性以及可扩展性,基于DBN的语音识别引起学者们越来越多的关注.但是,目前关于基于DBN的语音识别的研究主要集中在孤立语音识别上,连续语音识别的框架和识别算法还远没有HMM成熟和灵活.为了解决基于DBN的连续语音识别的灵活性和可扩展性,将在基于HMM的连续语音识别中很好地解决了上述问题的Token传递模型加以修改,使之适用于DBN.在该模型基础上,为基于DBN的连续语音识别提出了一个基本框架,并在此框架下提出了一个新的独立于上层语言模型的识别算法.还介绍了作者开发的一套基于该框架的可用于连续语音识别及其他时序系统的工具包DTK. 相似文献
19.
基于约束最大信息熵的贝叶斯网络结构学习算法 总被引:3,自引:0,他引:3
贝叶斯网络的学习可分为结构学习和参数学习.基于约束最大信息熵的结构学习算法是一种以搜索最高记分函数为原则的方法.本文以KL距离、相互信息以及最大相互信息为基础,通过附加合适的约束函数降低变量维数和网络结构的复杂度,提出了一种附加约束的最大熵记分函数,并结合爬山法设计一种贝叶斯网络结构学习的启发式算法.通过与著名的K2和B&B-MDL算法的实验比较,结果表明该算法在时间和精度上都具有较好的效果. 相似文献
20.
针对调度语音识别过程中单遍解码词图生成算法所生成词图精度较差的问题,研究基于语言模型的调度语音智能识别方法。构建由训练过程和识别过程组成的调度语音智能识别模型,训练过程中该模型提取语音数据的语音向量序列构建声学子模型,利用语言子模型训练文本数据构建语音词图,识别过程中对声学子模型、语音词图以及发音词典实施语音解码与搜索获取最优词序列,基于最优词序列完成调度语音智能识别。测试结果显示研究方法所生成的词图精度较高,可准确识别调度语音。 相似文献