共查询到19条相似文献,搜索用时 62 毫秒
1.
一种基于改进CP网络与HMM相结合的混合音素识别方法 总被引:2,自引:0,他引:2
提出了一种基于改进对偶传播(CP)神经网络与隐驰尔可夫模型(HMM)相结合的混合音素识别方法.这一方法的特点是用一个具有有指导学习矢量量化(LVQ)和动态节点分配等特性的改进的CP网络生成离散HMM音素识别系统中的码书。因此,用这一方法构造的混合音素识别系统中的码书实际上是一个由有指导LVQ算法训练的具有很强分类能力的高性能分类器,这就意味着在用HMM对语音信号进行建模之前,由码书产生的观测序列中 相似文献
2.
主要研究如何更好地让计算机智能地纠正英语学习者的发音错误。借助语音识别中的HMM(隐马尔可夫模型)建模方法,用Viterbi算法和改进的后验概率算法对中国学习者的英语发音进行自动识别,通过对基本单元进行切分和评分,最后,为英语学习者提供可信度比较高的发音信息反馈,纠正发音错误。 相似文献
3.
面向语音合成的维吾尔语音素自动切分算法研究 总被引:2,自引:0,他引:2
结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。 相似文献
4.
基于语音识别和手机平台的英语口语发音学习系统 总被引:1,自引:0,他引:1
研究一种实际可行的手机平台上基于语音识别技术的英语学习系统的应用方案。系统主要以HMM(隐马尔可夫模型)和Viterbi算法作为模型和算法基础,同时针对手机平台的限制,在算法设计和实现方面进行改进,达到降低运算时间同时保证识别精度的目的。 相似文献
5.
由于传统的最大似然训练准则的局限性,区分性训练的研究逐渐成为当前语音识别领域的一个热点,它已经被应用到实际中并且取得了较好的效果。围绕区分性的概念,可以进行多角度的研究,本文的研究的最小音素错误特征训练就是使用最小音素错误训练准则进行特征变换、参数更新以及模型训练。其研究目的在于调整特征,使得目标函数值趋近最优。研究内容包括高维特征向量和变换矩阵,相关实验证明该算法在词正确率方面,相10对于MLE的提升有近3.8%,相对于MPE的提升大概有1.2%。 相似文献
6.
语音识别中常用的HMM/GMM框架由于训练准则和算法的限制,对模式的辨识能力较差;另一种HMM/ANN框架虽具有极强的模式分类能力,但缺乏成熟有效的优化手段.将一种综合两者优点的TANDEM方法应用到普通话发音检错系统中,通过使用区分性训练的神经网络去估计音素级后验概率,经过一系列后续处理将原始MFCC特征转化为TANDEM特征,作为基于HMM统计模型的发音检错系统的输入,进而完成评测过程.实验结果证明,TANDEM方法使系统的检错性能有了较大的提升,结合MLLR等自适应方法的使用效果会更为明显. 相似文献
7.
语音/音乐自动分类中的特征分析 总被引:16,自引:0,他引:16
综合分析了语音和音乐的区别性特征,包括音调,亮度,谐度等感觉特征与MFCC(Mel-Frequency Cepstral Coefficients)系数等,提出一种left-right DHMM(Discrete Hidden Markov Model)的分类器,以极大似然作为判别规则,用于语音,音乐以及它们的混合声音的分类,并且考察了上述特征集合在该分类器中的分类性能,实验结果表明,文中提出的音频特征有效,合理,分类性能较好。 相似文献
8.
基于三音素动态贝叶斯网络模型的大词汇量连续语音识别 总被引:1,自引:0,他引:1
考虑连续语音中的协同发音现象,基于词-音素结构的DBN(WP-DBN)模型和词-音素-状态结构的DBN(WPS-DBN)模型,引入上下文相关的三音素单元,提出两个新颖的单流DBN模型:基于词-三音素结构的DBN(WT-DBN)模型和基于词-三音素-状态的DBN(WTS-DBN)模型.WTS-DBN模型是三音素模型,识别基元为三音素,以显式的方式模拟了基于三音素状态捆绑的隐马尔可夫模型(HMM).大词汇量语音识别实验结果表明:在纯净语音环境下,WTS-DBN模型的识别率比HMM,WT-DBN,WP-DBN和WPS-DBN模型的识别率分别提高了20.53%,40.77%,42.72%和7.52%. 相似文献
9.
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。 相似文献
10.
语音识别控制是智能机械设备的核心技术之一,设计了一种嵌入式英语语音识别控制系统.通过隐马尔可夫模型实现了英语语音识别功能,同时,基于WTV180芯片强化了语音信号的处理能力.系统测试结果表明,所设计的系统具有十分精准的英语语音识别能力和较强的智能机械设备控制能力,适于广泛推广应用. 相似文献
11.
文中介绍了一个程序规范自动检测与修正系统ADRS的理论模型,在开放逻辑的思想基础上,文中提出了一种自动修正模型,并试图对李未提出的3个问题给出解决方案。作为对第1个问题的解决,作者提出了一种刻画程序规范重要性程度的全序结构,克服了加标记的二分法地粗糙性。作为对第2个问题的解决,作者提出了修正函数的定义和R-计算模型,并证明了该模型满足修正函数的要求。作为对第3个问题的解决,作者提出了T-修正函数的 相似文献
12.
人脸自动检测与识别技术的研究及应用 总被引:1,自引:0,他引:1
本文提出了一种基于可疑人脸区域发现算法和结合投影图的人脸识别算法,算法在标准的人脸库上进行了实验,实验结果表明该算法能在人脸库中正确检测到绝大多数人脸的位置,并且在识别过程中体现了比标准特征脸方法更高的识别率和更小的计算量。以此算法为基础,研制和开发了一种计算机自动考勤系统。 相似文献
13.
随着手持设备的日益小型化以及一些特殊场合的限制,使用语音识别这种自然的人机接口技术愈发显得迫切。基于HMM架构的语音识别技术经过几十年的发展,在实验室环境下已经取得了很高的识别率。当前已经取得的技术要想走向实用化,所面临的最大障碍来自于语音识别前端的鲁棒性问题。本文对语音识别的前端鲁棒性问题做了比较深入细致的分析,并在此基础上比较全面地介绍了解决这些棘手问题所采取的一些措施。文章最后对语音识别前端鲁棒性问题给出了一定的讨论和展望。 相似文献
14.
语音识别是人机交互模式识别领域的一个重要课题,构建了一种基于深度神经网络的语音识别系统,使用了抗噪对比散度法和抗噪最小平方误差法对模型进行无监督训练;使用了均值归一化进行模型优化, 提高了网络对训练集的拟合度,并且降低了语音识别的错误率;使用多状态激活函数进行了模型优化,这不仅使得不带噪测试和带噪声测试的语音识别错误率进一步下降,并能在一定程度上减轻过拟合现象;并通过奇异值分解和重构的方法对模型进行了降维。实验结果表明,此系统可以在不影响语音识别错误率的基础上极大地降低系统的复杂性。 相似文献
15.
系统基于.NET平台,采用C/S架构和MVC模式设计开发,运用串口通信技术采集硬件数据。依据数值积分计算矿石体积,并利用动态称重仪表检测矿石重量。根据矿石品位与体积和重量之间的数学关系,在无人值守的情况下可高效、精确地检测出矿石的品位。 相似文献
16.
发光二极管(LED)缺陷检测工作是确保LED产品质量的必不可少的质量检验环节,具有重要的意义。本文运用图象处理和模式识别技术,完成发光二极管的检测识别工作。文章介绍了建立在SGI图象图形工作站上的发光二极管形状识别系统的系统配置、识别原理、检测步骤、技术难点和解决方案。系统能检测LED的外形尺寸、脚位偏移、漏固、汽泡、崩损和花痕等常见缺陷,具有检测精度高、识别速度快等特点,为实现计算机形状识别提供 相似文献
17.
数值型关联规则挖掘在网络入侵检测系统中的应用研究 总被引:3,自引:0,他引:3
基于数据挖掘技术的入侵检测技术是近年来研究的热点,目前有不少入侵检测系统中都采用了关联分析和聚类分析的数据挖掘方法,然而很多攻击难以从单个网络连接来判别,如果对多个连接进行分析势必会产生大量的统计信息。介绍了一种包含统计信息的数值属性关联规则挖掘方法,给出了采用此方法进行入侵检测的实验结果,并对实验结果进行了分析,提出了进一步的改进方向。 相似文献
18.
对火车视频检测系统具体设计中的一般性问题进行讨论.首先叙述了基本检测流程,讨论了基本检测流程的两种实现形式,它们分别使用于实际应用和算法调试;接下来描述了融合两种实现形式的实际应用系统框架;然后叙述了检测线方法三层框架结构的具体C+ +类实现问题;对于应用系统中算法设计的两个主要问题:烟尘干扰和图像晃动也进行了讨论;最后讨论了视频检测系统中常常面对的夜间检测问题. 相似文献
19.
机器人化大直径钢管螺旋焊缝检测视觉跟踪系统的研究与开发 总被引:1,自引:0,他引:1
本文介绍了一种应用在螺焊管焊缝超声波无损探伤自动线上,跟踪运动焊缝横向偏移的视觉伺服系统。该系统以单CPU运行的软件进行实时图象识别与系统控制。文中提出了一种在线建立特征模型的匹配识别策略,使系统能够很好地适应引起焊缝视觉特征变化的工作环境,条件的变化,准确识别不同特征的焊缝,同时具有较好的识别快速性。在实际检测线上,系统表现了良好的跟踪特性。 相似文献