首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
针对当前主流的基于统计模型的语音识别系统没有使用语音产生知识的问题,通过模拟人类的语音感知理解过程提出了一种“自下而上”的基于区分性特征的音素识别方法.该方法首先根据不同音素的发音特点检测得到音素的边界信息;然后利用分类器完成语音的区分性特征检测,并根据区分性特征与音素的对应关系建立映射表;最后利用音素的边界信息得到语音段的特征序列,通过对语音段的特征序列模糊搜索匹配实现音素识别.实验结果表明,相比于传统的基于隐马尔科夫模型的音素识别方法,该方法在识别速度、鲁棒性及可扩展性等方面具有明显优势.  相似文献   

2.
为提高连续语音识别中的音素识别准确率,采用深可信网络提取语音音素后验概率进行音素识别.首先利用受限玻尔兹曼机的学习原理,对深可信网络进行逐层的预训练;然后通过增加一个“软最大化(softmax)”输出层,得到用于音素状态后验概率检测的深层神经网络,并采用后向传播算法进行网络权值的精细调整;最后以后验概率为HMM发射概率,使用Viterbi解码器进行音素识别.针对TIMIT语料库的实验结果表明,该系统的音素识别率优于GMM/HMM,MLP/HMM和TANDEM系统性能.  相似文献   

3.
介绍了一种对英文Pitman速记发声字进行在线分割识别的新方法,该方法在预处理速记手写体的基础上,采用BP神经网络对发声字分割中可能出现的过分割进行检测和纠正,对音素记号/非音素记号和单个音素记号进行分类和识别,并实现了基于单个笔划识别结果的整体单词识别。通过对68个常用英文单词的测试,验证了该方法的平均识别正确率达到89.6%。  相似文献   

4.
为了进一步提高针对汉语语音的唇形特征识别效果,分析实际汉语语音发音过程中声母韵母之间音素的变换规律,以及连读等发音习惯而造成的口形变化,利用唇形特征所对应的音素帧间的相关性,采用二阶隐马尔可夫模型来对唇形特征参数序列进行学习和识别,从而分析汉语唇形识别效果.基于独立汉字发音的实验表明,在针对特定人的识别条件下,在最优的加权因子(m∶n=1.5∶1)特征组合条件下,针对同一组融合得到的特征向量,考虑了音素帧间的相关性后,识别率提高了1.2%.可见汉语音节中音素帧间的相关性与唇形特征的变化规律相对应,有利于提高唇形识别的效果.  相似文献   

5.
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states Dynamic Bayesian Network, SM-DBN)模型,以实现大词汇量连续语音识别和音素切分.该模型在Bil m es等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network, Phone-sh ared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对 应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接.它的识别基元为音 素,描述了音素的动态发音变化过程.大词汇量语音识别的实验结果表明:在纯净语音环境下 ,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而 音频流的音素切分正确率则分别提高了10%和44%.  相似文献   

6.
本文通过描述语音特征参数求取方法和典型神经网络的学习过程,阐述了采用人工神经网络技术进行语音识别的基本原理,并给出一个神经网络语音识别技术在语音控制媒体播放系统中的应用实例。  相似文献   

7.
本文通过描述语音特征参数求取方法和典型神经网络的学习过程,阐述了采用人工神经网络技术进行语音识别的基本原理,并给出了一个神经网络语音识别技术在语音控制媒体播放系统中的应用实例。  相似文献   

8.
模糊自组织神经网络在语音识别中的应用   总被引:6,自引:0,他引:6  
在对语音信号进行分析的基础上,讨论了模糊自组织神经网络(FSONN)在语音识别领域的应用,并对FSONN算法进行改进。语音训练的实验结果表明,修正后的FSONN具有较强的聚类能力,这表明人工神经网络在完成某些语音识别子任务上仍大有可为  相似文献   

9.
正文→音素转换规则可表示为A→B/C-D基本形式,正文→音素转换推理是一个基于语言学规则和简单统计的启发式推理过程,该过程包含三个步骤:(1)词素分解,(2)音素转换,(3)确定词内重音。  相似文献   

10.
基于神经网络的汉语孤立词语音识别   总被引:3,自引:0,他引:3  
研究了基于神经网络的中文孤立词语音识别技术;将时间规整算法与神经网络相结合,组成一个混合级联神经网络语音识别系统. 在这个模型中,第一级是时间规整神经网络. 其作用是完成时间规整功能,从输入不等长的语音信号特征矢量序列中提取固定长度的特征矢量;然后将这组特征矢量馈入后一级BP网络完成语音识别. 利用该方法对小词表汉语孤立词进行语音识别实验,获得了98.25%的正确识别率. 实验结果表明,该系统不仅利用神经网络解决了语音识别中的时间规整难题,而且识别性能明显得到改善,识别率和训练速度均优于采用线性时间规整的神经网络语音识别方法.  相似文献   

11.
基于ICA和神经网络的手写体字符识别系统   总被引:1,自引:0,他引:1  
探讨独立分量分析在字符识别系统中的应用.在分析图像处理及其特征提取的基础上,提出一种可有效提高字符识别精度、降低误识率的基于独立分量分析和神经网络的手写体字符识别系统.实验表明,提出的字符识别系统与单独基于神经网络的字符识别系统相比,其识别率和适应性优越,适合应用于对字符识别精度要求高的场合.  相似文献   

12.
基于主元分析和BP神经网络的人脸识别研究   总被引:3,自引:0,他引:3  
该文提出了一种主元分析和BP神经网络相结合的人脸识别方法。其中主元分析方法用于提取人脸图像的特征,而BP神经网络用于对提取的人脸特征进行识别。实验结果表明,在进行人脸识别时,该文提出的主元分析和BP神经网络相结合的方法同传统的主元分析方法相比取得了良好的效果。此方法具有较高的识别率、较强的自适应性以及对噪声的鲁棒性。  相似文献   

13.
基于主元分析和神经网络的人脸识别方法   总被引:4,自引:0,他引:4  
人脸自动识别是模式识别领域中一项具有广阔应用前景和实际应用价值的热门课题 .文中提出了一种主元分析和神经网络相结合的方法进行人脸识别 .我们先对图像进行归一化处理 ,采用主元分析法对图像的主特征分量进行提取 ,然后以一个径向基函数神经网络作为分类器 ,进行人脸识别 .实验结果表明 ,这种方法在采用多样本训练后 ,具有较高的识别率 .  相似文献   

14.
详细介绍了一种实际应用的集装箱号识别系统中的图像及字符的处理和分割过程。在Matlab中实现定位后的图像处理及字符分割,达到了很好的分割效果,应用神经网络相关的BP算法,可以显著提高模式识别率。图像、字母和数字分割准确率达到98%。  相似文献   

15.
提出了一种加热炉状态识别器的设计方法,用自动聚类的方法对数据样本进行分类,并以聚类结果为学习样本,建立状态识别神经网络。利用该状态识别器对实际数据进行分类,结果表明识别正确率很高。  相似文献   

16.
针对低能见度状态下对车辆与行人的视觉特征难以提取的问题, 提出一种将2路卷积神经网络融合从而实现对车辆与行人识别的方法。采用高斯背景差分法实现图像去模糊, 在双路网络中分别采用不同尺寸的滤波器, 调整滤波器的大小得到不同环境下图片的特征值, 采用反向传播算法计算梯度。实验结果显示, 与单路式卷积神经网络对比, 在能见度低的环境中, 该方法对车辆的辨识率提高至83.49%, 对行人的辨识率提高至87.36%, 表明在低能见度环境中, 双路式卷积神经网络识别准确率高于单路式卷积神经网络。  相似文献   

17.
建立故障类型的自动识别系统是机械设备诊断学的发展方向。神经网络理论的兴起和发展为故障类型的自动识别开辟了一条崭新的道路。神经网络通过对故障样本的学习后,对未知故障的样本具有较高的正确识别率。从神经网络对故障的识别检验结果中发现,神经网络对单一故障的分类与对组合故障的分类效果相差较大。本文分析了产生这一现象的原因,并利用组合网络来克服单一网络对组合故障分类精度不够高的缺陷,取得了令人满意的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号