首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
语音识别中基于SFCM模糊聚类的矢量量化方法   总被引:4,自引:1,他引:3  
模糊聚类分析算法用隶属度确定样本所属类别,因其良好的效果而被广泛用于语音识别领域。文中提出了一种模糊聚类分析算法SFCM,并将其用于语音特征的矢量量化,最终形成码本尺寸为128的码本,用SFCM算法得到的码本分布合理,没有空类。采用此码本的误音识别实验表明了这种量化方法对语音识别的有效性。  相似文献   

2.
讨论了在语音编码中,应用神经网络技术进行矢量量化的算法。神经网络矢量量化算法可以压缩码本维数,提高码本搜索速度,从而优化矢量量化的效果。将这种优化的矢量量化算法应用于语音编码中,能降低运算复杂度,提高编码质量。  相似文献   

3.
基于矢量量化的说话人识别研究   总被引:7,自引:0,他引:7  
说话人识别可以看作语音识别的一种,是当前研究的热点之一。阐明了说话人识别的基本概念、发展状况以及原理和方法,并介绍了一种基于矢量量化的且与文本无关的说话人识别系统。  相似文献   

4.
矢量量化在语音识别中占有重要的地位,传统的LBG算法虽然收敛速度快,但极易陷入局部最优点。论文利用混沌运动固有的随机性与轨道遍历性等优良性质,提出了一种基于混沌寻优的Hopfield神经网络模型,并将其运用于语音识别中的矢量量化。该算法不仅收敛速度快,而且能够获得全局最优解,且初始解对算法的影响很小。实验结果表明该算法综合性能指标优于传统算法,具有较高的应用价值。  相似文献   

5.
华婷婷  肖铁军 《微计算机应用》2007,28(11):1164-1168
提出了一种基于模糊C-means聚类法的矢量量化,并将其用于语音特征的矢量量化。从语音信号中提取12阶MFCC倒谱系数作为待分群样本的矢量数据,有效地降低数据量及计算量,并可以避免杂信的不良影响。且实验得到的码本分布合理,没有空类,表明了该量化方法对语音识别很有效。  相似文献   

6.
介绍了语音识别的发展历史和国内外语音识别研究的现状,讨论了语音识别的几个基本问题和影响语音识别的因素,并分析了目前常用的语音识别的各种方法,指出了其优缺点,最后讨论了评价语音识别系统时应考虑的几个技术指标和将来语音处理的发展方向等。  相似文献   

7.
8.
基于Kohonen自组织特征映射(SOFM)神经网络的矢量量化图像压缩编码是一种非常高效的方法,但其码字利用不均匀,某些神经元永远无法获胜而产生"死神经元"的问题仍然十分明显。在追求为使各个神经元能以较为均衡的几率获胜,尽量避免"死神经元"过程中,Kohonen SOFM-C很具代表性,它既能保持拓扑不变性映射又能最有效地避免"死神经元",是一种带"良心"的竞争学习方法。本文利用Kohonen SOFM-C码字利用更为均衡的优点,并针对SOFM在胜出神经元的邻域内神经元修改权值方法的不足,提出基于SOFM-C的辅助神经元自组织映射算法,此方法具有开放性,可随时添加入新的有效算法模块以达到更好的效果。并把该矢量量化算法应用于小波变换域,以获得更好的码书。仿真结果表明,该方法优于已有的SOFM方法。  相似文献   

9.
语音端点检测在语音处理中占有非常重要的地位,传统的检测方法是基于短时能量和过量率的双门限比较法,但是在信噪比较低的情况下,利用短时能量和过量率很难得到准确的检测结果。另外,在双门限比较法中,判别门限的取值对整个端点的检测影响很大,而这个门限值往往是靠经验所得,具有不稳定性。因此,针对传统方法的不足,根据语音帧间相关性,提出了一种改进算法。让语音信号通过双门限比较,完成端点检测的一级粗判,在语音起止点的模糊帧段,取一定范围的信号矢量,让这些矢量经过处理后再通过有限状态矢量量化器(FSVQ),得到量化矢量,再对量化矢量进行二级细判,从而得到准确的语音起止点。将改进算法应用于汉语连续数字语音识别,平均识别时间由原来的0.871s缩短为0.719s,平均识别率由原来的81.47%上升至89.13%,实验结果表明了该算法的有效性。  相似文献   

10.
矢量量化与神经网络相结合的说话人识别系统   总被引:2,自引:0,他引:2  
李战明  王贞 《计算机工程与应用》2006,42(15):204-206,230
介绍了说话人识别系统的基本概念,在分析了传统VQ模型与神经网络模型的基础上,提出了一种VQ与神经网络相结合的说话人识别系统模型。通过提取出的特征参数(MFFC),建立系统模型,实验证明了该模型性能随着时间的变化有较好的稳定性。  相似文献   

11.
卷积神经网络(Convolutional Neural Networks,CNN)是目前流行的语音识别模型之一,其特有卷积结构保证了语音信号时域和频域的平移不变性。但是CNN存在着对语音信号建模能力有所不足的问题。为此,将链接时序准则(CTC)应用在CNN结构中,构建端到端卷积神经网络(CTC-CNN)模型。同时,引入残差块结构,提出一种新的端到端深度卷积神经网络(CTC-DCNN)模型,并利用maxout激活函数对其进行优化。通过TIMIT和Thchs-30语音库测试实验,结果表明在中英文识别中,采用该模型比现有卷积神经网络模型,准确率分别提高约4.7%和6.3%。  相似文献   

12.
在研究基于隐马尔可夫模型的识别器和基于距离分类器的识别器的识别结果基础上,提出两种基于集成神经网络的手写识别系统:比较神经网络识别系统和全排列神经网络识别系统.实验分析表明,该系统对西文手写体的识别率最高可达到99%,比单独使用原始识别器的识别率提高10个百分点,达到了良好的识别效果.  相似文献   

13.
细胞识别是图像处理和模式识别领域的一个研究热点,有着十分广泛的应用前景。本文提出了基于神经网络算法FTART2的肺癌细胞识别方法,讨论了FTART2的网络结构、输入矢量的标准化及分类算法。用513个样本对网络进行训练,再用716个样本组成测试集进行测试,实验结果表明:本文提出的基于FTART2的肺癌细胞分类器与基于标准BP的分类器相比,具有学习速度快、分类精度高的特点。  相似文献   

14.
BP神经网络应用于孤立词语发音识别的研究   总被引:2,自引:1,他引:1  
介绍了BP神经网络的学习规则和用于语音识别的基本原理,建立了一个用于常用孤立词语音识别的BP神经网络,选择声道反射系数为语音识别的特征值,建立了网络的训练样本集,对网络进行了训练;用MATLAB进行了识别仿真,表明能较好地实现孤立词语音识别.  相似文献   

15.
多层前馈模糊神经网络进行图像识别   总被引:1,自引:0,他引:1  
神经网络和模糊技术在模式识别领域中已有了广泛应用,两者有着各自的优势。针对神经网络模式识别中所遇到的问题,为了进一步提高分类器在样本分布不清晰情况下的识别能力,本文提出了两各将模糊机制引入神经网络的方法-输入模糊化方法和隐层模糊化方法,并在此基础上分别构造了模糊神经网络。实验结果表明,模糊神经网络较好地结合了神经网络和模糊技术的优点,取得了比传统网络更好的识别结果。  相似文献   

16.
基于BP神经网络的人脸识别方法   总被引:25,自引:1,他引:25  
人脸自动识别是计算机模式识别领域的一个活跃课题,有着十分广泛的应用前景。文中提出了基于BP神经网络的人脸识别方法,论述了人脸图像矢量的特征压缩问题、网络隐含层神经元数选取问题、网络输入矢量的标准化处理问题以及网络连接权值选取问题。对于18人、每人12幅图像组成的脸图像数据库做识别实验,实验结果表明文中所设计的神经网络分类器比常用的最近邻分类器有效地降低了识别错误率。  相似文献   

17.
基于神经网络和小波分析的血细胞识别算法   总被引:1,自引:0,他引:1  
结合小波变换时频局部化特性和神经网络的优势,提出了一种基于神经网络和小波分析的血细胞识别算法.首先对血细胞信号进行小波分解,然后利用小波分解系数重构信号的能量,结合时域特征参数构造特征向量作为神经网络的输入,最后建立神经网络模型进行训练.通过实验分析了不同条件下的信号识别情况,并与传统的识别算法作了比较,结果表明算法具有较强的血细胞识别能力,与传统的识别算法相比,识别准确度更高.  相似文献   

18.
提出了采用低通过率波、去最小亮度和向量柱状图来提取人脸特征的方法,设计了模糊ART神经网络的结构、学习规则和识别算法,并采用模糊ART神经网络对向量柱状图生成的特征向量进行识别。仿真实验证明,通过调整神经网络的警戒参数值,不同的人具有不同的最大在线识别率,所有人平均的在线最大识别率可以达到89%。  相似文献   

19.
模糊神经网络在条形码识别中的应用   总被引:1,自引:0,他引:1  
本文把模糊集合论的知识应用于自组织神经网络,提出一个模糊神经网络算法。新算法克服了一般神经网络方法共同面临的学习时间长、对网络参数敏感的弱点,广泛适用于一般的模式识别问题。对条形码识别问题的应用情况表明,新算法无论在网络学习的速度上还是在识别结果上都优于Kohonen的自组织神经网络方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号