首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于语音信号的时变特性,提出了一种新型神经网络语音识别方法——小波混沌神经网络方法,即把小波变换和混沌特性引入到神经元,构成小波混沌神经网络,将这种神经网络用于语音识别,并与常用的BP神经网络识别方法进行了比较。实验结果表明,小波混沌神经网络的平均识别率要高于同等条件下常用的神经网络方法的识别率。  相似文献   

2.
基于CHMM的语音识别系统识别率高,但却占用系统资源较大,从而限制了其在资源受限的实际应用环境的有效实现.针对上述问题,给出特征参数选择的理论依据,弥补以往研究仅从实验结果分析,缺少理论依据的不足;同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法.该方法能使系统在训练,识别过程中的计算量和存储量明显减小,同时系统误识率不会显著改变.这为资源受限的语音识别系统,提供新的思路和有效的特征参数选择方法.  相似文献   

3.
提高语音识别系统识别率是语音识别技术中的一个重要的研究课题。通常由于环境噪声影响导致系统的识别准确率急剧下降。为了提高语音识别系统的识别准确率,并且使其在强噪声的环境下仍能获得令人满意的结果,在W_RAS_MFCC(Mel Frequency Cepstral Coefficients of the Relative Autocorrelation Sequences)参数提取分析和小波包变换研究的基础上,并根据加权带通滤波器分析技术,提出一种基于小波包分析的加权语音特征参数。通过实验结果分析表明,此方法用于抗噪声分析可以提高系统的识别准确率,同时在低信噪比下也有很好的适应性。  相似文献   

4.
语音情感识别是近年来新兴的研究课题之一,特征参数的提取直接影响到最终的识别效率,特征降维可以提取出最能区分不同情感的特征参数。提出了特征参数在语音情感识别中的重要性,介绍了语音情感识别系统的基本组成,重点对特征参数的研究现状进行了综述,阐述了目前应用于情感识别的特征降维常用方法,并对其进行了分析比较。展望了语音情感识别的可能发展趋势。  相似文献   

5.
提出了基于肌电信号(EMG)的无声语音识别系统。由于该系统是通过EMG信号而非声音信号进行识别,因此可应用于高噪声环境和帮助失去发音能力的人实现无声交流,有着良好的应用前景。关于该系统的实现,提出了以下方法:实验时使用0—9十个中文数字,由受试者不发声地重复说出,从三块面部肌肉采集EMG信号;对EMG信号进行小波变换,获取变换系数矩阵后提取其能量值,构造特征矢量送入BP神经网络分类器分类。实验表明,基于小波变换的特征提取方法是一种有效的方法.适用于类似EMC信号的非平稳生理信号。  相似文献   

6.
通过对MFCC算法的研究,发现其中的FFT在整个时频空间使用固定的分析窗,这不符合语音信号的特性,而小波变换具有多分辨率特性,更符合人耳的听觉特性。提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC参数的提取方法,用小波包变换代替傅里叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC,然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数。仿真实验证明:基于新特征的识别率比原来MFCC的识别率有了很大提高,特别是在低信噪比情况下。  相似文献   

7.
对特征参数概率分布的实验分析表明,在有噪声影响的情况下,特征参数通常呈现双峰分布.据此,本文提出了一种新的,基于双高斯的高斯混合模型(Gaussian mixture model,GMM)的特征参数归一化方法,以提高语音识别系统的鲁棒性.该方法采用更为细致的双高斯模型来表达特征参数的累积分布函数(CDF),并依据估计得到的CDF进行参数变换将训练和识别时的特征参数的分布都规整为标准高斯分布,从而提高识别正确率.在Aurora 2和Aurora 3数据库上的实验结果表明,本文提出的方法的性能明显好于传统的倒谱均值规整(Cepstral mean normalization,CMN)和倒谱均值方差规整(Cepstral mean and variance normalization,CMVN)方法,而与非参数化方法-直方图均衡特征规整方法的性能基本相当.  相似文献   

8.
语音特征参数的提取是语音驱动人脸动画中语音可视化的前提和基础,该文立足于语音驱动的人脸动画技术,较为系统地研究了语音参数的提取。在参数精度方面,引入了用小波变换重构原始信号的思想,对重构后的信号进行参数提取,从而为语音驱动人脸动画系统建立良好的可视化映射模型奠定了基础。  相似文献   

9.
基于遗传算法和小波神经网络的语音识别研究   总被引:1,自引:0,他引:1  
小波神经网络算法(WNN)易陷入局部极小,收敛速度慢,全局搜索能力弱,而遗传算法(GA)具有高度并行、随机、自适应搜索性能和全局寻优的特点。因此,将遗传算法和小波神经网络结合起来形成一种训练神经网络的混合算法——GA-WNN算法。仿真实验结果表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。  相似文献   

10.
语音识别技术是一个涉及多种学科的集成技术,目前已在工业、军事和医疗部门,产品检验和人机语音通信等领域取得了广泛的实际应用.语音识别技术长期以来一直是研究热点,但现有的语音识别系统运行缓慢,成本高,不方便使用.这些缺点影响了语音识别的速度,系统的硬件实现和应用.特别是在吵闹的环境中应用智能机器人语音识别更是非常困难.用于识别的工业智能机器人技术研究也越来越受到人们的关注.  相似文献   

11.
汉语语音识别实用系统研究   总被引:1,自引:0,他引:1  
姚键  古碧绮 《计算机工程》1999,25(4):12-13,52
在分析了传统音识别方法的特点后,提出一种规则结合模型的语音识别思想,并实现了特征空间轨迹匹配+神经网络”方法作为例证。  相似文献   

12.
徐金甫  韦岗 《计算机工程》2000,26(5):58-59,89
提出了一种抗噪声语音特征。首先计算语音信号单边自相关序列的差分序列,再计算该差分序列的线性预测系数,进一步求出例说系数。实验证明,传统的线性预测例谱系数和边自相关序列的一性预测倒谱数相比,采用单边自相关序列差分序列的线性预测倒谱系数作为语音信号的特征矢量,可以提高语音识别系统对带噪音语音的识别率。  相似文献   

13.
语音情感识别是语音处理领域中一个具有挑战性和广泛应用前景的研究课题。探索了语音情感识别中的关键问题之一:生成情感识别的有效的特征表示。从4个角度生成了语音信号中的情感特征表示:(1)低层次的声学特征,包括能量、基频、声音质量、频谱等相关的特征,以及基于这些低层次特征的统计特征;(2)倒谱声学特征根据情感相关的高斯混合模型进行距离转化而得出的特征;(3)声学特征依据声学词典进行转化而得出的特征;(4)声学特征转化为高斯超向量的特征。通过实验比较了各类特征在情感识别上的独立性能,并且尝试了将不同的特征进行融合,最后比较了不同的声学特征在几个不同语言的情感数据集上的效果(包括IEMOCAP英语情感语料库、CASIA汉语情感语料库和Berlin德语情感语料库)。在IEMOCAP数据集上,系统的正确识别率达到了71.9%,超越了之前在此数据集上报告的最好结果。  相似文献   

14.
基于遗传小波神经网络的语音识别分类器设计   总被引:4,自引:0,他引:4  
韩志艳  王健  伦淑娴 《计算机科学》2010,37(11):243-246
分类在语音识别中是很重要的,由于小波神经网络的学习效果对网络隐层节点数、初始权值(包括阈值)、伸缩和平移因子以及学习率和动量因子的依赖性较大,致使其全局搜索能力弱,易陷入局部极小,收敛速度减慢,甚至不收敛。而遗传算法具有的高度并行、随机、自适应搜索性能,使它在处理用传统搜索方法解决不了的复杂和非线性问题时具有明显的优势。因此,考虑把遗传算法和神经网络相结合,采用遗传算法选取初值进行训练,用小波神经网络完成给定精度的学习。仿真实验结果表明,该模型有效地提高了语音的识别率,并缩短了识别时间,实现了效率与时间的双赢,为算法的实用性莫定了基础。  相似文献   

15.
在语音情感识别研究中,已有基于深度学习的方法大多没有针对语音时频两域的特征进行建模,且存在网络模型训练时间长、识别准确性不高等问题。语谱图是语音信号转换后具有时频两域的特殊图像,为了充分提取语谱图时频两域的情感特征,提出了一种基于参数迁移和卷积循环神经网络的语音情感识别模型。该模型把语谱图作为网络的输入,引入AlexNet网络模型并迁移其预训练的卷积层权重参数,将卷积神经网络输出的特征图重构后输入LSTM(Long Short-Term Memory)网络进行训练。实验结果表明,所提方法加快了网络训练的速度,并提高了情感识别的准确率。  相似文献   

16.
近年来,随着我国科学技术的不断深入与发展,神经网络逐渐与语音识别技术联系的越来越密切。在传统的语音识别技术中,模板匹配法是其主要的操作方法,而在现代的语音识别技术中,神经网络已成为主要的发展趋势。神经网络技术主要模拟了人类的神经元活动原理,将人类所特有的自主学习、想象能力综合到了语音识别系统中,为语音识别的发展开辟了一条新的途径。本文我们将综合具体事例简要分析深度学习神经网络与语音识别系统的结合。  相似文献   

17.
语音识别是人机交互模式识别领域的一个重要课题,构建了一种基于深度神经网络的语音识别系统,使用了抗噪对比散度法和抗噪最小平方误差法对模型进行无监督训练;使用了均值归一化进行模型优化, 提高了网络对训练集的拟合度,并且降低了语音识别的错误率;使用多状态激活函数进行了模型优化,这不仅使得不带噪测试和带噪声测试的语音识别错误率进一步下降,并能在一定程度上减轻过拟合现象;并通过奇异值分解和重构的方法对模型进行了降维。实验结果表明,此系统可以在不影响语音识别错误率的基础上极大地降低系统的复杂性。  相似文献   

18.
有效提取语音信号的特征信息是语音识别的关键。对语音信号采用经验模态分解法可得到语音的一系列本征模函数,提取本征模函数的过程是降低语音信号冗余度的过程。在语音识别的试验中以本征模函数为训练模型较传统的识别方法识别率更高。仿真结果表明:方法是有效的,用于提取语音的特征信息是可行的。  相似文献   

19.
基于模糊支持向量机的语音识别方法   总被引:11,自引:0,他引:11  
通过计算输入样本的模糊隶属度,探讨了模糊支持向量机(FSVM)的原理,应用其对语音信号进行识别。并和RBF神经网络、支持向量机(SVM)的识别效果进行了比较。在仿真实验中,采用小波分析方法提取语音特征向量,识别结果表明,SVM和FSVM比RBF网络具有较好的泛化性能,训练时间也大大缩减。此外,FSVM比SVM有更强的抵抗噪声的能力。  相似文献   

20.
在视频监控及智能交通等领域,雾、雨、雪等恶劣天气会严重影响视频图像能见度,因此快速识别出当前的天气情况,并自适应地对监控视频进行清晰化处理极为重要.针对传统天气识别方法效果差以及天气图像数据集缺乏的问题,构建了一个多类别天气图像分块数据集,并提出了一种基于图像分块与特征融合的天气识别算法.该算法基于传统方法提取平均梯度...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号