首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
语音情感信息具有非线性、信息冗余、高维等复杂特点,数据含有大量噪声,传统识别模型难以消除冗余和噪声信息,导致语音情感识别正确率十分低.为了提高语音情感识别正确率,利用小波分析去噪和神经网络的非线性处理能力,提出一种基于过程神经元网络的语音情感智能识别模型.采用小波分析对语音情感信号进行去噪处理,利用主成分分析消除语音情感特征中的冗余信息,采用过程神经元网络对语音情感进行分类识别.仿真结果表明,基于过程神经元网络的识别模型的识别率比K近邻提高了13%,比支持向量机提高了8.75%,该模型是一种有效的语音情感智能识别工具.  相似文献   

2.
基于PCA和SVM的普通话语音情感识别   总被引:1,自引:0,他引:1  
蒋海华  胡斌 《计算机科学》2015,42(11):270-273
在语音情感识别中,情感特征的选取与抽取是重要环节。目前,还没有非常有效的语音情感特征被提出。因此,在包含6种情感的普通话情感语料库中,根据普通话不同于西方语种的特点,选取了一些有效的情感特征,包含Mel频率倒谱系数、基频、短时能量、短时平均过零率和第一共振峰等,进行提取并计算得到不同的统计量;接着采用主成分分析(PCA)进行抽取;最后利用基于支持向量机(SVM)的语音情感识别系统进行分类。实验结果表明, 与其他一些重要的研究结果相比,该方法得到了较高的平均情感识别率, 且情感特征的选取、抽取及建模是合理、有效的。  相似文献   

3.
语音情感识别的研究进展   总被引:4,自引:0,他引:4  
总结了语音情感识别研究的主要成果,分析了带有情感的语音的特征,阐述了现有的几种从语音中提取情感的方法,并对其进行分析比较,指出了语音情感识别技术的可能发展趋势。  相似文献   

4.
为了提高语音情感识别系统的识别准确率,本文在传统支持向量机(SVM)方法的基础之上,提出了一种基于PCA的多级SVM情感分类算法。首先将容易区分的情感分开,针对混淆度大且不能再利用多级分类策略直接进行区分的情感,采用主成分分析法(PCA)进行特征降维,然后逐级地判断出输入语音所属的情感类型。与传统基于SVM分类算法的语音情感识别相比,本文提出的方法可将7种情感的平均识别率提高5.05%,并且特征维度可降低58.3%,从而证明了本文所提出的方法的正确性与有效性。  相似文献   

5.
语音是人们传递信息内容的同时又表达情感态度的媒介,语音情感识别是人机交互的重要组成部分。由语音情感识别的概念和历史发展进程入手,从6个角度逐步展开对语音情感识别研究体系进行综述。分析常用的情感描述模型,归纳常用的情感语音数据库和不同类型数据库的特点,研究语音情感特征的提取技术。通过比对3种语音情感识别方法的众多学者的多方面研究,得出语音情感识别方法可期望应用场景的态势,展望语音情感识别技术的挑战和发展趋势。  相似文献   

6.
情感是语音识别研究中一个不可避免的问题,不同的情感对于语音有着不同的影响,这种影响使得中性语音识别系统在实际应用中的识别效果大打折扣。对于类似的影响通常的解决方法有寻找鲁棒特征,特征归一化以度模型调整训练等。本文通过自适应方法,使用少量情感数据,在中性语音模型的基础上自适应得到新的情感语音模型。实验证明,新模型对于情感语音有着更好的整体识别率。  相似文献   

7.
语音信号中的情感识别研究   总被引:25,自引:0,他引:25  
赵力  钱向民  邹采荣  吴镇扬 《软件学报》2001,12(7):1050-1055
提出了从语音信号中识别情感特征的方法.从5名说话者中搜集了带有欢快、愤怒、惊奇和悲伤的情感语句共300句.从这些语音资料中提取了10个情感特征.提出了3种基于主元素分析的语音信号中的情感识别方法.使用这些方法获得了基本上接近于人的正常表现的识别效果.  相似文献   

8.
为了提高情感识别的准确性,该文以语音信号为研究对象,提出了一种新型的语音情感识别方法.将局部保持投影算法(LPP)的思想融入到主元分析(PCA)的目标函数中,使得在原始变量空间投影到低维空间的过程中,不仅实现了整体方差的最大化,而且保持了局部近邻结构不变,有利于全局和局部特征的全面提取,克服了传统PCA方法只关注全局结构特征而忽略局部特征的缺陷.对比实验结果验证了该方法的可行性和有效性,实现了对喜悦、愤怒、悲伤、恐惧和中性5种人类基本情感的识别,研究成果将为情感识别提供新的研究方法,促进人机交互系统进一步深入发展.  相似文献   

9.
基于粒子群优化神经网络的语音情感识别   总被引:1,自引:0,他引:1  
提出了一种基于粒子群优化算法的人工神经网络,并把它应用到语音情感识别系统中。依据情感的维度空间模型,分别提取了韵律特征与音质特征,研究了谐波噪声比特征随情感类别的变化。利用粒子群优化算法(PSO)训练随机产生的初始数据,优化神经网络的连接权值和阈值,快速地实现网络的收敛。在实验中比较了BP神经网络、RBF神经网络与PSO神经网络分别用于语音情感识别的识别率,PSO神经网络的平均识别率高于BP神经网络6.7%,高于RBF神经网络5.4%。结果显示,粒子群优化神经网络用于语音情感识别提高了识别性能。  相似文献   

10.
李海峰  陈婧  马琳  薄洪健  徐聪  李洪伟 《软件学报》2020,31(8):2465-2491
情感识别是多学科交叉的研究方向,涉及认知科学、心理学、信号处理、模式识别、人工智能等领域的研究热点,目的是使机器理解人类情感状态,进而实现自然人机交互.首先,从心理学及认知学角度介绍了语音情感认知的研究进展,详细介绍了情感的认知理论、维度理论、脑机制以及基于情感理论的计算模型,旨在为语音情感识别提供科学的情感理论模型;然后,从人工智能的角度,系统地总结了目前维度情感识别的研究现状和发展,包括语音维度情感数据库、特征提取、识别算法等技术要点;最后,分析了维度情感识别技术目前面临的挑战以及可能的解决思路,对未来研究方向进行了展望.  相似文献   

11.
利用巴氏距离(Bhattacharyya Distance)和PCA(Principal Component Analysis)相结合进行人脸识别研究,提出了使用巴氏距离和PCA相合的算法对特征进行提取。当特征向量维数高时,首先对样本K-L(Karhunen-Loeve)变换进行降维,然后采用巴氏距离特征的迭代算法,得到最小错误率上界。基于ORL人脸数据库的实验表明该方法的识别性能优于LDA、HPCA、HLDA,采用文中的算法可以有效地提高识别率,减少巴氏距离特征计算时间,具有较强的实用性。  相似文献   

12.
针对城市道路交通状态影响因素多、判别难的特点,在分析K-均值聚类算法和概率神经网络(PNN)的基础上,利用多源检测信息的互补性,提出一种基于快速全局聚类分析的概率神经网络集成模型,通过聚类提高集成网络间的差异度,同时利用主成分分析(PCA)优化概率神经网络结构,仿真实验表明该模型与传统的集成方法Bagging相比,能够利用更简单的网络结构,快速有效地识别出城市道路交通状态,为交通预警和诱导策略的制定提供数据依据。  相似文献   

13.
基于主成分的遗传神经网络股票指数预测研究   总被引:7,自引:3,他引:7       下载免费PDF全文
数据预测在金融投资领域占有重要地位,预测中输入变量的选取影响着预测的速度和精度,传统方法选取输入变量主观性较强,预测效果欠佳。将遗传算法与BP网络结合,利用GA的全局搜索优化BP网络的结构参数,有效克服BP算法的局部收敛等问题。使用主成分分析法选取输入变量,并将GA—BP混合建模应用于沪市综合指数预测中。实验结果表明,该方法改善了预测精度,达到了较好的预测效果。  相似文献   

14.
为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。  相似文献   

15.
在颗粒加工工业中,获取颗粒尺寸和形状参数是一道常见的工序。体积是一个重要的颗粒三维参数,采用传统的手工测量方法获取体积耗时长,人工投入较多,很难实现过程控制中的实时反馈。应用计算机视觉技术,提出了一种基于颗粒单视二维图像信息(周长、投影面积、长宽比等)的BP神经网络体积估算方法。为了避免传统BP神经网络收敛速度慢,容易陷入局部极小值的缺陷,采用BP神经网络的改进算法-有动量的梯度下降算法。同时应用主成分分析法来进行体积影响参数的降维处理,减小了网络结构复杂度并提高了网络的整体性能。使用真实颗粒图像及实测数据对神经网络进行训练和精度测试,结果表明,将主元分析法与BP神经网络相结合来进行体积估算无论在预测精度还是在网络运算速度上比全要素传统BP神经网络模型具有更大的优越性。  相似文献   

16.
针对当提取以整段语音的多维语音特征参数为BP 神经网络输入而带来的说话人识别率和网络训练稳定性的问题,提出了一种用于BP 网络的基于主分量分析的PCA新方法。将该方法得到的降维语音特征参数用于BP 网络中,其识别率和训练速度都得到较大提高,使得基于BP 神经网络的说话人识别得到更好效果。  相似文献   

17.
基于集成BP网络的人脸识别研究   总被引:1,自引:0,他引:1  
苏超  肖南峰 《计算机应用研究》2012,29(11):4334-4337
在对人脸图像使用小波变换进行数据压缩的基础上,使用PCA进行特征提取,再将特征输入集成BP神经网络实现对人脸图像的识别。集成BP网络将多分类问题转换为多个相互独立的二分类问题,在提高网络泛化能力的同时缩短了网络的训练时间。另外,集成网络通过增添子网络或者重新训练子网络的方法解决了网络"失忆"问题,使其具有增量式学习的能力。通过在ORL人脸库上仿真的实验,证明了集成网络的人脸识别以及增量学习都具有良好的性能。  相似文献   

18.
首先提出BP神经网络在人脸验证上的应用方法,并在Cs_PCA方法的基础之上,提出一种“Cs_PCA+塔式神经网络”的人脸验证新模型(Cs_塔式)。传统的神经网络受到输入样本维数大小的限制,必须经过各种降维处理才能加以训练,受各种降维方法的限制,在降维过程中会丢失相应的数据信息,因此验证效果受到影响。针对此种情况提出了Cs_塔式方法,利用同样的方法,普通BP网在Cs_PCA基础上,利用PCA方法降维构成Cs_BP模型,并且遵照LAUSANNE协议在ORL人脸库上与Cs_塔式模型进行了比较。结果表明,塔式网络有着更好的验证效果。  相似文献   

19.
针对带噪面罩语音识别率低的问题,结合语音增强算法,对面罩语音进行噪声抑制处理,提高信噪比,在语音增强中提出了一种改进的维纳滤波法,通过谱熵法检测有话帧和无话帧来更新噪声功率谱,同时引入参数控制增益函数;提取面罩语音信号的Mel频率倒谱系数(MFCC)作为特征参数;通过卷积神经网络(CNN)进行训练和识别,并在每个池化层后经局部响应归一化(LRN)进行优化.实验结果表明:该识别系统能够在很大程度上提高带噪面罩语音的识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号