期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王晓兰王蓓顾为一《电子工程师》2014,(1)

为提升语音情感识别的能力,本研究提出一种基于稀疏核主成分分析(Sparse Kernel Principal Component Analysis,SKPCA)的方法。该方法结合核主成分分析以及稀疏表示的方法,能够同时满足特征降维和样本稀疏,起到降维和降噪的作用。本研究首先利用openSMILE工具包提取情感语音样本的声学特征及其统计特征用于情感识别,然后介绍SKPCA的算法原理及推导过程,最后使用多种分类器在柏林库做了大量的实验,实验结果表明,使用SKPCA方法可取得较好的识别结果。相似文献

2.

基于表情和语音的多模态情感识别研究

王蓓王晓兰《电子工程师》2014,(1)

由于单一特征的局限性,单一模态的情感识别研究往往由于含有的有效信息量较少或含有的噪声信息过多而导致识别结果与实际情况有着较大的差异。而不同类型的输入特征,相对于单一特征而言,包含着充分的、互补的情感信息。因此,本研究基于eNTERFACE数据库,提取了SIFT特征作为表情特征数据以及使用openSMILE工具包提取的1 582维声学及统计特征作为语音特征数据,分别运用支持向量机SVM和稀疏表示SR方法进行情感识别。最后采用决策层融合的方式,在该数据库上获得了比较好的效果。相似文献

3.

原子稀疏结合块结构稀疏的联合表示图像识别算法

胡正平宋淑芬《信号处理》2013,29(7):888-895

针对结构稀疏表示识别算法中稀疏准则的选择以及字典内块的划分两个重要问题,提出两种改进的结构稀疏表示识别算法。首先,针对结构稀疏准则会出现较多系数不为零的情况,提出将结构稀疏准则与原子稀疏准则相结合的思路,包括并行和串行两种结合方式。并行结合是将两者以加权求和的方式同时作为稀疏表示的判别准则进行分类,串行结合则是在结构稀疏表示后,通过重组字典,再对测试样本进行原子稀疏表示实现分类。然后,针对字典中类内样本的块划分问题,提出基于MLP的结构稀疏表示识别算法,先将类内样本经过MLP的划分,保证各个分块分别位于低维的线性子空间中,再进行结构稀疏表示的分类。实验结果证明两种改进的结构稀疏表示识别算法的有效性。相似文献

4.

基于语音PZCPA时频域特征融合的语音情感识别方法

阿卜杜萨拉木·艾海提陈恳《数据通信》2021,(2):42-46,51

从人类自然语言中提取和准确分类语音中的情感状态一直是人机交互的一个难点,同时相关研究在人工智能领域发挥着至关重要的作用.为了使语音情感识别系统有更好的鲁棒性,本文提出新的语音情感识别算法结构,主要包括PZCPA特征的提取方法,并且使用该特征进行基于深度学习的时域和频域特征融合,最后使用KNN进行语音情感识别.该算法在德... 相似文献

5.

语音情感识别算法中新型参数研究

下载免费PDF全文

赵力《电子器件》2017,40(5)

语音情感识别是实现智能人机交互的关键技术之一。然而,用于语音情感识别的语音情感特征十分有限。为此,本文提出一种新型的语谱图显著性特征来改善语音情感识别效果。识别算法利用选择性注意模型获取语音信号语谱图像的显著图,并从中提取显著性特征,结合语音信号传统的时频特征构成语音情感识别特征向量。最后,本文利用KNN分类方法进行语音情感识别。实验结果表明,加入显著性特征后识别率有明显提升。相似文献

6.

基于改进的蛙跳算法与支持向量机的实用语音情感识别

张潇丹胡峰赵力《信号处理》2011,27(5):678-689

支持向量机是一种基于统计学习理论的新型机器学习算法,在高维特征空间中寻找最优分类超平面,具有很好的分类精度和泛化性能。支持向量机的训练需要求解一个带约束的二次规划问题,针对数据规模很大情况下经典训练方法变得很困难的缺点,提出一种基于改进混合蛙跳算法的支持向量机分类器参数优化方法,既提高了混合蛙跳算法的收敛速度和精度,又能借助混合蛙跳算法的全局随机搜索能力,为支持向量机参数的优化选择提供一条有效途径。本文提取情感语句的韵律特征、音质特征和混沌特征参数,提出一种基于改进蛙跳算法的数据融合方法,并利用基于改进蛙跳算法的支持向量机进行实用语音情感的识别研究。在实验中比较了PCA方法、BP神经网络和数据融合方法用于语音情感识别的识别率,研究结果表明本文所提的各项改进机制能有效提升情感识别率,为实用语音情感的识别提供一种新方法和新思路。相似文献

7.

集成语音信号与表面肌电信号的情感自动识别模型

夏晓玲《激光杂志》2015,36(4)

为了提高情感识别的正确率,针对单一语音信号特征和表面肌电信号特征存在的局限性,提出了一种集成语音信号特征和表面肌电信号特征的情感自动识别模型.首先对语音信号和表面肌电信号进行预处理,并分别提取相关的语音信号和表面肌电信号特征,然后采用支持向量机对语音信号和表面肌电信号特征进行学习,分别建立相应的情感分类器,得到相应的识别结果,最后将识别结果分别输入到支持向量机确定两种特征的权重系数,从而得到最终的情感识别结果.两个标准语情感数据库的仿真结果表明,相对于其它情感识别模型,本文模型大幅提高了情感识别的正确率,人机交互情感识别系统提供了一种新的研究工具. 相似文献

8.

多尺度分块协同表示的选择性集成人脸识别算法

下载免费PDF全文

殷清燕史加荣魏宗田岳红云《信号处理》2016,32(6):707-713

为了进一步改善人脸识别系统在小样本条件下的识别性能,本文在图像分块协同表示分类算法的基础上,提出了一种新的基于多尺度分块协同表示选择性集成的人脸识别算法。该算法首先通过对各个尺度下的图像子块进行总变差加权,突出具有鉴别能力的局部关键特征子块的判别作用;其次通过多尺度分块协同表示的选择性集成,显著地提高了分类器的泛化能力和稳健性。对于三种不同采集条件下涵盖各种光照、表情和姿态变化的标准人脸数据库进行数值实验,实验结果表明新算法比现有的稀疏表示分类算法具有显著的识别性能和鲁棒性。相似文献

9.

维吾尔语音情感声学特征提取与建模研究

阿依提拉·米吉提艾斯卡尔·肉孜艾斯卡尔·艾木都拉《通信技术》2013,(11):51-54

在收集较大规模情感语音语料库基础上,分析了维吾尔语语音在韵律特征和音质特征方面的19种语境信息和6种情感特征参数,并利用STRAIGHT算法实现了情感特征参数的提取,最后利用分类回归树（CART）算法针对各个情感特征和中性向其它情感的转换特征进行了建模。实验结果表明,所提取情感特征能准确的区分各个情感类型,为实现中性语音转换成各种目标情感语音奠定了基础。相似文献

10.

基于声门波和声道特征的语音情感识别

下载免费PDF全文

李永伟陶建华李凯《信号处理》2023,39(4):632-638

语音情感识别是实现自然人机交互不可缺失的部分,是人工智能的重要组成部分。发音器官的调控引起情感语音声学特征的差异,从而被感知到不同的情感。传统的语音情感识别只是针对语音信号中的声学特征或听觉特征进行情感分类,忽略了声门波和声道等发音特征对情感感知的重要作用。在我们前期工作中,理论分析了声门波和声道形状对感知情感的重要影响,但未将声门波与声道特征用于语音情感识别。因此,本文从语音生成的角度重新探讨了声门波与声道特征对语音情感识别的可能性,提出一种基于源-滤波器模型的声门波和声道特征语音情感识别方法。首先,利用Liljencrants-Fant和Auto-Regressive eXogenous(ARX-LF)模型从语音信号中分离出情感语音的声门波和声道特征;然后,将分离出的声门波和声道特征送入双向门控循环单元（BiGRU）进行情感识别分类任务。在公开的情感数据集IEMOCAP上进行了情感识别验证,实验结果证明了声门波和声道特征可以有效的区分情感,且情感识别性能优于一些传统特征。本文从发音相关的声门波与声道研究语音情感识别,为语音情感识别技术提供了一种新思路。相似文献

11.

一种基于局部排序的约束稀疏编码的图像分类方法

下载免费PDF全文

曹晔《电子学报》2019,47(4):832-836

图像分类作为计算机视觉分析领域一个重要的研究方向,其分类性能很大程度上取决于图像的特征表示.为了能够更好地进行图像分类,本文提出了一种基于局部约束稀疏编码的神经气算法（Neural Gas based Locality-constrained Sparse Coding,NGLSC）用来实现图像分类.引入局部排序适配器作为距离正则化约束项已经应用在神经气（Neural Gas,NG）的算法矢量量化中,旨在通过软竞争学习算法来弥补K均值聚类（K-means）算法的不足.在稀疏编码阶段此算法可求解得到封闭解.此外,字典更新一般由目标函数的误差项来决定,已有一些经典的算法采用这种方式更新字典.本文使用ORL数据库和COIL20数据库将所提出算法和现有算法局部约束线性编码（Locality-constrained Linear Coding,LLC）,脸元数据学习方法（Metaface Learning,MFL）进行比较.实验结果证明本文所提出的算法在图像分类上准确率可达95%以上.可以看出,本文为计算机视觉图像分类工作提供了一种有价值的解决思路. 相似文献

12.

融合半监督降维与稀疏表示的人脸识别方法

下载免费PDF全文

陈丽霞范士勇刘鑫王虹李昆仑《激光技术》2015,39(1):82-84

由于人脸图像数据的维数都较高,将稀疏表示分类用于人脸识别时计算量很大,为了提高人脸识别系统的效率,提出了一种融合半监督降维和稀疏表示的人脸识别方法。首先利用半监督降维算法对图像进行降维处理,在较低的维数空间快速取得较高的识别率,然后利用稀疏表示分类进行人脸识别,取得比传统的最近邻分类器更高的识别率,最后在ORL人脸库上进行实验验证。结果表明,利用该融合算法可快速有效地提高人脸图像的识别效果。相似文献

13.

基于一种改进的监督流形学习算法的语音情感识别 总被引：2，自引：0，他引：2

张石清李乐民赵知劲《电子与信息学报》2010,32(11):2724-2729

为了有效提高语音情感识别的性能,需要对嵌入在高维声学特征空间的非线性流形上的语音特征数据作非线性降维处理。监督局部线性嵌入(SLLE)是一种典型的用于非线性降维的监督流形学习算法。该文针对SLLE存在的缺陷,提出一种能够增强低维嵌入数据的判别力,具备最优泛化能力的改进SLLE算法。利用该算法对包含韵律和音质特征的48维语音情感特征数据进行非线性降维,提取低维嵌入判别特征用于生气、高兴、悲伤和中性4类情感的识别。在自然情感语音数据库的实验结果表明,该算法仅利用较少的9维嵌入特征就取得了90.78%的最高正确识别率,比SLLE提高了15.65%。可见,该算法用于语音情感特征数据的非线性降维,可以较好地改善语音情感识别结果。相似文献

14.

基于CM-OMEMD和小波散射网络的语音情感识别

下载免费PDF全文

孙聪珊马琳李海峰《信号处理》2023,39(4):688-697

语音情感识别（Speech Emotion Recognition,SER）是人机交互的重要组成部分,具有广泛的研究和应用价值。针对当前SER中仍然存在着缺乏大规模语音情感数据集和语音情感特征的低鲁棒性而导致的语音情感识别准确率低等问题,提出了一种基于改进的经验模态分解方法（Empirical Mode Decomposition,EMD）和小波散射网络（Wavelet Scattering Network,WSN）的语音情感识别方法。首先,针对用于语音信号时频分析的EMD及其改进算法中存在的模态混叠问题（Mode Mixing）和噪声残余问题,提出了基于常数Q变换（Constant-Q Transform,CQT）和海洋捕食者算法（Marine Predator Algorithm,MPA）的优化掩模经验模态分解方法（Optimized Masking EMD based on CQT and MPA,CM-OMEMD）。采用CM-OMEMD算法对情感语音信号进行分解,得到固有模态函数（Intrinsic Mode Functions,IMFs）,并从IMFs中提取了可以表征情感的时频特征作为第一个特征集。然后采用WSN提取了具有平移不变性和形变稳定性的散射系数特征作为第二个特征集。最后将两个特征集进行融合,采用支持向量机（Support Vector Machine,SVM）分类器进行分类。通过在含有七种情感状态的TESS数据集中的对比实验,证明了本文提出的系统的有效性。其中CM-OMEMD减小了模态混叠,提升了对情感语音信号时频分析的准确性,同时提出的SER系统显著提高了情绪识别的性能。相似文献

15.

面向内容的语音信号压缩感知研究

下载免费PDF全文

高畅李海峰马琳《信号处理》2012,28(6):851-858

压缩感知理论依据信号的稀疏性质进行压缩测量,将信号的获取方式从对信号的采样上升为对信息的感知,是信号处理领域的一场革命。本文提出一种基于非确定基字典（Uncertainty Basis Dictionary, UBD）对语音信号进行稀疏表示的方法,将压缩感知理论应用于对语音信号稀疏表示的压缩,并提出了基于求解线性规划问题的方法重构语音信号的算法。通过语音识别、话者识别和情感识别实验,从面向内容分析的角度,研究这种基于压缩感知理论的信息感知方法是否保留了语音信号的主要内容。实验结果表明,语音识别、话者识别和情感识别的准确率,与目前这些领域研究方法得到的结果基本一致,说明基于压缩感知理论的信息感知方法能够很好地获取语音信号的语义、话者和情感方面的信息。相似文献

16.

一种局部敏感的核稀疏表示分类算法

张石清赵小明楼宋江闯跃龙郭文平陈盈《光电子．激光》2014,(9):1812-1817

为了克服核稀疏表示分类(KSRC)算法无法获取数据的局部性信息从而导致获取的稀疏表示系数判别性受到限制的不足,提出一种局部敏感的KSRC(LS-KSRC)算法用于人脸识别。通过在核特征空间中同时集成稀疏性和数据局部性信息,从而获取具有良好判别性的用于分类的稀疏表示系数。在标准的ORL人脸数据库和Extended Yale B人脸数据库的试验结果表明,本文方法的分类性能优于传统的(KSRC)算法、稀疏表示分类(SRC)算法、局部线性约束编码(LLC)、支持向量机(SVM)、最近邻法(NN)以及最近邻子空间法(NS),用于人脸识别能够取得优越的分类性能。相似文献

17.

基于自学习稀疏表示的动态手势识别方法

肖玲李仁发曾凡仔屈卫兰《通信学报》2013,34(6):128-135

针对加速度传感器的手势采集方式提出一种基于自学习稀疏表示的动态手势识别方法。该方法将分类识别问题转化为求解待识别样本对于训练样本的稀疏表示问题,直接对原始加速度信号进行操作,省去了特征提取过程,可方便地添加新的手势类别和删除已有的手势类别;利用面向类别的字典学习,来寻求一个较小的并经过优化的超完备字典来计算待识别样本的稀疏表示,从而大大缩减算法的计算复杂度,满足实时性要求。在包含18种手势的3 000多个样本的公开数据集上进行测试,实验结果验证了该方法的有效性。相似文献

18.

语音情感识别综述

下载免费PDF全文

陶建华陈俊杰李永伟《信号处理》2023,39(4):571-587

语音情感识别是利用计算机建立语音信息载体与情感度量之间的关系,并赋予计算机识别、理解人类情感的能力,语音情感识别在人机交互中起着重要作用,是人工智能领域重要发展方向。本文从语音情感识别在国内外发展历史以及开展的一系列会议、期刊和竞赛入手,分别从6个方面对语音情感识别的研究现状进行了梳理与归纳：首先,针对情感表达从离散、维度模型进行了阐述;其次,针对现有的情感数据库进行了统计与总结;然后,回顾了近20年部分代表性语音情感识别发展历程,并分别阐述了基于人工设计的语音情感特征的情感识别技术和基于端到端的语音情感识别技术;在此基础之上,总结了近几年的语音情感识别性能,尤其是近两年在语音领域的重要会议和期刊上的语音情感识别相关工作;介绍了语音情感识别在驾驶、智能交互领域、医疗健康,安全等领域的应用;最后,总结与阐述了语音情感识别领域仍面临的挑战与未来发展方向。本文旨在对语音情感识别相关工作进行深入分析与总结,为语音情感识别相关研究者提供有价值的参考。相似文献