期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

乔冠楠胡剑凌刘鹏《电声技术》2009,33(6)

语音情感识别中,情感特征信息的提取和选择、情感识别模型的选择是2个重要部分.结合语音信号的声学特征参数和听觉特征参数进行情感识别,针对两类不同情感之间的差别选择最优的特征集,并设计了一个基于神经网络的情感交叉识别,与听觉特征参数结合,经过分类器得到识别情感,达到平均92%识别率. 相似文献

2.

结合音质特征和韵律特征的语音情感识别

张石清赵知劲雷必成杨广映《电路与系统学报》2009,14(4)

为了提高语音情感的正确识别率,在情感语音韵律特征的基础上,提出情感语音音质特征的提取.结合音质特征参数和韵律特征参数,采用支持向量机分类器实现汉语普通话生气、高兴、悲伤和惊奇四种主要情感类型语音的情感识别.实验结果表明,语音音质特征参数和韵律特征参数相结合取得的情感平均正确识别率为88.1%,比单独使用韵律特征参数高出6%.可见,语音音质特征是一种较有效的情感特征参数. 相似文献

3.

孤立词语音识别算法在医疗仪器中的应用

肖利君陈明义《现代电子技术》2010,33(10):40-42,48

研究一种适合医疗仪器的语音识别算法,采用带噪声端点检测算法、美尔频标倒谱系数（MFCC）特征参数提取算法和整体路径约束DTW算法即ADTW算法,能有效地提高识别率和稳健性。在此为噪声环境下的语音识别提供了理论分析与仿真实验数据。实验结果表明：这种语音识别算法不仅有很高的识别率,而且能减小或者消除噪声所带来的训练模型和测试语音之间的失配。它完全满足医疗仪器对语音识别率的要求。相似文献

4.

噪声环境下语音能量的MMSE估计及其在语音识别中的应用

王兴斌徐望王炳锡马治飞《信号处理》2005,21(Z1):204-207

语音识别中,语音信号能量是一个重要的识别特征参数.在噪声环境下,语音信号能量产生的畸变是导致识别率下降的原因之一.本文依据RASTA-PLP分析的增益参数和最小均方误差估计准则,给出了带噪语音能量和干净语音信号能量的线性映射关系.在中文连续语音识别中的应用表明,利用该映射关系得到的干净语音能量估计,可使信噪比为5dB的白噪声环境下的识别正确率提高21.36%. 相似文献

5.

抗噪声的小波谱压缩特征提取算法在语音识别中的应用

付丽辉《量子电子学报》2009,26(4):398-404

针对语音识别实际应用过程中的噪声问题,给出了一种新的抗噪声的特征提取算法,即先利用小波变换将语音信号进行小波子带分解,再根据人耳的听觉掩蔽效应,由谱压缩的技术,将小波变换后的子带语音信号进行压缩,从而提取其对应的语音特征。通过MATLAB软件建立实验平台,仿真实验结果表明该语音特征可以在噪声环境下得到较高的识别率。新的特征参数即充分利用了小波的抗噪声特性又有效地降低了语音识别中的训练环境和识别环境间的失配,具有抗噪声的特点。相似文献

6.

语音信号的情感特征分析与识别研究综述 总被引：8，自引：0，他引：8

余伶俐蔡自兴陈明义《电路与系统学报》2007,12(4):76-84

语音情感的分析与识别是近年来新兴研究课题之一，本文介绍了近几年来国内外语音情感识别的状况，阐述了各种人类情感分类的方法，归纳了各种语音特征参数的提取方法以及各特征参数对情感识别的意义，在此基础上综述了国内外在情感识别领域的研究进展与主要识别建模方法，同时总结了各种识别建模方法的利弊。最后概括了语音情感识别领域的发展趋势，并进行了展望。相似文献

7.

基于DDBHMM的数字语音识别

全刚肖熙《电声技术》2010,34(6):45-47

数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。相似文献

8.

中文语音情感常用特征识别性能分析

李文华姜林《智能计算机与应用》2017,7(2)

语音情感识别对于实现人机交互具有重要的应用价值.语音情感识别中,情感特征的选取与组合对于情感识别的准确率影响巨大.已有研究中,情感特征对识别率的贡献停留在定性分析中,未有定量的描述,不利于情感识别中特征的选择.本文针对中文语音情感识别中的常用特征进行定量分析,通过不同的情感特征进行组合,采用支持向量机进行分类,得到各情感特征对识别的贡献率.实验结果表明,单个特征中,梅尔倒谱系数贡献率最高,达到了78%;特征组合中,特征越多对识别率贡献越大. 相似文献

9.

基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用

张玲华郑宝玉杨震《电子与信息学报》2006,28(10):1786-1789

通过对纯净语音及含噪语音短时谱的分析比较,提出了一种基于基音频率及其谐波结构的新的语音特征参数。实验表明,与传统的倒谱特征相比,新特征对加性白噪声相对较不敏感,在闭集文本无关说话人识别中,新特征可以在加性白高斯噪声环境下提高系统的说话人识别率。相似文献

10.

一种基于概率模型和倒谱差分的特征补偿算法

马治飞徐望王炳锡王兴斌《信号处理》2005,21(Z1):192-195

本文详细给出了概率模型中引入倒谱预测值的动态相关性来进行特征补偿的方法.该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度、在倒谱域对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度.不同噪声环境和不同信噪比下的实验结果表明,本文方法能有效提高噪声环境下的中文连续语音识别的正确率. 相似文献

11.

基于ZCPA特征参数的口令识别系统

张晓辉李辉《电子技术》2010,47(7):27-29

本文介绍了一种基于ZCPA特征参数的口令识别系统。重点描述了ZCPA特征参数的提取。该参数模拟人类耳蜗中神经放电的方式,通过语音信号过零点获得频率信息,检测振幅峰值以及对其进行非线性压缩获得强度信息,并将此特征参数与HMM结合应用到口令识别系统中。实验结果可以证明ZCPA与MFCC相比较具有更好的鲁棒性。相似文献

12.

Development of an Optimized Feature Extraction Algorithm for Throat Signal Analysis

Young‐Giu Jung Mun‐Sung Han Sang Jo Lee 《ETRI Journal》2007,29(3):292-299

In this paper, we present a speech recognition system using a throat microphone. The use of this kind of microphone minimizes the impact of environmental noise. Due to the absence of high frequencies and the partial loss of formant frequencies, previous systems using throat microphones have shown a lower recognition rate than systems which use standard microphones. To develop a high performance automatic speech recognition (ASR) system using only a throat microphone, we propose two methods. First, based on Korean phonological feature theory and a detailed throat signal analysis, we show that it is possible to develop an ASR system using only a throat microphone, and propose conditions of the feature extraction algorithm. Second, we optimize the zero‐crossing with peak amplitude (ZCPA) algorithm to guarantee the high performance of the ASR system using only a throat microphone. For ZCPA optimization, we propose an intensification of the formant frequencies and a selection of cochlear filters. Experimental results show that this system yields a performance improvement of about 4% and a reduction in time complexity of 25% when compared to the performance of a standard ZCPA algorithm on throat microphone signals. 相似文献

13.

用于跨库语音情感识别的DBN特征融合方法

下载免费PDF全文

张昕然巨晓正宋鹏查诚赵力《信号处理》2017,33(5):649-660

跨数据库语音情感识别中,将不同尺度上提取的情感特征进行融合是目前的技术难点。本文利用深度学习领域的深度信念模型,提出了基于深度信念网络的特征层融合方法。将语音频谱图中隐含的情感信息作为图像特征,与传统情感特征融合。研究解决了跨数据库语音情感识别中,将不同尺度上提取的情感特征进行融合的技术难点。利用STB/Itti模型对语谱图进行分析,从颜色、亮度、方向三个角度出发,提取了新的语谱图特征;然后研究改进的DBN网络模型并对传统声学特征与新提取的语谱图特征进行了特征层融合,增强了特征子集的尺度,提升了情感表征能力。通过在ABC数据库和多个中文数据库上的实验验证,特征融合后的新特征子集相比传统的语音情感特征,其跨数据库识别结果获得了明显提升。相似文献

14.

基于Sinc-Transformer模型的原始语音情感识别

下载免费PDF全文

俞佳佳金赟马勇姜芳艽戴妍妍《信号处理》2021,37(10):1880-1888

考虑传统语音情感识别任务中,手动提取声学特征的繁琐性,本文针对原始语音信号提出一种Sinc-Transformer（SincNet Transformer）模型来进行语音情感识别任务。该模型同时具备SincNet层及Transformer模型编码器的优点,利用SincNet滤波器从原始语音波形中捕捉一些重要的窄带情感特征,使其整个网络结构在特征提取过程中具有指导性,从而完成原始语音信号的浅层特征提取工作;利用两层Transformer模型编码器进行二次处理,以提取包含全局上下文信息的深层特征向量。在交互式情感二元动作捕捉数据库（IEMOCAP）的四类情感分类中,实验结果表明本文提出的Sinc-Transformer模型准确率与非加权平均召回率分别为64.14%和65.28%。同时与基线模型进行对比,所提模型能有效地提高语音情感识别性能。相似文献

15.

基于特征空间分解与融合的语音情感识别 总被引：1，自引：0，他引：1

黄程韦金赟王青云赵艳赵力《信号处理》2010,26(6):835-842

提出了一种语音情感识别中特征空间的优化方法。针对情感类别两两之间的区分度,优化了情感对各自的特征空间,考察了多类分类器分解为两类分类器的方法,采用置信度判决融合的方法进行两类分类器组的重组,实验中比较了单个多类分类器和两类分类器组的识别性能。结果表明,在同等条件下性能提升了8个百分点以上,对多类分类器进行分解,优化每个情感对各自的特征空间,并进行融合的方法适合语音情感识别,对特征空间的优化效果显著。相似文献

16.

基于核典型相关分析的语音情感识别研究

下载免费PDF全文

李洪伟马琳李海峰《信号处理》2023,39(4):639-648

语音是人类表达思想和感情交流最重要的工具,是人类文化的重要组成部分。语音情感识别作为情感计算中的重要课题已经成为国际上的研究热点,受到越来越多的关注。已有神经科学研究表明,大脑是产生调节情感的物质基础。因此,在语音情感的研究中,我们不能仅考虑语音信号自身,还应将大脑的活动信号融入语音情感识别中,以实现更高准确率的情感识别。基于上述思想,本文提出了一种基于核典型相关分析（KCCA）的语音特征提取方法。该方法将语音特征与脑电图（EEG）特征映射到高维希尔伯特空间,并计算二者的最大相关系数。KCCA将语音特征在高维希尔伯特空间上向与脑电特征相关性最大的方向投影,最终得到包含脑电信息的语音特征。本文方法将与语音情感相关的脑电信息融入语音情感特征提取中,所提特征能够更准确的表征情感。同时,本方法在理论上具有良好的可迁移性,当所提脑电特征足够准确与具有代表性时,KCCA建模得到的投影向量具有通用性,可直接用于新的语音情感数据集中而无需重新采集和计算相应的脑电信号。在自建语音情感数据库与公开语音情感数据库MSP-IMPROV上的实验结果表明,使用投影语音特征进行语音情感分类的方法优于使用原始音频特征... 相似文献

17.

语音情感识别的发展与展望

周夕良《黑龙江电子技术》2013,(11):19-22,25

对语音情感识别的起源及主要研究内容作了介绍,对国内外语音情感识别的研究现状作了归纳总结;对语音情感特征的提取、情感分类器的建模算法作了重点分析介绍,最后对情感识别未来发展方向进行了展望. 相似文献

18.

基于SVM的语音情感识别研究

胡洋吴黎慧高磊蒲南江《电子测试》2011,(9):25-28

随着计算机技术的发展,人们对和谐人机交互的要求不断提高,这就要求计算机能理解说话人的情感信息,即能进行语音情感识别。本文提出了一种基于支持向量机（SVM）的语音情感识别方法,主要对人类的6种基本情感：高兴、惊奇、愤怒、悲伤、恐惧、平静进行研究。首先对自建语音情感数据库的情感语句提取特征,然后运用序列前向选择（SFS）算... 相似文献

19.

基于CM-OMEMD和小波散射网络的语音情感识别

下载免费PDF全文

孙聪珊马琳李海峰《信号处理》2023,39(4):688-697

语音情感识别（Speech Emotion Recognition,SER）是人机交互的重要组成部分,具有广泛的研究和应用价值。针对当前SER中仍然存在着缺乏大规模语音情感数据集和语音情感特征的低鲁棒性而导致的语音情感识别准确率低等问题,提出了一种基于改进的经验模态分解方法（Empirical Mode Decomposition,EMD）和小波散射网络（Wavelet Scattering Network,WSN）的语音情感识别方法。首先,针对用于语音信号时频分析的EMD及其改进算法中存在的模态混叠问题（Mode Mixing）和噪声残余问题,提出了基于常数Q变换（Constant-Q Transform,CQT）和海洋捕食者算法（Marine Predator Algorithm,MPA）的优化掩模经验模态分解方法（Optimized Masking EMD based on CQT and MPA,CM-OMEMD）。采用CM-OMEMD算法对情感语音信号进行分解,得到固有模态函数（Intrinsic Mode Functions,IMFs）,并从IMFs中提取了可以表征情感的时频特征作为第一个特征集。然后采用WSN提取了具有平移不变性和形变稳定性的散射系数特征作为第二个特征集。最后将两个特征集进行融合,采用支持向量机（Support Vector Machine,SVM）分类器进行分类。通过在含有七种情感状态的TESS数据集中的对比实验,证明了本文提出的系统的有效性。其中CM-OMEMD减小了模态混叠,提升了对情感语音信号时频分析的准确性,同时提出的SER系统显著提高了情绪识别的性能。相似文献