期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

余华童馨《电子器件》2022,45(5):1100-1104

本文提出一种基于粒子群优化算法的支持向量机网络,并把它应用到语音情感识别系统中。依据情感的维度空间模型,研究分析情感语音数据的韵律特征与音质特征;利用粒子群优化算法(PSO)训练网络的超参数以优化支持向量机模型,可快速地实现网络的收敛;最后在实验中比较线性核函数SVM、径向基核函数SVM与粒子群优化径向基SVM分别用于语音情感识别的识别率,结果显示粒子群优化径向基核SVM模型用于语音情感识别能获得明显的识别性能的提升。相似文献

2.

基于SVM的语音信号情感识别

秦宇强张雪英《电路与系统学报》2012,(5):55-59

在智能人-机交互系统中,语音信号的情感分类是目前热点的研究领域,并且得到了广泛的应用.本文提出一种基于特征提取和借助支持向量机(support vector machine,SVM)分类器(classifier)的情感互相关性的方法,并应用于情感语音识别.利用这种方法对3种情感语音信号进行情感分类.SVM分类器是利用情感语音信号中情感互相关性的特征提取进行分类的.这种通过 SVM 分类器的情感互相关性的自动分类方法,可以将情感识别率大幅提高,并且在识别愤怒情感时的准确率可以达到95.04%. 相似文献

3.

基于条件变分自编码器的端到端情感语音合成方法

下载免费PDF全文

张建明彭锦涛贾洪杰毛启容《信号处理》2023,39(4):678-687

情感语音合成作为语音合成的一个重要分支,在人机交互领域得到了广泛的关注。如何获得更好的情感嵌入并有效地将其引入到语音合成声学模型中是目前主要存在的问题。表达性语音合成往往从参考音频中获得风格嵌入,但只能学习到风格的平均表示,无法合成显著的情感语音。该文提出一种基于条件变分自编码器的端到端情感语音合成方法（Conditional Duration-Tacotron,CD-Tacotron）,该方法在Tacotron2模型的基础上进行改进,引入条件变分自编码器从语音信号中解耦学习情感信息,并将其作为条件因子,然后通过使用情感标签将其编码为向量后与其他风格信息拼接,最终通过声谱预测网络合成情感语音。在ESD数据集上的主观和客观实验表明,与目前主流的方法GST-Tacotron和VAE-Tacotron相比,该文提出的方法可以生成更具表现力的情感语音。相似文献

4.

基于表情和语音的多模态情感识别研究

王蓓王晓兰《电子工程师》2014,(1)

由于单一特征的局限性,单一模态的情感识别研究往往由于含有的有效信息量较少或含有的噪声信息过多而导致识别结果与实际情况有着较大的差异。而不同类型的输入特征,相对于单一特征而言,包含着充分的、互补的情感信息。因此,本研究基于eNTERFACE数据库,提取了SIFT特征作为表情特征数据以及使用openSMILE工具包提取的1 582维声学及统计特征作为语音特征数据,分别运用支持向量机SVM和稀疏表示SR方法进行情感识别。最后采用决策层融合的方式,在该数据库上获得了比较好的效果。相似文献

5.

基于DTW/SVM的语音识别系统在DSP中的实现

李攀杨玮龙厉剑《电声技术》2006,(9):40-44

采用动态时间归正算法(DTW)和支持向量机(SVM)相结合产生一个新的基于径向基函数的DTW核函数实现语音识别,该方法在小词汇量及孤立词识别方面相对传统的隐马尔可夫模型有较大优势。为了满足语音识别系统对实时性和便携性的要求,提出了基于DTW/SVM的混合方法在TMS320C6711DSP芯片中实现的应用研究;给出了语音识别系统的原理框图,其中采用Mel倒谱系数为语音特征参数,应用了可变窗长端点检测技术;阐述了DSP设计中系统的软硬件设计方案及具体的接口电路,该系统使得语音识别更为快速便捷,并且具有一定的通用性。相似文献

6.

基于SVM的语音情感识别研究

胡洋吴黎慧高磊蒲南江《电子测试》2011,(9):25-28

随着计算机技术的发展,人们对和谐人机交互的要求不断提高,这就要求计算机能理解说话人的情感信息,即能进行语音情感识别。本文提出了一种基于支持向量机（SVM）的语音情感识别方法,主要对人类的6种基本情感：高兴、惊奇、愤怒、悲伤、恐惧、平静进行研究。首先对自建语音情感数据库的情感语句提取特征,然后运用序列前向选择（SFS）算... 相似文献

7.

支持向量机语音识别算法在OMAP5912上的移植

段继康张雪英白静《电子设计工程》2010,18(6)

针对语音识别这种典型的多类分类问题,提取MFCC参数作为语音特征,采用支持向量机(SVM)作为识别算法,进行非特定人孤立词识别.在给出一种多类分类方法并分析该算法优缺点的基础上,对算法中的所有参数进行测试,选取最佳参数进行实验,识别率达到95%以上.为了满足语音识别系统对实时性和便携性的要衷,将该算法在0MAP5912嵌入式系统开发平台上进行实现,与传统的语音识别系统相比,该系统易于使用,语音识别更为快速便捷.并且具有一定的通用性. 相似文献

8.

采用决策层融合的人脸语音识别技术

李雨凇周治平《微电子学与计算机》2010,27(4)

在信息融合的基础上提出采用基于决策层融合的多生物特征识别技术.对人脸图像采用基于主成分分析(PCA)与线性判别分析(LDA)结合的识别方法;对语音信息采用基于Mel倒频谱系数(MFCC)与混合高斯模型(GMM)的识别方法.将人脸识别子系统和语音识别子系统的输出结果作为决策层支持向量机(SVM)的输入,经过线性核函数SVM分类器融合后得到最终结果.该方法有效的提高了系统的识别率. 相似文献

9.

层次韵律特征对语音情感转换的影响分析

《信息通信》2017,(10)

针对传统以音节为单位的情感语音转换方法不能有效反映韵律的动态变化特征问题,分析音节、韵律词、语句三个层次的韵律特征在不同情感下的变换规律。根据情感语音的层次韵律变换特点,在音节层韵律转换的前提下,结合韵律词和语句级别的韵律变化特征对音节的韵律特征进行修正,实现语音的情感转换。实验结果表明,对于开心、生气和悲伤三种情感语音的转换,采用层次韵律转换的方法可以有效提高情感语音合成的质量。相似文献

10.

基于嵌入式系统的语音口令识别系统的实现

王大巍《电子技术》2010,47(7):21-22

语音口令识别是语音信息处理的一个重要研究方向,本文给出一种基于嵌入式系统的语音口令识别系统的设计方案,硬件系统的核心芯片是嵌入式微处理器,语音口令识别算法采用连续隐马尔克夫模型。实验结果表明,将语音识别系统与嵌入式系统相结合,可以使语音口令识别系统广泛应用于便携式设备中。相似文献