共查询到10条相似文献,搜索用时 31 毫秒
1.
本文提出一种基于粒子群优化算法的支持向量机网络,并把它应用到语音情感识别系统中。依据情感的维度空间模型,研究分析情感语音数据的韵律特征与音质特征;利用粒子群优化算法(PSO)训练网络的超参数以优化支持向量机模型,可快速地实现网络的收敛;最后在实验中比较线性核函数SVM、径向基核函数SVM与粒子群优化径向基SVM分别用于语音情感识别的识别率,结果显示粒子群优化径向基核SVM模型用于语音情感识别能获得明显的识别性能的提升。 相似文献
2.
在智能人-机交互系统中,语音信号的情感分类是目前热点的研究领域,并且得到了广泛的应用.本文提出一种基于特征提取和借助支持向量机(support vector machine,SVM)分类器(classifier)的情感互相关性的方法,并应用于情感语音识别.利用这种方法对3种情感语音信号进行情感分类.SVM分类器是利用情感语音信号中情感互相关性的特征提取进行分类的.这种通过 SVM 分类器的情感互相关性的自动分类方法,可以将情感识别率大幅提高,并且在识别愤怒情感时的准确率可以达到95.04%. 相似文献
3.
情感语音合成作为语音合成的一个重要分支,在人机交互领域得到了广泛的关注。如何获得更好的情感嵌入并有效地将其引入到语音合成声学模型中是目前主要存在的问题。表达性语音合成往往从参考音频中获得风格嵌入,但只能学习到风格的平均表示,无法合成显著的情感语音。该文提出一种基于条件变分自编码器的端到端情感语音合成方法(Conditional Duration-Tacotron,CD-Tacotron),该方法在Tacotron2模型的基础上进行改进,引入条件变分自编码器从语音信号中解耦学习情感信息,并将其作为条件因子,然后通过使用情感标签将其编码为向量后与其他风格信息拼接,最终通过声谱预测网络合成情感语音。在ESD数据集上的主观和客观实验表明,与目前主流的方法GST-Tacotron和VAE-Tacotron相比,该文提出的方法可以生成更具表现力的情感语音。 相似文献
4.
由于单一特征的局限性,单一模态的情感识别研究往往由于含有的有效信息量较少或含有的噪声信息过多而导致识别结果与实际情况有着较大的差异。而不同类型的输入特征,相对于单一特征而言,包含着充分的、互补的情感信息。因此,本研究基于eNTERFACE数据库,提取了SIFT特征作为表情特征数据以及使用openSMILE工具包提取的1 582维声学及统计特征作为语音特征数据,分别运用支持向量机SVM和稀疏表示SR方法进行情感识别。最后采用决策层融合的方式,在该数据库上获得了比较好的效果。 相似文献
5.
采用动态时间归正算法(DTW)和支持向量机(SVM)相结合产生一个新的基于径向基函数的DTW核函数实现语音识别,该方法在小词汇量及孤立词识别方面相对传统的隐马尔可夫模型有较大优势。为了满足语音识别系统对实时性和便携性的要求,提出了基于DTW/SVM的混合方法在TMS320C6711DSP芯片中实现的应用研究;给出了语音识别系统的原理框图,其中采用Mel倒谱系数为语音特征参数,应用了可变窗长端点检测技术;阐述了DSP设计中系统的软硬件设计方案及具体的接口电路,该系统使得语音识别更为快速便捷,并且具有一定的通用性。 相似文献
6.
7.
8.
在信息融合的基础上提出采用基于决策层融合的多生物特征识别技术.对人脸图像采用基于主成分分析(PCA)与线性判别分析(LDA)结合的识别方法;对语音信息采用基于Mel倒频谱系数(MFCC)与混合高斯模型(GMM)的识别方法.将人脸识别子系统和语音识别子系统的输出结果作为决策层支持向量机(SVM)的输入,经过线性核函数SVM分类器融合后得到最终结果.该方法有效的提高了系统的识别率. 相似文献
9.
10.
语音口令识别是语音信息处理的一个重要研究方向,本文给出一种基于嵌入式系统的语音口令识别系统的设计方案,硬件系统的核心芯片是嵌入式微处理器,语音口令识别算法采用连续隐马尔克夫模型。实验结果表明,将语音识别系统与嵌入式系统相结合,可以使语音口令识别系统广泛应用于便携式设备中。 相似文献