期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

俞颖黄风华刘永芬《延边大学学报(自然科学版)》2020,(1):49-70

湖南省内生矿产资源丰富,内生成矿事件主要有加里东期(以志留纪为主)、印支晚期(晚三叠世)、燕山中晚期(晚侏罗世—早白垩世)等3期。以区域矿产资料为基础,结合大地构造、成岩成矿年龄、矿床成因机制等研究成果,对上述3期内生成矿事件的构造格局控矿特征和动力机制进行探讨。①受加里东运动自东南向西北扩展以及深部岩石圈结构差异控制,加里东期湖南省自东南往西北分为成矿特征有别的3个构造带。湘中—湘东南构造岩浆带(Ⅰ)发生后碰撞花岗质岩浆活动,于局部产生与岩浆活动相关的W、萤石等成矿作用; 雪峰构造带(Ⅱ)东部的雪峰冲断带(Ⅱ₁)形成了以构造活化成因为主的金矿和锑金矿; 雪峰构造带(Ⅱ)西部的武陵低缓褶皱带(Ⅱ₂)及湘西北构造抬升带(Ⅲ)内形成了与寒武纪同沉积断裂活动、加里东运动后的伸展活动以及相应的热液活动有关的汞铅锌矿。②印支晚期受深部岩石圈结构差异控制,湖南省自东南至西北分为3个构造带:湘中—湘东南构造岩浆带(Ⅰ)因后碰撞减压熔融而发生大规模花岗质岩浆活动,从而于其东南部形成钨锡铅锌多金属矿床,西北部形成锑金钨多金属矿床; 雪峰构造带(Ⅱ)可能无内生热液成矿作用; 湘西北褶皱带(Ⅲ)发育小型脉型铅锌矿。③燕山中晚期,湖南省自东南往西北分为3个构造带:湘中—湘东构造岩浆带(Ⅰ)受岩石圈拆沉、软流圈上隆、陆内碰撞后期增温减压、俯冲板块崩塌等深部构造作用控制而发生大规模花岗质岩浆活动,形成了大量的有色金属矿床和金矿床; 雪峰西部构造带(Ⅱ)成矿作用弱,局部存在Au、Hg成矿作用; 湘西北褶皱带(Ⅲ)发育少量低温热液充填型萤石矿和砷矿。相似文献

2.

融合语音信号和脑电信号的多模态情感识别

马江河孙颖张雪英《西安电子科技大学学报(自然科学版)》2019,46(1):143-150

为构造有效的情感识别系统,通过声音刺激分别诱发出高兴、悲伤、生气以及中性4种情感,并采集相应的语音信号和脑电信号。首先,利用相空间重构技术提取脑电信号和语音信号的非线性几何特征和非线性属性特征,并结合两者的基本特征分别实现情感识别;然后,通过构建基于限制玻尔兹曼机的特征融合算法,从特征层融合的角度实现多模态情感识别;最后,利用二次决策算法从决策融合的角度构建多模态情感识别系统。实验结果显示,从特征融合的角度构建的多模态情感识别系统相比语音信号和脑电信号情感整体识别率,分别提高1.08%和2.75%;从决策融合的角度构建的多模态情感识别系统相比语音信号和脑电信号情感整体识别率,分别提高6.52%和8.19%;决策融合相比特征融合构建的多模态情感识别系统整体识别效果更优。因此,融合语音信号和脑电信号等不同来源的情感数据可以构造出更有效的情感识别系统。相似文献

3.

Data-Driven Temporal Filtering on Teager Energy Time Trajectory for Robust Speech Recognition

赵军辉谢湘匡镜明《北京理工大学学报(英文版)》2006,15(2):195-200

Data-driven temporal filtering technique is integrated into the time trajectory of Teager energy operation （TEO） based feature parameter for improving the robustness of speech recognition system against noise. Three kinds of data-driven temporal filters are investigated for the motivation of alleviating the harmful effects that the environmental factors have on the speech. The filters include： principle component analysis （PCA） based filters, linear discriminant analysis （LDA） based filters and minimum classification error （MCE） based filters. Detailed comparative analysis among these temporal filtering approaches applied in Teager energy domain is presented. It is shown that while all of them can improve the recognition performance of the original TEO based feature parameter in adverse environment, MCE based temporal filtering can provide the lowest error rate as SNR decreases than any other algorithms. 相似文献

4.

Novel acoustic features for speech emotion recognition

ROH Yong-Wan KIM Dong-Ju LEE Woo-Seok HONG Kwang-Seok 《中国科学E辑(英文版)》2009,52(7):1838-1848

This paper focuses on acoustic features that effectively improve the recognition of emotion in human speech. The novel features in this paper are based on spectral-based entropy parameters such as fast Fourier transform (FFT) spectral entropy, delta FFT spectral entropy, Mel-frequency filter bank (MFB) spectral entropy, and Delta MFB spectral entropy. Spectral-based entropy features are simple. They reflect frequency characteristic and changing characteristic in frequency of speech. We implement an emotion rejection module using the probability distribution of recognized-scores and rejected-scores. This reduces the false recognition rate to improve overall performance. Recognized-scores and rejected-scores refer to probabilities of recognized and rejected emotion recognition results, respectively. These scores are first obtained from a pattern recognition procedure. The pattern recognition phase uses the Gaussian mixture model (GMM). We classify the four emotional states as anger, sadness, happiness and neutrality. The proposed method is evaluated using 45 sentences in each emotion for 30 subjects, 15 males and 15 females. Experimental results show that the proposed method is superior to the existing emotion recognition methods based on GMM using energy, Zero Crossing Rate (ZCR), linear prediction coefficient (LPC), and pitch parameters. We demonstrate the effectiveness of the proposed approach. One of the proposed features, combined MFB and delta MFB spectral entropy improves performance approximately 10% compared to the existing feature parameters for speech emotion recognition methods. We demonstrate a 4% performance improvement in the applied emotion rejection with low confidence score. Supported by MIC, Korea under ITRC IITA-2009-(C1090-0902-0046) and the Korea Science and Engineering Foundation (KOSEF) funded by the Korea government (MEST) (Grant No. 20090058909) 相似文献

5.

Algorithm for extraction of features of robot speech control in the factory environment

WANG Xiaohua YAO Pengchao MA Liping WANG Wenjie ZHANG Lei 《西安电子科技大学学报(自然科学版)》1996,47(2):16-22

In the real working environment,the mobile robots have a poor recognition performance to speech control commands due to the noise effect. Aiming at this issue,this paper proposes a new algorithm based on the gammatone frequency cepstral coefficient and the mixed feature extraction of the Teager energy operator. This algorithm replaces the common Mel filter with the Gammatone filter. In the process of extracting gammatone frequency cepstral coefficients,the Teager energy operator reflecting the energy of speech signal is added to form a new feature, with the dynamic characteristics of the speech signal considered. It is combined with the first-order difference parameters to form a mixed feature. And the principal component analysis is made to reduce the dimension,and the final mixed features are used to the speech recognition system for control command of the mobile robot. Experimental results show that,in the environment of the workshop noise and signal-to-noise ratio of 10dB,the recognition rate of mixed features is improved by 12.20% compared with the mel frequency cepstrum coefficient. The recognition rate of the mixed feature is increased by 1.02% when the dimension is reduced by principal component analysis. 相似文献

6.

采用半定规划多核SVM的语音情感识别 总被引：1，自引：0，他引：1

姜晓庆夏克文夏莘媛祖宝开《北京邮电大学学报》2015,(z1):67-71

为提高语音情感识别精度,采用二叉树结构设计多分类器,其中使用半定规划法求解并构造多核支持向量机( SVM)分类模型,并采用均方根误差与最大误差对分类器性能进行衡量.对特征选择之后的参数集合进行了测试,结果表明,采用半定规划多核SVM分类模型的情感识别精度达到88.614%,比单核分类模型的识别精度提高了12.376%,且能有效减少误差积累和降低情感状态之间混淆程度. 相似文献

7.

PAD三维情感空间中的语音情感识别 总被引：1，自引：0，他引：1

陈逸灵程艳芬陈先桥王红霞李超《哈尔滨工业大学学报》2018,50(11):160-166

离散情感描述模型将人类情感标注为离散的形容词标签,该类模型只能表示有限种类的、单一明确的情感类型,而维度情感模型从情感的多个维度量化了复杂情感的隐含状态.另外,常用的语音情感特征梅尔频率倒谱系数(MFCC)存在因分帧处理引起相邻帧谱特征之间相关性被忽略问题,容易丢失很多有用信息.为此本文提出改进方法,从语谱图中提取时间点火序列特征、点火位置信息特征对MFCC进行补充,将这三种特征分别用于语音情感识别,根据识别结果从PAD维度情感模型的三个维度(Pleasure-displeasure愉悦度、Arousal-nonarousal激活度、Dominance-submissiveness优势度)进行相关性分析得到特征的权重系数,加权融合后获得情感语音的最终PAD值,将其映射至PAD三维情感空间中.实验表明,增加的时间点火序列、点火位置信息不但能探测说话人的情感状态,同时考虑了相邻频谱间的互相关信息,与MFCC特征形成互补,在提升基本情感类型离散识别效果的基础上,将识别结果表示为PAD三维情感空间中的坐标点,采用量化的方法揭示情感空间中各种情感的定位与联系,展示出情感语音中糅杂的情感内容,为后续复杂的语音情感分类识别奠定研究基础. 相似文献

8.

Emotional speech feature extraction and optimization of phase space reconstruction

SUN Ying SONG Chunxiao 《西安电子科技大学学报(自然科学版)》2017,44(6):162-168

相似文献

9.

不定人语音识别系统 总被引：1，自引：0，他引：1

胡春静吴善培《北京邮电大学学报》1995,18(1):25-30

采用了说话人自适应和大数量人的训练数据两种方法解决不定人语音识别问题,在离散隐马尔可夫模型ＤＨＭＭ孤立字语音识别系统中,采用了３种说话人自适应方法,方法１,方法２为码本自适应,方法３为新人数据自适应,并将新建的１０００人的语音库用于不定人语音识别。实验结果表明,说话人自适应方法均有一定的自适应效果,特别是多码本自适应后,识别率可提高１６％,达到９３％以上;在数据库的采用,使得不定人的数字识别率达到相似文献

10.

语音情感信息可视化建模研究与探析

韩文静李海峰王朝友《东北重型机械学院学报》2010,(2):128-132

语音情感识别是情感计算领域的一个重要分支,研究者们尝试从多种角度对其展开不懈研究。本文从可视化的角度出发,提出了基于信息可视化的情感识别方法,原始语音情感特征经过图表示映射为包含内部数据结构信息的新型情感图特征,在一定程度上促进了语音情感识别系统的性能提高。另外,还将信息可视化技术应用到情感识别结果的表达上,实现情感信息的生动描述和高效表达。在信息可视化技术和语音情感识别研究充分融合的基础上,构建了一个完整的语音情感信息可视化模型,作为系统实现的基础。相似文献

11.

一种基于分带谱熵和谱能量的语音端点检测算法 总被引：3，自引：0，他引：3

李如玮鲍长春《北京工业大学学报》2007,33(9):920-924

语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难.信噪比下降,语音端点检测的正确率也随之下降,同时,噪声类型的变化影响端点检测的正确率.为此,提出了一种改进的、适合在电话语音城市名识别系统中应用的端点检测算法,并结合分带谱熵和谱能量形成了一个新的特征参数集,利用该参数集进行端点检测,弥补了分别采用分带谱熵和谱能量进行端点检测的缺陷,提高了检测性能. 相似文献

12.

嵌入注意力机制并结合层级上下文的语音情感识别

程艳芬陈垚鑫陈逸灵杨益《哈尔滨工业大学学报》2019,51(11):100-107

由于情感语料问题、情感与声学特征之间关联问题、语音情感识别建模问题等因素,语音情感识别一直充满挑战性.针对传统基于上下文的语音情感识别系统仅局限于特征层造成标签层上下文细节丢失以及两层级差异性被忽略的缺陷,本文提出嵌入注意力机制并结合层级上下文学习的双向长短时记忆(BLSTM)网络模型.模型分3个阶段完成语音情感识别任务,第1阶段提取情感语音特征全集后采用SVM-RFE特征排序算法降维得到最优特征子集,并对其进行注意力加权;第2阶段将加权后的特征子集输入BLSTM网络学习特征层上下文获得最初情感预测结果;第3阶段利用情感标签值对另一独立BLSTM网络训练学习标签层上下文信息并据此在第2阶段输出结果基础上完成最终预测.模型嵌入注意力机制使其自动学习调整对输入特征子集的关注度,引入标签层上下文使其联合特征层上下文实现层级上下文信息融合提高鲁棒性,提升了模型对情感语音的建模能力,在SEMAINE和RECOLA数据集上实验结果表明:与基线模型相比RMSE和CCC均得到较好改善. 相似文献

13.

面向情感语音识别的情感维度PAD预测

孙颖胡艳香张雪英段淑斐《浙江大学学报(工学版)》2019,53(10):2041-2048

针对现有的情感特征仅从信号的角度对情感进行分析,不能直观反映情感状态的问题,提出将连续情感维度PAD引入情感识别. 实验样本选用TYUT2.0数据库和柏林语音库中的3种情感（悲伤、愤怒和高兴）,提取情感特征（韵律特征、共振峰、MFCC和非线性特征）. 为了获取客观、精确的PAD维度,利用灰色关联分析（GRA）选取影响P、A、D的主要特征,通过主成分分析（PCA）提取主要特征的主成分,将主成分作为最小二乘支持向量机（LSSVM）的输入预测P、A、D. 分别对情感特征、PAD维度及它们的融合,采用支持向量机进行情感识别. 实验结果表明,该预测方法在一定程度上提高了对P、A、D的预测精度,预测值可以有效识别情感,对情感特征在情感识别方面有一定的补充作用. 相似文献

14.

融合非线性幂函数和谱减法的CFCC特征提取

白静史燕燕薛珮芸郭倩岩《西安电子科技大学学报(自然科学版)》2019,46(1):86-92

为提高噪声环境下的语音识别准确率,提出一种改进的语音特征提取算法。该算法采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数,并在特征提取前端引入谱减法对信号进行增强,将提取到的新的特征及其一阶差分组成一种混合特征参数;再联合主成分分析对该混合特征进行降维,将最终得到的特征用于一个非特定人、孤立词、小词汇量的语音识别系统。实验结果表明:采用非线性幂函数提取的耳蜗滤波倒谱系数特征与传统的耳蜗滤波倒谱系数特征相比,明显提高了语音识别准确率;混合特征参数相比单一特征能达到更佳的语音识别性能;结合主成分分析后的特征集在信噪比为0dB时的识别正确率可达到88.10%。相似文献

15.

基于RBF神经网络的语音情感识别

张海燕唐建芳《四川轻化工学院学报》2011,(5):552-555

介绍了径向基函数神经网络的原理、训练算法,并建立了RBF神经网络的语音情感识别的模型。在实验中比较了BP神经网络与RBF神经网络分别用于语音情感识别识别率,RBF神经网络的平均识别率高于BP神经网络3%。结果表明,基于RBF神经网络的语音情感识别方法的有效性。相似文献

16.

一种基于决策层融合的多模态情感识别方法

下载免费PDF全文

韩天翊林荣恒《南京师范大学学报》2022,(2):035-40

设计了一种软硬结合的多模态情感识别系统,使用语音和面部表情两个模态,通过梅尔频率倒谱系数与卷积神经网络对情感进行识别和分类,同时将语音情感识别迁移到神经网络计算棒以降低环境负载. 在模态融合时,采用决策层融合的方式来提高识别准确率. 实验结果表明,系统拥有较高的识别准确率,且能够在性能较差的运行环境中保持运行速度. 相似文献

17.

基于HMM和PNN的语音情感识别研究

叶斌《青岛大学学报(工程技术版)》2011,26(4):53-56,72

语音情感识别是从语音的角度赋予计算机理解情感特征的能力,最终使计算机能像人一样进行自然、亲切和生动的交互。提出了一种融合隐马尔科夫模型（hidden markov model,HMM）和概率神经网络（probabilistic neural network,PNN）的语音情感识别方法。在所设计情感识别系统中,提取出基本的韵律参数和频谱参数,利用PNN处理声学参数的统计特征,利用HMM处理声学参数的时序特征,运用加法规则和乘法规则融合了统计特征和时序特征的识别结果。实验结果显示,所提出的算法在语音情感识别中具有有效的识别能力。相似文献

18.

基于支持向量机的变异语音分类研究 总被引：6，自引：0，他引：6

王欢良韩纪庆张磊《哈尔滨工业大学学报》2003,35(4):389-393

变异语音的训练样本有限，采用传统的分类方法进行分类，效果不够理想，而支持向量机方法在有限样本情况下可以保持很好的分类推广能力．采用支持向量机方法进行变异语音分类，提取基频和TE0基频作为变异语音分类的特征，讨论了样本预处理和参数选择等问题．提出了直接截取和DTW规正两种方法来解决语音样本特征向量长度不一致的问题．基于TE0基频特征，采用指数径向基函数(ERBF)内核，对应力(G—force)影响下的变异语音进行分类，分类正确率可达到99．2％，比传统的贝叶斯分类器和HMM分类器，分类性能分别平均提高了12．6％和6．0％．实验结果表明，采用支持向量机方法进行变异语音分类是可行的．相似文献

19.

基于支持向量机的变异语音分类研究

王欢良韩纪庆张磊《哈尔滨建筑大学学报》2003,(4)

变异语音的训练样本有限,采用传统的分类方法进行分类,效果不够理想,而支持向量机方法在有限样本情况下可以保持很好的分类推广能力.采用支持向量机方法进行变异语音分类,提取基频和 TEO 基频作为变异语音分类的特征,讨论了样本预处理和参数选择等问题,提出了直接截取和 DTW 规正两种方法来解决语音样本特征向量长度不一致的问题.基于 TEO 基频特征,采用指数径向基函数(ERBF)内核,对应力(G-force)影响下的变异语音进行分类,分类正确率可达到99.2%,比传统的贝叶斯分类器和 HMM 分类器,分类性能分别平均提高了12.6%和6.0%.实验结果表明,采用支持向量机方法进行变异语音分类是可行的. 相似文献

20.

Mandarin Digits Speech Recognition Using Support Vector Machines 总被引：1，自引：0，他引：1

谢湘匡镜明《北京理工大学学报(英文版)》2005,14(1):9-12

A method of applying support vector machine (SVM) in speech recognition was proposed, and a speech recognition system for mandarin digits was built up by SVMs. In the system, vectors were linearly extracted from speech feature sequence to make up time-aligned input patterns for SVM, and the decisions of several 2-class SVM classifiers were employed for constructing an N-class classifier. Four kinds of SVM kernel functions were compared in the experiments of speaker-independent speech recognition of mandarin digits. And the kernel of radial basis function has the highest accurate rate of 99.33 %, which is better than that of the baseline system based on hidden Markov models (HMM) (97.08%). And the experiments also show that SVM can outperform HMM especially when the samples for learning were very limited. 相似文献