首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
为进一步提高智能电网调度语音识别的准确率,本文将深度学习技术引入了电力调度语音识别领域,提出了基于深度神经网络(deep neural network,DNN)的电力调度语音识别技术。针对电力调度专用术语以及某区域电网习惯调度用语,建立了电力调度语音识别基础语料库。通过应用深度神经网络-隐马尔可夫模型(deep neural network-hidden markov model,DNN-HMM)进行声学模型训练,并对电力调度语音材料制作,语音模型训练过程、端点检测、与D5000系统交互以及语音转文字的整套流程进行了论述。实践结果表明,采用DNN-HMM的电力调度语音识别性能要显著优于传统语音识别框架,即高斯混合-隐马尔可夫模型(gaussian mixture model-hidden markov model,GMM-HMM),采用所提方法进行电力调度语音识别准确率达94.63%。基于所提方法开发的电力调度语音识别系统在某区域电网调控中心的应用实例表明了所提方法的可行性与优良性。  相似文献   

2.
基于自回归-连续隐马尔可夫模型的离心泵故障诊断   总被引:5,自引:0,他引:5  
根据振动与语音信号的相似性和离心泵故障信号的特点,将连续隐马尔可夫模型引入了离心泵的故障诊断中。利用自回归谱不受数据长度的限制,及自回归模型参数对状态变化规律反映敏感的特点,以信号的12阶自回归谱系数为特征矢量,将其输入到各个状态连续隐马尔可夫进行训练,来实现离心泵的故障诊断。为防止数据下溢,引入前向-后向比例因子算法求其对数似然概率,并且采用K-means算法对连续隐马尔可夫进行参数初始化。在给定的观测序列中每一种模型的优化路径通过Viterbi算法实现,用Baum- Welch算法实现参数重估。最后通过2BA-6A离心泵试验系统验证了该方法的有效性。  相似文献   

3.
基于HTK实时中文语音路名查询系统的设计和实现   总被引:2,自引:0,他引:2  
HTK是英国剑桥大学开发的一个用于创建和处理隐马尔可夫模型的实验工具包,由一整套基于C语言的库函数组成。由于其在语音识别方面处于相对领先地位,且源代码公开便于系统开发调试,所以是进行语音识别研究的一个理想平台。本文介绍了HTK语音识别系统处理流程,提出了基于HTK的实时中文语音路名查询系统的设计和实现,可实现用户实时中文语音输入路名的情况下,系统将识别结果以汉字方式显示在屏幕上。本系统小巧快速,且具有较高的识别率。  相似文献   

4.
机械设备的故障识别方法能提供设备运行状态的实时信息,为避免生产损失和减少设备的致命故障提供保障具有重要意义.提出了一种基于隐半马尔可夫模型(HSMM)的故障识别方法.HSMM在已定义的隐马尔可夫模型的结构上加入高斯概率分布函数来表现各状态的驻留时间,比较符合设备故障发展的规律,具有较强的建模和时序分析能力,适合于复杂动态系统的故障识别问题.本文以滚动轴承为对象,通过小波分解提取滚动轴承振动信号的小波尺度熵,建立信号的特征向量集,然后训练得到各个状态的HSMM模型,最后建立基于HSMM的状态分类器,对滚动轴承的正常及不同的故障状态进行了识别试验,结果表明该方法有效可行.  相似文献   

5.
对防爆电机进行故障监测,有利于维护工作人员对电机的掌控,因此,提出了基于音频识别的防爆电机故障监测研究。通过对防爆电机音频信号预加重、分帧加窗技术展开研究,进行信号预处理。提取特征参数,使用频率倒谱系数确定不同故障信号特征。根据隐马尔可夫模型在音频识别中的应用情况,分别从电机短路、气隙不均匀和铁心松动三个方面进行故障监测,具有良好监测性能。  相似文献   

6.
为了能够更准确地对模拟电路系统中各退化状态进行状态识别和故障预测,针对单一通道的隐马尔可夫模型在模拟电路系统中预测精度不高的特点,提出了一种具有2条Markov链的耦合隐马尔可夫模型故障预测方法。该方法在模拟电路中采用2个测试点通过双通道数据分别对各退化状态和全寿命进行建模,实验结果表明,耦合隐马尔可夫模型与传统的隐马尔可夫模型相比,不但提高了状态识别率,而且能对电路系统的故障发生进行有效地预测,为状态维修提供依据。  相似文献   

7.
谈利芳  刘蓉  黄刚  张雄 《电子测量技术》2017,40(10):122-126
针对语音情感识别中特征维数高、识别率较低的问题,提出利用遗传算法进行特征降维,并构建二叉树结构的多级支持向量机(SVM)分类器进行语音多类情感识别的方案.首先对语音信号预处理后提取常用的情感特征,由于涉及特征较多,存在数据的冗余,采用遗传算法对提取的特征进行优化筛选;然后使用选出的最具情感区分能力的特征训练二叉树结构的多级SVM分类模型.在包含7种情感的柏林情感语料库上进行实验,结果证明提出的语音情感识别方案的有效性.  相似文献   

8.
为了研究"世界记忆遗产"东巴经典古籍的音频分类,以通过语音情感特征提取的方法分类鉴别东巴音频类别,并实现对东巴经典语音的情感状态识别,同时提高人机交互性能,提出采用Mel频率倒谱系数(MFCC)实现语音情感特征的提取。通过引入MFCC的一阶差分、二阶差分描述语音特征的动态特征,并整合短时能量特征,最终形成MFCC和短时能量相叠加的语音信号特征参数,达到提取反映语音情感特征的目的。实验验证表明,该语音信号特征提取方法能够更明显地区分出包含在语音中的情感信息,为语音情感特征的识别研究及东巴古籍音频分类鉴别提供理论基础。  相似文献   

9.
神经网络与马尔可夫模型的手势识别系统   总被引:2,自引:1,他引:1  
手势是一种作为表达思想或感情的肢体或身体运动,人的语言和手势是最好的沟通工具。采用基于彩色和边缘信息进行手区域检测,利用神经网络和最大内切圆搜索的方法对定义的手姿态进行识别,用基于隐马尔可夫模型对手势进行识别;对6种背景下的手势进行识别,实验证明本文的方法具有很高的识别率。  相似文献   

10.
王沛 《电测与仪表》2021,58(5):182-189
在智能电网的建设中输电线路故障诊断是其重要组成。针对输电线路数据利用率低、上传单一等问题,在输电线路故障诊断中应用S变换和连续隐马尔可夫模型,利用S变换提取输电线路故障特征,通过各故障的特征建立连续隐马尔可夫模型,实现故障选相。通过仿真验证在不同的工作条件下该方法的有效性,结果表明,该方法具有不受故障工况改变的影响、且在较高噪音下仍能正确识别故障线路的优势,为我国输电线路故障诊断的发展提供了参考和借鉴。  相似文献   

11.
基于SVM的汉语语音情感识别研究   总被引:1,自引:0,他引:1  
随着信息技术的发展,对人机交互能力的要求不断提高,情感信息处理已成为提高人机交互能力的一个重要课题.本文提出了一种汉语语音情感分类方法,主要研究了4种基本的人类情感:高兴、愤怒、恐惧、悲伤.从汉语语音信号中提取了能量、基频、语速等特征,利用支持向量机方法识别,取得了43.7%的平均识别率.  相似文献   

12.
The interaction between humans and machines has become an issue of concern in recent years. Besides facial ex-pressions or gestures, speech has been evidenced as one of the foremost promising modalities for automatic emotion recognition. Effective computing means to support HCI (Human-Computer Interaction) at a psychological level, al-lowing PCs to adjust their reactions as per human requirements. Therefore, the recognition of emotion is pivotal in High-level interactions. Each Emotion has distinctive properties that form us to recognize them. The acoustic signal produced for identical expression or sentence changes is essentially a direct result of biophysical changes, (for example, the stress instigated narrowing of the larynx) set off by emotions. This connection between acoustic cues and emotions made Speech Emotion Recognition one of the moving subjects of the emotive computing area. The most motivation behind a Speech Emotion Recognition algorithm is to observe the emotional condition of a speaker from recorded Speech signals. The results from the application of k-NN and OVA-SVM for MFCC features without and with a feature selection approach are presented in this research. The MFCC features from the audio signal were initially extracted to characterize the properties of emotional speech. Secondly, nine basic statistical measures were calculated from MFCC and 117-dimensional features were consequently obtained to train the classifiers for seven different classes (Anger, Happiness, Disgust, Fear, Sadness, Disgust, Boredom and Neutral) of emotions. Next, Classification was done in four steps. First, all the 117-features are classified using both classifiers. Second, the best classifier was found and then features were scaled to [-1, 1] and classified. In the third step, the with or without feature scaling which gives better performance was derived from the results of the second step and the classification was done for each of the basic sta-tistical measures separately. Finally, in the fourth step, the combination of statistical measures which gives better per-formance was derived using the forward feature selection method Experiments were carried out using k-NN with different k values and a linear OVA-based SVM classifier with different optimal values. Berlin emotional speech da-tabase for the German language was utilized for testing the planned methodology and recognition rates as high as 60% accomplished for the recognition of emotion from voice signal for the set of statistical measures (median, maximum, mean, Inter-quartile range, skewness). OVA-SVM performs better than k-NN and the use of the feature selection technique gives a high rate.  相似文献   

13.
针对动物的情绪识别问题,提出高斯混合模型在动物声音情绪识别上的应用方法。利用语音信号处理与机器学习技术,提取动物声音信号的过零率、共振峰、梅尔 频率倒谱系数3种描述动物情绪的特征参数。采用高斯混合模型对采集到的动物声音信号训练样本进行聚类分析,计算测试样本后验概率,实现动物情绪的自动识别。通过分析特征参数的权重系数组合、高斯混合数目对识别率的影响来择选最优参数。实验结果表明,经参数优化后的高斯混合模型可将动物声音情绪的识别率由84.25%提高至96.67%。  相似文献   

14.
一种实时检测语音基频的新方法   总被引:4,自引:1,他引:3  
汉语浊音基频的实时检测是语音识别的关键技术之一。本文介绍一种采用模拟滤波技术,使语音信号工作在滤波器的过渡带上,从而有效地抑制高次谐波,精确实时提取语音基频的新方法。文章还对其基频检测机理和采用“过零检测,信号分离”技术提高基频量测精度作了较详细的论述。  相似文献   

15.
本文提出采用分段PCA的方法提取信号的特征,再通过BP网络完成信号的训练及识别。仿真实验探究了识别网络的输入维数以及隐含层数目对识别率的影响,通过恰当的选择网络的输入维数及隐含层数,实验结果验证了使用分段PCA方法后,语音识别率会有所提高。  相似文献   

16.
Rivlin  Z. 《Potentials, IEEE》1989,8(4):13-16
A speaker-dependent speech recognizer for connected sequences of digits that uses a time-delayed neural network (TDNN) is described. The advantage of using a TDNN is that, at any given instant, acoustic features of the speech signal for a past interval of time up to the present can be observed simultaneously. Thus, once the system is trained, no detection of boundaries between words is necessary for the recognition. Instead of parsing the speech signal into words, or even further into phonemes, and then recognizing each word or phoneme by some process, the TDNN analyzes the signal in a continuous manner, word recognition units being activated as their corresponding words are completed in the input speech signal. A system of this type will most likely be incorporated in the very near future into a voice-activated telephone  相似文献   

17.
在小词汇量孤立词语音识别的研究中,录入的语音指令语速过快(慢)或音量过大(小)都会影响语音识别系统对于这些指令的识别率.为此,需要对这些语音指令进行调整.本文提出一种基于线性预测分析技术的语音语速和音量调整方法,该方法由已知语音信号反解出声门激励信号,对反解出的声门激励信号进行语速和音量的调整,将调整后的声门激励信号再次激励声道系统输出语音信号,得到调整后的语音信号.仿真研究结果表明,该方法具有实际可行性并且可以显著改善语音识别系统对于语速过快(慢)、音量过大(小)指令的识别率.  相似文献   

18.
龚伟 《低压电器》2009,(20):1-4
首先对语音识别技术的应用方向及数字信号处理器作了简要介绍,然后以TMS320VC5410型DSP芯片为核心构建了语音识别系统,并采用动态时间归整算法DTW作为识别算法。该系统在小词汇量的孤立词语音识别中获得了良好的识别性能。未来若对此识别系统作进一步完善后,再嵌入现代建筑或家居的电子类产品中,可很好地实现对这些电子类产品的智能化操作与控制,从而为人们带来更加方便、舒适的居住环境。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号