首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
基于SVM的汉语语音情感识别研究   总被引:1,自引:0,他引:1  
随着信息技术的发展,对人机交互能力的要求不断提高,情感信息处理已成为提高人机交互能力的一个重要课题.本文提出了一种汉语语音情感分类方法,主要研究了4种基本的人类情感:高兴、愤怒、恐惧、悲伤.从汉语语音信号中提取了能量、基频、语速等特征,利用支持向量机方法识别,取得了43.7%的平均识别率.  相似文献   

2.
在语音识别系统中端点检测有误差会降低系统的识别率,进行有效准确的端点检测是语音识别的重要步骤.当信噪比较低时,传统的端点检测方法不能有效的工作.为了提高系统的识别率,本文提出了一种更有效的端点检测算法,基于LPC美尔倒谱特征的端点检测方法.它是基于倒谱特征方法的一种改进.实验证明,该算法在低信噪比的情况下,能够准确的检测出语音信号的端点.通过对三种不同的端点检测算法的比较,证明了基于LPC美尔倒谱特征算法在低信噪比的情况下有较高的检测正确率.  相似文献   

3.
目前,大多数语音识别系统都采用模式匹配的原理.根据这一原理,语音信号在预处理之后要进行特征提取,常用的特征包括短时平均能量或幅度、短时平均过零率等.本文围绕如何用FPGA实现语音信号常用特征提取,介绍了信号短时处理的概念和Altera的DSP Builder开发工具,并以短时能量和短时平均过零率为例,介绍了具体实现方法,给出了仿真结果,在EP1K100上验证了方法的正确性.实验证明,采用本系统可以有效地检测出语音信号的起始点和终点,从而为进一步语音处理,如语音合成、语音识别打下基础.  相似文献   

4.
1.进入退出工厂模式先按"音量-"键,将音量减到0,再按遥控器上的"静音"键"、返回"键和数字、"1"、"2"、"3"键,屏上出现工厂菜单,即进入工厂模式。调整完毕,按"菜单"即可退出工厂菜单。2.项目选择与调整进入工厂模式后,屏幕上显示调整菜单,移动光标选择调整菜单或项目。对于自动调整的项目,按"音量+"键进入该项目,自动进行调整。对于手动调整的项目,按遥控器上的"频道+/-"键选择调整项目,按遥控器上的"音量+/-"键改变被选  相似文献   

5.
(4)手动白平衡调整VGA模式手动调整:在主菜单里将OSD(屏幕显示)调至屏幕左上角,设定亮度50,对比度50,进入工厂设定模式,输入Timing38信号,P41全白画面。COOL色温调节选择COOL,按"音量+"键进入调节R、G、B增益,使x=284±15,y=299±15。STANDRAD(标准)色温调节选择STANDARD,按"音量+"键进入调节R、C、B增益,  相似文献   

6.
通过分析反激变流器小信号模型,提出了一种新型反激变流器补偿控制方法,分析基于UC3842的反激式开关电源用于输出直接反馈的可行性.该法较之传统控制方法,具有动态响应快、闭环增益高、稳定性好、电压纹波小、负载调整率低、电压调整率低的优点,并且得到了试验的验证.  相似文献   

7.
一种有效的语音变调算法   总被引:1,自引:0,他引:1  
韩丁  沈保锁 《电子测量技术》2006,29(5):55-56,60
语音音调变换是语音处理中一项非常重要的内容。不同的语音音调主要体现在语音的基音周期和共振峰频率的差别上。本文以线性预测为基础,按照混合激励线性预测声码器中提取基音周期的方法来获取语音信号的基音周期,并利用内插和抽取的基本原理来改变基音周期,在语速不变的前提下实现语音声调的变化。  相似文献   

8.
1.工厂维修模式的调整方法用厦华K系列(其型号前带K字母)进入工厂维修菜单(S-MODE)的方法为:按电视机面板上的"音量-"  相似文献   

9.
彩电名称CPU及小信号处理香港东杰EK2598彩电CPU:LC8633288A小信号:LA75810进入或退出方法在正常收看状态下,首先按住电视机面板上“音量减”键至最小不松手,然后按遥控器上的“显示”键,此时的屏幕上显示“S”字符,表示已进入维修调整状态。按“频道加/减”键改变调整项目,按“音量加/减”键调整数据。调整完毕后,按遥控关机退出香港东杰54cm(21英寸)彩电CPU:LC863328A小信号:LA76810A在正常收看状态下,首先按住电视机面板上“音量减”键至最小不松手,然后按有控器上的“显示”键,便可进入维修调整状态,此时屏幕显示SUB-BRIGH…  相似文献   

10.
针对语音识别系统的多种语音特征参数进行了阐述,详细分析了语音特征参数中反映语音特性和说话人特征的美尔倒谱参数(MFCC)、差分美尔倒谱参数(ΔMFCC,Δ2 MFCC)、语音短时能量(Eg)以及语音基音周期参数(Ts)。在不同特征参数阶数下,将多种特征参数进行组合并将组合特征参数分别通过基于矢量量化(VQ)算法的语音识别系统进行验证,实验结果表明,在小词汇量孤立词语音识别系统中,基于MFCC、ΔMFCC、Eg和Ts的组合特征参数既能够较好的反应语音的动静态特性又对不同说话人的语音具有良好的区分度,为语音特征参数的研究提供了重要参考。  相似文献   

11.
Rivlin  Z. 《Potentials, IEEE》1989,8(4):13-16
A speaker-dependent speech recognizer for connected sequences of digits that uses a time-delayed neural network (TDNN) is described. The advantage of using a TDNN is that, at any given instant, acoustic features of the speech signal for a past interval of time up to the present can be observed simultaneously. Thus, once the system is trained, no detection of boundaries between words is necessary for the recognition. Instead of parsing the speech signal into words, or even further into phonemes, and then recognizing each word or phoneme by some process, the TDNN analyzes the signal in a continuous manner, word recognition units being activated as their corresponding words are completed in the input speech signal. A system of this type will most likely be incorporated in the very near future into a voice-activated telephone  相似文献   

12.
In this paper, we proposed a method for improving the recognition performance of 145 prominent consonant–vowel (CV) units in Indian languages for low bit‐rate coded speech. Proposed CV recognition method is carried out in two levels to reduce the similarity among a large number of CV classes. In the first level, vowel category of CV unit will be recognized, and in the second level, consonant category will be recognized. At each level of the proposed method, complementary evidences from support vector machine and hidden Markov models are combined to enhance the recognition performance. Effectiveness of the proposed two‐level CV recognition method is demonstrated by performing the recognition of isolated CV units and CV units collected from the Telugu broadcast news database. In this work, vowel onset point (VOP) is used as an anchor point for extracting accurate features from the CV unit. Therefore, a method is proposed for accurate detection of VOP in clean and coded speech. The proposed VOP detection method is based on the spectral energy in 500–2500 Hz frequency band of the speech segments present in the glottal closure region. Speech coders considered in this work are GSM full rate (ETSI 06.10), CELP (FS‐1016), and MELP (TI 2.4 kbps). Significant improvement in CV recognition performance is achieved using the proposed two‐level method compared with the existing methods under both clean and coded conditions. Copyright © 2011 John Wiley & Sons, Ltd.  相似文献   

13.
龚伟 《低压电器》2009,(20):1-4
首先对语音识别技术的应用方向及数字信号处理器作了简要介绍,然后以TMS320VC5410型DSP芯片为核心构建了语音识别系统,并采用动态时间归整算法DTW作为识别算法。该系统在小词汇量的孤立词语音识别中获得了良好的识别性能。未来若对此识别系统作进一步完善后,再嵌入现代建筑或家居的电子类产品中,可很好地实现对这些电子类产品的智能化操作与控制,从而为人们带来更加方便、舒适的居住环境。  相似文献   

14.
针对目前语音转录文本错误率较高的问题,本文提出一种基于MacBERT的文本先检错后纠错模型,对语音转录后文本进行校正。检错阶段使用MacBERT-BiLSTM-CRF模型检查文本是否有错及出错位置。纠错阶段从置信度和字音相似度两个维度出发,划定“置信度-字音相似度”曲线判断候选字是否进行纠错。候选字的置信度使用MacBERT语言模型计算,并提出一种基于拼音码的字音相似度计算方法。在语音公开数据集Thchs-30上通过调用百度语音识别API进行实验,相比现有方法,在检错阶段和纠错阶段的精确率、召回率、F1值都得到了提高,其中纠错阶段精确率达到83.32%,提高了转录文本的正确性。  相似文献   

15.
汪琳瑛  何胜伟 《广东电力》2006,19(12):61-63
语音报警在电力调度自动化系统中起着关键的作用,然而,语音的人为录制生成不仅方式烦琐,而且出错的可能性大。广东电网公司韶关供电局在更新电力调度自动化系统时,利用语音合成技术,开发出语音合成(TTS)系统采实现语音报警功能,解决人为录制语音文件所存在的弊端。TTS系统具有支持多种语种、合成音色多样化、短语合成效果佳、语气表现力强、数字与数值类型识别率高、支持MP3格式背景音乐、预录音批量处理、图形界面远程监控、网络语音合成服务和资源服务等特点,应用中具有免语音维护、语音报警准确性高、升级方便、语音合成速度快等优势。在电力调度自动化系统中应用时,采用侍输控制协议的客户一服务器方式实现语音报警,客户端运行TTS语音软件,并需硬件把关器支持,数据采集与监控(SCADA)服务器为服务器端。  相似文献   

16.
基于DSP的语音识别智能控制系统   总被引:1,自引:0,他引:1  
介绍了语音识别的基本原理及用浮点数字信号处理器(DSP)TMS320C32实现语音识别算法的一些原则和方法,阐述了语音识别的DSP实现技术,系统以预测倒谱参数为特征参数,并采用计算量相对较小的改进的动态时间规整(DTW)算法实现语音参数模板匹配,能够实现特定人、孤立词、小词汇量的语音识别,并用MATLAB进行了算法仿真,从而将语音识别技术应用到智能控制系统中,给出了实验结果和误差分析。试验结果表明,系统正确识别率在89.96%,具有一定的实用价值。  相似文献   

17.
The authors have designed, successfully trained and tested an Arabic speech recognition system. This system was implemented using C++ programming language on Windows 95. It can be partitioned into five main modules. These modules are the front-end, feature extraction, training, pattern recognition and decision making and display. The front-end module functions as signal preparation and calibration. This includes: setting the signal sampling rate, removing the DC component from the signal, setting the scaling factor of the signal and detecting the endpoints of the utterance. The endpoint task removes the non-speech signal portions created by the speaker's pauses. This reduces the system computation time needed and the memory requirements. The feature extraction module is mainly a digital signal processor. The training module is the one that finds the best templates for every word or sound (phonemes) in the system's database. In short, this module needs to be executed only one time before users can utilize the system. The next module is the pattern recognition module. Its function is to compare the given utterance (test utterance) to all the stored templates (the reference module). The decision and display module functions as an interface between the user and the hidden system modules. In other words, after getting the recognition module results, this module displays the best candidate(s) and/or their likelihood percentage. The error rates are computed and displayed in this module  相似文献   

18.
设计了一个基于多单片机的孤立词语音识别系统,结合滤波技术、流水线技术和改进的动态时间规整算法等,在搭建的硬件平台上进行试验.试验结果表明,系统具有较强的识别能力.结合LonTalk网络协议,将系统设计成ISDN系统的一个嵌入式子系统,将语音识别应用到楼宇控制系统中,实现了对楼宇设备更加实时、方便的控制.  相似文献   

19.
交互系统是服务机器人与人交流互动的基础。采用实感3D相机作为传感器,研发了一款助老服务机器人多模式交互系统,主要实现基于人脸识别的用户注册与验证、基于手势识别和语音识别的新闻点播、日程提醒等。实验测试表明,人脸识别准确率达到93%,手势识别准确率达到72%,语音识别准确率达到90%。该交互系统具有交互友好、不依赖网络、识别速度快等优点,与全向移动机器人平台集成,可以为空巢老人提供一款交互友好的多功能低成本助老服务机器人。  相似文献   

20.
谈利芳  刘蓉  黄刚  张雄 《电子测量技术》2017,40(10):122-126
针对语音情感识别中特征维数高、识别率较低的问题,提出利用遗传算法进行特征降维,并构建二叉树结构的多级支持向量机(SVM)分类器进行语音多类情感识别的方案.首先对语音信号预处理后提取常用的情感特征,由于涉及特征较多,存在数据的冗余,采用遗传算法对提取的特征进行优化筛选;然后使用选出的最具情感区分能力的特征训练二叉树结构的多级SVM分类模型.在包含7种情感的柏林情感语料库上进行实验,结果证明提出的语音情感识别方案的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号