首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文简单介绍了几种减少噪音带来的待识别信号特征与模型特征不匹配的方法,针对噪音环境下语音特征的变化特点,重点分析了归一化方法,并对动态范围调整方法做了重点的介绍。通过分析孤立词识别中存在的问题,提出了在连续语音特征曲线中基于动态范围调整的新方法。  相似文献   

2.
语音情感识别研究进展*   总被引:5,自引:1,他引:4  
首先介绍了语音情感识别系统的组成,重点对情感特征和识别算法的研究现状进行了综述,分析了主要的语音情感特征,阐述了代表性的语音情感识别算法以及混合模型,并对其进行了分析比较。最后,指出了语音情感识别技术的可能发展趋势。  相似文献   

3.
语音识别技术在汽车领域有着广泛的应用。但通常车内环境存在着噪音,且车载系统运算能力有限。要保证较高识别率,减少识别时的计算量,需要针对噪音环境的特点提取鲁棒特征并压缩语音模板。本文选择高信噪比的频带进行语音模板的训练,通过聚类的方法压缩模板的长度,并用实验验证了所提出的语音特征鲁棒性。  相似文献   

4.
语音情感识别是近年来新兴的研究课题之一,特征参数的提取直接影响到最终的识别效率,特征降维可以提取出最能区分不同情感的特征参数。提出了特征参数在语音情感识别中的重要性,介绍了语音情感识别系统的基本组成,重点对特征参数的研究现状进行了综述,阐述了目前应用于情感识别的特征降维常用方法,并对其进行了分析比较。展望了语音情感识别的可能发展趋势。  相似文献   

5.
本文介绍了语音情感识别领域的最新进展和今后的发展方向,特别是介绍了结合实际应用的实用语音情感识别的研究状况。主要内容包括:对情感计算研究领域的历史进行了回顾,探讨了情感计算的实际应用;对语音情感识别的一般方法进行了总结,包括情感建模、情感数据库的建立、情感特征的提取,以及情感识别算法等;结合具体应用领域的需求,对实用语音情感识别方法进行了重点分析和探讨;分析了实用语音情感识别中面临的困难,针对烦躁等实用情感,总结了实用情感语音语料库的建立、特征分析和实用语音情感建模的方法等。最后,对实用语音情感识别研究的未来发展方向进行了展望,分析了今后可能面临的问题和解决的途径。  相似文献   

6.
针对普通话测试中噪音干扰问题,提出了一种基于小波变换的普通话智能测试系统,对噪音环境下的语音信号进行准确辨别。为了确保本文系统语音识别的准确率,通过隐马尔可夫统计模型叠加神经网络,采用模式匹配的方式搭建了整体语音辨别系统。为了降低噪音对语音信号的影响,在系统中引入小波分析对信号进行去噪处理,同时引入了梅尔频率倒谱系数提取信号特征。实验证明,相较于未改进的传统系统,基于小波变换改进的普通话智能测试系统,在有噪声环境下,四次仿真的平均识别准确率要高7.2%,平均识别时间缩短了1.1 s,识别效果大幅提高;相较于基于DNN的普通话识别系统和基于CTC准则的普通话识别系统,基于小波变换改进的普通话智能系统,在4种不同噪音环境下,语音识别准确率更高,尤其面对频谱更集中的噪音,系统的识别准确率高达90.7%,分别较另外两种系统高出7.5%和6.6%,具有更好的实用性。  相似文献   

7.
为有效地利用多特征融合技术提高手写体汉字识别系统信息容量,同时有效地控制数据规模,提出一种基于反馈调整机制的手写体汉字特征属性变精度自适应动态调整简约方法。依据粗糙集理论,建立以先验知识指导训练过程的手写体汉字识别决策信息系统,给出以系统识别容量熵作为判断条件的特征融合算法。基于类别可分性准则,定义变精度特征粗糙集的信息粒度熵,给出基于信息粒度熵的变精度特征简约算法。在规定修正粗糙度范围的基础上,设计出启发式反馈机制,运用粒子群算法动态调整β正确分类率,训练样本特征集合在历次循环过程中选择最佳约简特征集合。实验表明该方法大大减少了手写体汉字的特征属性维数,降低了信息系统决策规则的复杂度。  相似文献   

8.
针对于当前语音信号的复杂性,和外界噪音的干扰,导致语音交互系统难以实现较为连续交互这一问题,采用由语音识别、单轮交互、多轮交互、语音合成这四个模块构成的基于语音识别的人机交互系统,在语音识别模块中,语音特征信号提取采用了MFCC特征提取方法,采用了深度算法进行构建声学模型。在多轮交互模块中,采用了GPT-2模型来实现了人机交互中的长对话。结果表明:该语音交互系统可以精准地提取出语音中的所需特征,然后进行有效的语音识别,DNN-HMM模型进行语音识别的WER值为4.11,识别时间短,最后合成出了清晰自然的语音。该结果证明此语音交互系统具有可行性。  相似文献   

9.
在咳嗽识别中,语音是影响识别准确率的主要因素。分析咳嗽与语音相邻帧频谱的相似性特征,发现咳嗽相邻帧的频段互相关系数明显小于语音,因此频段互相关系数可以作为区分咳嗽与语音的动态特征。在相同实验条件下,以MFCC为静态特征,比较了以频段互相关系数和一阶MFCC作为动态特征参数的咳嗽识别性能。多组录音的咳嗽识别实验结果表明:采用频段互相关系数作为动态特征参数咳嗽识别的平均准确率为90.27%,其识别能力优于一阶MFCC。  相似文献   

10.
梁冰  陈德运  程慧 《控制理论与应用》2011,28(10):1461-1466
为了提高噪音环境中语音识别的准确性和鲁棒性,提出了基于自适应视听信息融合的抗噪语音识别方法,视听信息在识别过程中具有变化的权重,动态的自适应于环境输入的信噪比.根据信噪比和反馈的识别性能,通过学习自动机计算视觉信息的最优权重;根据视听信息的特征向量,利用隐马尔科夫模型进行视听信息的模式匹配,并根据最优权重组合视觉和声音隐马尔科夫模型的决策,获得最终的识别结果.实验结果表明,在各种噪音水平下,自适应权重比不变权重的视听信息融合的语音识别性能更优.  相似文献   

11.
针对单一生物特征身份识别由于传感器噪音及特征破损等缺陷导致识别率低的问题,从信息融合角度出发,提出一种基于语音和人脸的多生物特征身份识别方法.分别提取语音特征和人脸特征作为识别的依据,并用神经网络在特征层上进行融合识别.实验证明,该方法相对单一生物特征身份识别,在同等条件下具有更高的识别率.  相似文献   

12.
针对多数语音识别系统在噪音环境下性能急剧下降的问题,提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过组合语音信号和其差分信号的上升过零率获得频率信息,通过峰值检测和非线性幅度加权来获取强度信息,二者组合在一起,得到输出语音特征,再分别用BP神经网络和HMM进行训练和识别。仿真实现了不同信噪比下不依赖人的50词的语音识别,给出了识别的结果,证明了组合差分信息的过零与峰值幅度特征具有较强的抗噪声性能。  相似文献   

13.
重点研究在噪声环境下,话者识别中语音信号的特征提取。将能减化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤波性应用在一维语音信号的处理中。并在噪声环境下,应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括线性预测倒谱系数、MEL倒谱系数、语音动态参数、激励源特征等,对这些参数进行分析和比较,以达到话者识别的目的。  相似文献   

14.
重点研究在噪声环境下,话者识别中语音信号的特征提取。将能减化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤波性应用在一维语音信号的处理中。并在噪声环境下,应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括线性预测倒谱系数、MEL倒谱系数、语音动态参数、激励源特征等,对这些参数进行分析和比较.以达到话者识别的目的。  相似文献   

15.
论文针对强噪音环境提出一种PZT振动拾音器作为语音识别的前端输入。在同步采样前提下,比较了其信号与麦克风信号在时、频域上抗噪声性能上的差异。为弥补部分语音信息的丢失,提出了一种混合倒谱系数作为语音识别的特征,并分析了其抗噪声性能。  相似文献   

16.
低资源语音识别是当今语音界研究的热点问题之一,也是多语言小语种语音识别技术在实际应用中所面临的重要挑战之一。本文回顾并总结了低资源语音识别的 发展历史和研究现状,重点介绍了低资源语音识别在声学特征、声学模型和语言模型方面的若干关键技术研究进展。具体内容包括发音特征、多语言瓶颈特征、子空间高斯混合模型、卷积神经网络声学模型和递归神经网络语言模型,然后介绍了针对低资源语音识别的公开关键词搜索(Open keyword search,OpenKWS)评测,最后对低资源语音识别进行了总结和展望。  相似文献   

17.
针对现有技术中电动汽车充电平台智能语音识别能力差的问题,设计了新型的电动汽车充电平台,该系统平台包括计算机网络终端、电网调度中心以及充电桩等,能够实现上层管理中心的语音识别,电路包括语音采集模块、语音辨别模块和控制驱动模块等,设计出基于UniSpeech-SDA80D51芯片的语音识别电路,提高了语音识别能力,并构建出隐马尔可夫模型(hidden Markov model,HMM)和人工神经元网络(artificial neural network,ANN)相融合的模型,实现了智能语音识别数据信息的挖掘与处理,进而增强了语音识别系统的性能。试验表明,该研究在不同噪音下的识别率,其中在20 dB的噪音下识别率为88.3%。该方法提高了语音识别和挖掘能力。  相似文献   

18.
基于神经网络的语音情感识别   总被引:3,自引:1,他引:3       下载免费PDF全文
研究目的就是通过深入分析各种语音情感特征,找出其中对情感识别有较大贡献的特征,并寻找适合的模型将有效特征加以利用。分析和研究了多位科学家在进行语音情感分析过程中采用的方法和技术,通过总结和创新建立了语音情感语料库,并成功地提取了相关的语音信号的特征。研究了基音频率、振幅能量和共振峰等目前常用的情感特征在语音情感识别中的作用,重点研究了MFCC和?驻MFCC,实验发现特征筛选后系统的识别效果有着一定程度的提高。将处理后的频谱特征参数同原有的BP人工神经网络模型有效地结合起来,形成完整的语音情感识别系统,取得了较为满意的识别结果。  相似文献   

19.
针对语音信号的实时性和不确定性,提出证据信任度信息熵和动态先验权重的方法,对传统D-S证据理论的基本概率分配函数进行改进;针对情感特征在语音情感识别中对不同的情感状态具有不同的识别效果,提出对语音情感特征进行分类。利用各类情感特征的识别结果,应用改进的D-S证据理论进行决策级数据融合,实现基于多类情感特征的语音情感识别,以达到细粒度的语音情感识别。最后通过算例验证了改进算法的迅速收敛和抗干扰性,对比实验结果证明了分类情感特征语音情感识别方法的有效性和稳定性。  相似文献   

20.
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号