共查询到20条相似文献,搜索用时 15 毫秒
1.
本文简单介绍了几种减少噪音带来的待识别信号特征与模型特征不匹配的方法,针对噪音环境下语音特征的变化特点,重点分析了归一化方法,并对动态范围调整方法做了重点的介绍。通过分析孤立词识别中存在的问题,提出了在连续语音特征曲线中基于动态范围调整的新方法。 相似文献
2.
3.
吴紫剑 《计算机光盘软件与应用》2014,(2):15-16,19
语音识别技术在汽车领域有着广泛的应用。但通常车内环境存在着噪音,且车载系统运算能力有限。要保证较高识别率,减少识别时的计算量,需要针对噪音环境的特点提取鲁棒特征并压缩语音模板。本文选择高信噪比的频带进行语音模板的训练,通过聚类的方法压缩模板的长度,并用实验验证了所提出的语音特征鲁棒性。 相似文献
4.
语音情感识别是近年来新兴的研究课题之一,特征参数的提取直接影响到最终的识别效率,特征降维可以提取出最能区分不同情感的特征参数。提出了特征参数在语音情感识别中的重要性,介绍了语音情感识别系统的基本组成,重点对特征参数的研究现状进行了综述,阐述了目前应用于情感识别的特征降维常用方法,并对其进行了分析比较。展望了语音情感识别的可能发展趋势。 相似文献
5.
本文介绍了语音情感识别领域的最新进展和今后的发展方向,特别是介绍了结合实际应用的实用语音情感识别的研究状况。主要内容包括:对情感计算研究领域的历史进行了回顾,探讨了情感计算的实际应用;对语音情感识别的一般方法进行了总结,包括情感建模、情感数据库的建立、情感特征的提取,以及情感识别算法等;结合具体应用领域的需求,对实用语音情感识别方法进行了重点分析和探讨;分析了实用语音情感识别中面临的困难,针对烦躁等实用情感,总结了实用情感语音语料库的建立、特征分析和实用语音情感建模的方法等。最后,对实用语音情感识别研究的未来发展方向进行了展望,分析了今后可能面临的问题和解决的途径。 相似文献
6.
文丽萍 《自动化与仪器仪表》2023,(5):153-157
针对普通话测试中噪音干扰问题,提出了一种基于小波变换的普通话智能测试系统,对噪音环境下的语音信号进行准确辨别。为了确保本文系统语音识别的准确率,通过隐马尔可夫统计模型叠加神经网络,采用模式匹配的方式搭建了整体语音辨别系统。为了降低噪音对语音信号的影响,在系统中引入小波分析对信号进行去噪处理,同时引入了梅尔频率倒谱系数提取信号特征。实验证明,相较于未改进的传统系统,基于小波变换改进的普通话智能测试系统,在有噪声环境下,四次仿真的平均识别准确率要高7.2%,平均识别时间缩短了1.1 s,识别效果大幅提高;相较于基于DNN的普通话识别系统和基于CTC准则的普通话识别系统,基于小波变换改进的普通话智能系统,在4种不同噪音环境下,语音识别准确率更高,尤其面对频谱更集中的噪音,系统的识别准确率高达90.7%,分别较另外两种系统高出7.5%和6.6%,具有更好的实用性。 相似文献
7.
《计算机应用与软件》2016,(7)
为有效地利用多特征融合技术提高手写体汉字识别系统信息容量,同时有效地控制数据规模,提出一种基于反馈调整机制的手写体汉字特征属性变精度自适应动态调整简约方法。依据粗糙集理论,建立以先验知识指导训练过程的手写体汉字识别决策信息系统,给出以系统识别容量熵作为判断条件的特征融合算法。基于类别可分性准则,定义变精度特征粗糙集的信息粒度熵,给出基于信息粒度熵的变精度特征简约算法。在规定修正粗糙度范围的基础上,设计出启发式反馈机制,运用粒子群算法动态调整β正确分类率,训练样本特征集合在历次循环过程中选择最佳约简特征集合。实验表明该方法大大减少了手写体汉字的特征属性维数,降低了信息系统决策规则的复杂度。 相似文献
8.
屈瑾 《自动化与仪器仪表》2023,(1):221-225
针对于当前语音信号的复杂性,和外界噪音的干扰,导致语音交互系统难以实现较为连续交互这一问题,采用由语音识别、单轮交互、多轮交互、语音合成这四个模块构成的基于语音识别的人机交互系统,在语音识别模块中,语音特征信号提取采用了MFCC特征提取方法,采用了深度算法进行构建声学模型。在多轮交互模块中,采用了GPT-2模型来实现了人机交互中的长对话。结果表明:该语音交互系统可以精准地提取出语音中的所需特征,然后进行有效的语音识别,DNN-HMM模型进行语音识别的WER值为4.11,识别时间短,最后合成出了清晰自然的语音。该结果证明此语音交互系统具有可行性。 相似文献
9.
在咳嗽识别中,语音是影响识别准确率的主要因素。分析咳嗽与语音相邻帧频谱的相似性特征,发现咳嗽相邻帧的频段互相关系数明显小于语音,因此频段互相关系数可以作为区分咳嗽与语音的动态特征。在相同实验条件下,以MFCC为静态特征,比较了以频段互相关系数和一阶MFCC作为动态特征参数的咳嗽识别性能。多组录音的咳嗽识别实验结果表明:采用频段互相关系数作为动态特征参数咳嗽识别的平均准确率为90.27%,其识别能力优于一阶MFCC。 相似文献
10.
11.
针对单一生物特征身份识别由于传感器噪音及特征破损等缺陷导致识别率低的问题,从信息融合角度出发,提出一种基于语音和人脸的多生物特征身份识别方法.分别提取语音特征和人脸特征作为识别的依据,并用神经网络在特征层上进行融合识别.实验证明,该方法相对单一生物特征身份识别,在同等条件下具有更高的识别率. 相似文献
12.
13.
WANG Lei 《数字社区&智能家居》2008,(22)
重点研究在噪声环境下,话者识别中语音信号的特征提取。将能减化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤波性应用在一维语音信号的处理中。并在噪声环境下,应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括线性预测倒谱系数、MEL倒谱系数、语音动态参数、激励源特征等,对这些参数进行分析和比较,以达到话者识别的目的。 相似文献
14.
王蕾 《数字社区&智能家居》2008,(8):784-785
重点研究在噪声环境下,话者识别中语音信号的特征提取。将能减化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤波性应用在一维语音信号的处理中。并在噪声环境下,应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括线性预测倒谱系数、MEL倒谱系数、语音动态参数、激励源特征等,对这些参数进行分析和比较.以达到话者识别的目的。 相似文献
15.
论文针对强噪音环境提出一种PZT振动拾音器作为语音识别的前端输入。在同步采样前提下,比较了其信号与麦克风信号在时、频域上抗噪声性能上的差异。为弥补部分语音信息的丢失,提出了一种混合倒谱系数作为语音识别的特征,并分析了其抗噪声性能。 相似文献
16.
低资源语音识别是当今语音界研究的热点问题之一,也是多语言小语种语音识别技术在实际应用中所面临的重要挑战之一。本文回顾并总结了低资源语音识别的
发展历史和研究现状,重点介绍了低资源语音识别在声学特征、声学模型和语言模型方面的若干关键技术研究进展。具体内容包括发音特征、多语言瓶颈特征、子空间高斯混合模型、卷积神经网络声学模型和递归神经网络语言模型,然后介绍了针对低资源语音识别的公开关键词搜索(Open keyword search,OpenKWS)评测,最后对低资源语音识别进行了总结和展望。 相似文献
17.
针对现有技术中电动汽车充电平台智能语音识别能力差的问题,设计了新型的电动汽车充电平台,该系统平台包括计算机网络终端、电网调度中心以及充电桩等,能够实现上层管理中心的语音识别,电路包括语音采集模块、语音辨别模块和控制驱动模块等,设计出基于UniSpeech-SDA80D51芯片的语音识别电路,提高了语音识别能力,并构建出隐马尔可夫模型(hidden Markov model,HMM)和人工神经元网络(artificial neural network,ANN)相融合的模型,实现了智能语音识别数据信息的挖掘与处理,进而增强了语音识别系统的性能。试验表明,该研究在不同噪音下的识别率,其中在20 dB的噪音下识别率为88.3%。该方法提高了语音识别和挖掘能力。 相似文献
18.
研究目的就是通过深入分析各种语音情感特征,找出其中对情感识别有较大贡献的特征,并寻找适合的模型将有效特征加以利用。分析和研究了多位科学家在进行语音情感分析过程中采用的方法和技术,通过总结和创新建立了语音情感语料库,并成功地提取了相关的语音信号的特征。研究了基音频率、振幅能量和共振峰等目前常用的情感特征在语音情感识别中的作用,重点研究了MFCC和?驻MFCC,实验发现特征筛选后系统的识别效果有着一定程度的提高。将处理后的频谱特征参数同原有的BP人工神经网络模型有效地结合起来,形成完整的语音情感识别系统,取得了较为满意的识别结果。 相似文献
19.
20.
一种噪音环境下的基于特征口形的音频视频混合连续语音识别系统 总被引:1,自引:0,他引:1
谢磊 I.Cravyse 蒋冬梅 赵荣椿 H.Sahli Werner Verhelst J Cornelis Ignace Lemahieu 《计算机工程与应用》2003,39(16):3-5,35
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。 相似文献