首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于听觉模型的语音特征提取   总被引:2,自引:1,他引:1  
分析了耳蜗对声音频率分解机理,毛细胞和听神经的能量转换机理以及中枢神经系统的侧抑制机理,分别在以上三个层次上建立了数学模型,并提取出识别语音特征参数。通过对听觉谱和LPC倒谱对比分析,得到了听觉谱适宜用作语音识别并具有良好的噪声鲁棒性的结论。听觉谱和LPC倒谱对比实验分析也反映了听觉模型特征的优良性能。  相似文献   

2.
一种基于听觉模型的语音特征提取方法   总被引:2,自引:0,他引:2  
提出了一种基于听觉模型的语音特征提取方法,从信号的过零点获得频率信息,从振幅值和非线性压缩获得强度信息,并对这种方法进行了误差分析,证明其噪声的鲁棒性。  相似文献   

3.
基于听觉模型的子波变换语音处理   总被引:2,自引:0,他引:2  
首先讨论了人类听觉信号处理的原理,进而将基于听觉模型的子波变换(WT)与短时傅里叶变换(STFT)进行了比较,突出了WT信号处理的独特之处。然后,简要讨论了其在语音处理中的应用。最后,给出了应用WT来进行声、韵母划分和音素周期检测的实验,其结果显示了WT在语音处理中的良好性能。  相似文献   

4.
目标声音识别逐渐将会在实际的日常生活中得以应用.在实验室环境下,对目标声音识别系统大多数识别性能也达到了一定的要求,但在实际噪声环境下的识别系统效果将大大降低.因此,在抗噪声语音识别的研究目标是非常重要的.研究发现,人耳具有良好的抗噪声能力,因此基于语音识别技术的听觉系统是一个很有前途的研究课题.  相似文献   

5.
关勇  李鹏  刘文举  徐波 《自动化学报》2009,35(4):410-416
传统抗噪算法无法解决人声背景下语音识别(Automatic speech recognition, ASR)系统的鲁棒性问题. 本文提出了一种基于计算听觉场景分析(Computational auditory scene analysis, CASA)和语者模型信息的混合语音分离系统. 该系统在CASA框架下, 利用语者模型信息和因子最大矢量量化(Factorial-max vector quantization, MAXVQ)方法进行实值掩码估计, 实现了两语者混合语音中有效地分离出目标说话人语音的目标, 从而为ASR系统提供了鲁棒的识别前端. 在语音分离挑战(Speech separation challenge, SSC)数据集上的评估表明, 相比基线系统, 本文所提出的系统的语音识别正确率提高了15.68%. 相关的实验结果也验证了本文提出的多语者识别和实值掩码估计的有效性.  相似文献   

6.
李晶皎  孙杰 《控制与决策》1998,13(6):665-668,699
提出了一种基于听觉与小波变换处理的汉语语音基音的方法,在对听觉系统描述的基础上,给出了人的听觉与小波变换的关系,选取适合汉语事音基频提取的小波函数,给出了基频提取的应用实例和基于FCM模糊聚类分析的汉语四声调值识别结果。  相似文献   

7.
近年来在大词汇连续语音识别的研究取得了长足的进步,隐马尔柯夫模型(HMM)是连续语音识别的核心部分。但是HMM对语音信号的描述不完善,为此人们提出了很多替代模型,其中一类将语音信号描述为长度随机的特征矢量序列,称为随机分段模型(Stochastic Segment Models),简称为分段模型(SM)。该文将首先阐述分段模型的原理,并将分段模型和隐马尔柯夫模型进行比较,其次给出基于分段模型的识别和模型训练算法,最后给出实验结果并进行了讨论。  相似文献   

8.
针对多数语音识别系统在噪音环境下性能急剧下降的问题,提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过组合语音信号和其差分信号的上升过零率获得频率信息,通过峰值检测和非线性幅度加权来获取强度信息,二者组合在一起,得到输出语音特征,再分别用BP神经网络和HMM进行训练和识别。仿真实现了不同信噪比下不依赖人的50词的语音识别,给出了识别的结果,证明了组合差分信息的过零与峰值幅度特征具有较强的抗噪声性能。  相似文献   

9.
稳健语音识别技术研究   总被引:4,自引:0,他引:4  
文章在简单叙述稳健语音识别技术产生的背景后,着重介绍了现阶段国内外有关稳健语音识别的主要技术、研究现状及未来发展方向。首先简述了引起语音质量恶化、影响语音识别系统稳健性的干扰源。然后介绍了抗噪语音特征的提取、声学预处理、麦克风阵列及基于人耳的听觉处理等技术路线及发展现状。最后讨论了稳健语音识别技术未来的发展方向。  相似文献   

10.
基于字统计语言模型的汉语语音识别研究   总被引:1,自引:0,他引:1  
隐马尔可夫模型(HMM)由于较好地描述了语音的特性,在语音识别的研究中占主导地位,基于HMM的识别算法也因取得了较好的识别效果而得到广泛应用.但其仅仅依靠语音信号的声学模型来进行识别处理,因此存在着不能利用语言的非声学知识进行识别的固有缺陷.该文提出的新方法将基于N元文法(N-gram)的统计语言模型应用于汉语语音识别,推导了模型多数的估值公式,并给出了模型的训练和识别算法.初步实验表明:引入统计语言模型有利于降低识别难度和改善语音识别性能.  相似文献   

11.
本文在简单介绍三种词组语音识别模型后,提出了采用离散隐马尔柯夫模型(DHMM)来构建语音识别系统,并在此基础上引入矢量量化(VQ)模块来保证识别率和识别速度,具有良好的实用性  相似文献   

12.
针对调度语音识别过程中单遍解码词图生成算法所生成词图精度较差的问题,研究基于语言模型的调度语音智能识别方法。构建由训练过程和识别过程组成的调度语音智能识别模型,训练过程中该模型提取语音数据的语音向量序列构建声学子模型,利用语言子模型训练文本数据构建语音词图,识别过程中对声学子模型、语音词图以及发音词典实施语音解码与搜索获取最优词序列,基于最优词序列完成调度语音智能识别。测试结果显示研究方法所生成的词图精度较高,可准确识别调度语音。  相似文献   

13.
鸡尾酒会问题与相关听觉模型的研究现状与展望   总被引:2,自引:0,他引:2  
近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务.因此,鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别、语音识别、关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值.本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望.在简要介绍了听觉机理的相关研究,并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后,本文还讨论了受听觉认知机理启发的听觉注意建模方法,认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性.之后,本文简单回顾了近期的多说话人语音识别模型.最后,本文讨论了目前各类计算模型用于处理鸡尾酒会问题时遇到的困难和挑战,并对未来的研究方向进行了展望.  相似文献   

14.
介绍一种基于新型小波听觉滤波器组的语音识别特征提取方法。按照人耳听觉临界频带带宽设计一组新型小波带通滤波器组,并详细计算给出构建新型小波滤波器所需要的尺度参数。采用SDA9000串行信号分析仪进行频谱分析,使用型号为MIC3000 Compact PCI Industrial Computer的LSP设备进行FPGA硬件仿真,使用协同神经网络进行模式识别,建立基于Matlab GUI的仿真界面,与高斯小波滤波器组模型所得仿真结果进行对比,从功率谱图和识别结果上进行分析,证明新型小波滤波器组具有更优的识别率和抗噪性。  相似文献   

15.
提出了一种基于Bark子波变换和概率神经网络(PNN)的语音识别模型。利用符合人耳听觉特性的Bark滤波器组进行信号重构并提取语音特征,然后利用训练好的概率神经网络进行识别。通过训练大量语音样本来构成语音识别库,并建立综合识别系统。实验结果表明该方法与传统的LPCC/DTW和MFCC/DWT方法相比,识别率分别提高了14.9%和10.1%,达到了96.9%的识别率。  相似文献   

16.
基于循环神经网络的语音识别模型   总被引:4,自引:1,他引:4  
朱小燕  王昱  徐伟 《计算机学报》2001,24(2):213-218
近年来基于隐马尔可夫模型(HMM)的语音识别技术得到了很大发展。然而HMM模型有着一定的局限性,如何克服HMM的一阶假设和独立性假设带来的问题一直是研究讨论的热点,在语音识别中引入神经网络的方法是克服HMM局限性的一条途径。该文将循环神经网络应用于汉语语音识别,修改了原网络模型并提出了相应的训练方法,实验结果表明该模型具有良好的连续信号处理性能,与传统的HMM模型效果相当,新的训练策略能够在提高训练速度的同时,使得模型分类性能有明显提高。  相似文献   

17.
基于听觉感知模型的多通道语音增强系统   总被引:1,自引:0,他引:1  
提出以模拟听觉感知模型的非均匀滤波器组为基础的多通道语音增强系统,与基于均匀滤波器组的语音增强系统相比,该方法达到相同频率分辨率所需的通道数较少。采用Itakura-Saito距离对系统进行客观评价,仿真结果表明,该系统增强后的语音比均匀多通道系统增强后的语音具有更好的改善效果。  相似文献   

18.
姜莹  俞一彪 《计算机工程与设计》2012,33(4):1482-1485,1490
提出一种新的基于语音结构化模型的语音识别方法,并应用于非特定人数字语音识别.每一个数字语音计算倒谱特征之后提取语音中存在的对说话人差异具有不变性的结构化特征——全局声学结构(acoustical universal structure,AUS),并建立结构化模型,识别时提取测试语音的全局声学结构,然后与各数字语音的结构化模型进行匹配.测试了少量语料训练下的识别性能并与传统HMM (hidden Markov model)方法进行比较,结果表明该方法可以取得优于HMM的性能,语音结构化模型可以有效消除说话人之间的差异.  相似文献   

19.
针对经典隐马尔可夫模型对状态持续时间的函数表达与实际语音的物理事实不相符合这一缺点,在通常隐马尔可夫的基础上引入状态持续时间参数,建立基于状态持续时间的HMM语音识别模型(SDHMM),并用其进行语音识别实验,与经典隐马尔可夫模型相比,识别率有所提高。  相似文献   

20.
针对当前保密监管的技术现状,本文分析了当前保密信息监管的主要监管范围及其局限性,提出并论述了语音信息保密监管的必要性与重要性,同时对语音信息保密监管的核心技术——语音识别技术的基本原理进行了分析,对语音信息保密监管的具体方法及技术路线进行了讨论,选择基于大规模连续语音识别的方法作为语音信息保密监管的底层支撑技术,并在此基础之上提出一种基于置信度的语音信息保密监管匹配算法,通过同音词扩展的方法提升监管数据的召回率,通过类别置信度计算的方法提升召回监管数据的准确率,以实现在提升监管数据召回率的同时,更好的兼顾监管的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号