首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
一种基于听觉模型的语音特征提取方法   总被引:2,自引:0,他引:2  
提出了一种基于听觉模型的语音特征提取方法,从信号的过零点获得频率信息,从振幅值和非线性压缩获得强度信息,并对这种方法进行了误差分析,证明其噪声的鲁棒性。  相似文献   

2.
本文提出了一个基于心理声学理论和实验的听觉感知模型,它模拟了人对声音响度的听觉感知特征。该模型可在数字信号处理器(DSP)或计算机上实现,模型的输出参数已被用于语音识别。实验表明,用该模型参数表示语音信号可在环境有噪声的情况下保持较高的识别率。  相似文献   

3.
提出了一种基于Bark子波变换和概率神经网络(PNN)的语音识别模型。利用符合人耳听觉特性的Bark滤波器组进行信号重构并提取语音特征,然后利用训练好的概率神经网络进行识别。通过训练大量语音样本来构成语音识别库,并建立综合识别系统。实验结果表明该方法与传统的LPCC/DTW和MFCC/DWT方法相比,识别率分别提高了14.9%和10.1%,达到了96.9%的识别率。  相似文献   

4.
针对多数语音识别系统在噪音环境下性能急剧下降的问题,提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过组合语音信号和其差分信号的上升过零率获得频率信息,通过峰值检测和非线性幅度加权来获取强度信息,二者组合在一起,得到输出语音特征,再分别用BP神经网络和HMM进行训练和识别。仿真实现了不同信噪比下不依赖人的50词的语音识别,给出了识别的结果,证明了组合差分信息的过零与峰值幅度特征具有较强的抗噪声性能。  相似文献   

5.
基于听觉模型的子波变换语音处理   总被引:2,自引:0,他引:2  
首先讨论了人类听觉信号处理的原理,进而将基于听觉模型的子波变换(WT)与短时傅里叶变换(STFT)进行了比较,突出了WT信号处理的独特之处。然后,简要讨论了其在语音处理中的应用。最后,给出了应用WT来进行声、韵母划分和音素周期检测的实验,其结果显示了WT在语音处理中的良好性能。  相似文献   

6.
基于听觉模型的特性,仿照MFCC参数提取过程,提出了一种基于Gammatone滤波器组的说话人语音特征提取方法。该方法用Gammatone滤波器组代替三角滤波器组求得倒谱系数,并且可以调整Gammatone滤波器组的通道数和带宽。将该方法所求得的特征在高斯混合模型识别系统中进行仿真实验,实验结果表明,该特征在一定情况下优于MFCC特征在系统的识别率,同时在Gammatone滤波器组通道数较高或滤波器带宽较小的情况下,系统具有较高的识别率。  相似文献   

7.
李晶皎  孙杰 《控制与决策》1998,13(6):665-668,699
提出了一种基于听觉与小波变换处理的汉语语音基音的方法,在对听觉系统描述的基础上,给出了人的听觉与小波变换的关系,选取适合汉语事音基频提取的小波函数,给出了基频提取的应用实例和基于FCM模糊聚类分析的汉语四声调值识别结果。  相似文献   

8.
介绍一种基于新型小波听觉滤波器组的语音识别特征提取方法。按照人耳听觉临界频带带宽设计一组新型小波带通滤波器组,并详细计算给出构建新型小波滤波器所需要的尺度参数。采用SDA9000串行信号分析仪进行频谱分析,使用型号为MIC3000 Compact PCI Industrial Computer的LSP设备进行FPGA硬件仿真,使用协同神经网络进行模式识别,建立基于Matlab GUI的仿真界面,与高斯小波滤波器组模型所得仿真结果进行对比,从功率谱图和识别结果上进行分析,证明新型小波滤波器组具有更优的识别率和抗噪性。  相似文献   

9.
论文针对小波变换和语音信号的特点,把小波变换和形态滤波法结合应用于语音信号基音周期的提取,并在此基础上把小波变换和说话人声道特征参数相结合,用于声道特征的提取。最后在以上研究的基础上设计了一种用于公安侦破和司法鉴定的语音监测系统。  相似文献   

10.
胡峰松  曹孝玉 《计算机工程》2012,38(21):168-170,174
目前主流说话人特征参数在噪声环境中的鲁棒性较差。为此,提出一种可用于说话人识别的听觉倒谱特征系数。分析人耳听觉模型的工作机理,采用Gammatone滤波器组代替传统的三角滤波器组模拟人耳耳蜗的听觉模型,用指数压缩代替固定的对数压缩,模拟人耳听觉模型处理信号的非线性特性。在基于高斯混合模型分类器的识别算法下进行仿真实验,结果表明,该听觉特征具有比梅尔频率倒谱系数和线性预测倒谱系数更好的抗噪声能力。  相似文献   

11.
特征提取是说话人识别系统中最关键的一个步骤.特征提取通俗的来说是提取代表说话人个性的语音特征.直接关乎识别系统的准确率.通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点.文章采用Mel频率倒谱域参数,是因为Mel频率尺度更加贴近入耳的听觉特性.Mel频率倒谱域参数不仅具有低频段高谱分辨率的优势,而且对噪声鲁棒能力很强.文章以声道模型和听觉模型为例,对比了LPC参数和MFCC参数分布.得出了MFCC不受全极点模型限制,对环境的适应性更强,且可降低不同人说话引起的差异度的影响.其参数性能优于LPC参数.  相似文献   

12.
A new efficient code for speech signals is proposed. To represent speech signals with minimum redundancy we use independent component analysis to adapt features (basis vectors) that efficiently encode the speech signals. The learned basis vectors are sparsely distributed and localized in both time and frequency. Time-frequency analysis of basis vectors shows the property similar with the critical bandwidth of human auditory system. Our results suggest that the obtained codes of speech signals are sparse and biologically plausible.  相似文献   

13.
文档特征提取是文本检索领域研究的最重要的问题之一。论文提出了一种全新的文档特征表示方式—语义模型。使用WordNet分析语义,提取主题句向量组用以确保文档含义的准确表达,再综合成文本向量保证特征表示的相关性。采用这种方式对文档作特征提取能在一定程度上同时提高文本检索的查全、查准率。理论分析与实验结果均表明论文的基于语义模型的文档特征提取方法是可行且有效的。  相似文献   

14.
为模拟基底膜对语音信号的分析,本文提出了一种类似小波变换的时频分析方法。该方法克服了SFT(短时Fourier变换)分析对高、低频段具有相同的时间分辨率和频率分辨率的缺点,弥补了小波变换只能粗糙地模拟基底膜带通滤波器特性的不足。在识别阶段,本文采用了多模糊状态综合处理的识别模式,该模式有利于对各频段统计特征参数的提取和加强。实验表明,该模型具有良好的鲁棒性,较好地模拟了人的听觉系统对语音的识别过程。  相似文献   

15.
腭裂语音高鼻音等级的自动识别能为临床腭咽功能评估提供有效、客观、无创的辅助依据。对腭裂语音高鼻音等级自动分类系统进行了研究,利用听觉模型提取语音信号的听觉内部表达,并结合同步检测器提取软限制比(Soft Limited Ratio,SLR)谱特征作为特征参数,利用一对一支持向量机(1-v-1 Support Vector Machine,1-v-1 SVM)实现腭裂语音高鼻音四类等级(正常、轻度、中度和重度)的自动划分。实验采用56名儿童的共3 086个语音样本,并对比了使用不同基底膜滤波器种类和个数,使用同步检测器和侧抑制网络对识别效果的影响。实验结果表明,使用基于等效矩阵带宽(Equivalent Rectangular Bandwidth,ERB)尺度的Gammatone滤波器的识别效果优于基于Bark尺度的小波包滤波器;54个通道的滤波器能有效权衡算法时间成本和识别正确率;使用同步检测器提取SLR谱特征的识别效果优于侧抑制网络提取的LIN(Lateral Inhibition Network)谱特征。腭裂语音高鼻音四类等级自动识别系统最高分类正确率达91.50%。  相似文献   

16.
如何对三维模型进行特征提取是近年来出现的三维模型检索中的主要问题.文章给出了一种基于视点距离的特征提取算法,该算法利用正规化后的三维模型表面到观察点的距离信息生成六幅距离图像,然后对图像进行二维傅立叶变换并对变换后的频域信息进行低频采样从而得到三维模型的特征向量.该算法克服了基于三维投影的二维图像轮廓算法中丢失模型空域信息、缺乏对图像内部信息进行描述的缺点.实验结果表明,该算法比基于轮廓算法的检索精确度提高了19%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号