共查询到20条相似文献,搜索用时 78 毫秒
1.
提出了一种结合Mellin变换和Mel频率分析的语音信号特征--MMCC特征.该特征利用Mellin变换的尺度不变性质,抑制了特征参数受不同说话人声道变化的影响,同时结合Mel频率的人耳听觉特性,改善了特征的鲁棒性,适合于非特定人识别系统的应用.仿真结果表明,采用MMCC特征的非特定人语音识别系统,其识别效果优于采用LPCC特征、MFCC特征和MMTLS特征的非特定人语音识别系统. 相似文献
2.
3.
针对线性预测方法提取语音信号共振峰频率的不足,提出了一种基于共振峰增强的共振峰频率估计算法,从而在不增加运算量的情况下使共振峰频率的提取更加准确.实验结果表明,该算法在5kHz内提取前五个共振峰的性能都很好. 相似文献
4.
一种基于听觉模型的语音特征提取方法 总被引:2,自引:0,他引:2
提出了一种基于听觉模型的语音特征提取方法,从信号的过零点获得频率信息,从振幅值和非线性压缩获得强度信息,并对这种方法进行了误差分析,证明其噪声的鲁棒性。 相似文献
5.
运用Walsh变换对语音信号进行分析,得到了语音信号的Walsh域特征——2D自由度功率谱特征。利用此特征采用神经元网络法对汉语数字音0~9进行不定人语音识别,结果表明,该特征不仅能给出足够的识别信息,而且由于Walsh变换只有加/减运算,因而在识别速度方面比常用的频域特征有明显提高。 相似文献
6.
7.
基于小波变换的鲁棒性语音特征提取新方法 总被引:3,自引:0,他引:3
提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降。为了能得到无噪音的语音识别特性,让语音识别系统在含噪的环境下获得令人满意的工作性能,根据人听觉特性提出了一种鲁棒语音特征提取方法。将小波变换和MFCC算法相结合,在MFCC的前端用小波包变换代替FFT和Mel滤波器组,同时在后端用临界小波变换代替DCT,最后得到鲁棒语音特征。通过实验结果分析表明,将方法用于抗噪声分析可以提高系统的抗噪声能力;同时特征的处理方法对不同噪声有很好的适应性。 相似文献
8.
针对语音信号的非平稳特性,传统的应用短时分析技术容易丢失信息的现状,提出了一种利用小波包变换的技术对语音信号的共振峰特征(FDWPT)进行提取的方法。对整个语音信号进行多分辨分析的小波包变换,这样可以得到每个频带的小波分解值,结合共振峰的频率特性,选取适当的小波包分解结点,对这些结点建立共振峰参数,使用矢量量化模型进行识别,从而提高了说话人识别的效果。 相似文献
9.
10.
耳语音是噪声源激励,与正常音相比,其共振峰位置发生了偏移,带宽增宽。故采用传统的线性预测法提取耳语音共振峰时存在虚假峰问题。通过分析功率谱,提出了一种改进算法。根据极点功率不变的原则,利用极点交互因子修正共振峰的带宽,从而准确地提取出耳语音的共振峰。对汉语普通话单元音音素仿真实验的结果证明了该算法的有效性。 相似文献
11.
12.
在多源信息融合中,小波多分辨率分析是一种最常用的方法.这里提出在小波多分辨率分析下,利用K-L变换的融合方法.首先利用小波变换对序列图像进行多分辨率分解,对相应的小波系数矩阵进行K-L变换,计算出小波系数权重.按照所得的权重融合小波系数,最后将小波融合系数逆变换实现图像的融合处理.实验结果证实这种方法有效的利用了图像的相关性,主观视觉效果分析和客观统计参数评价分析都表明,新方法的性能优于直接对小波系数进行平均的融合方法. 相似文献
13.
提出了一种基于小波变换的块大小可变的多分辨率运动估计方法(VBMRME),以减少图象间的时间冗余。首先估计最高层子图象的运动矢量,低层子图象的运动矢量由高层子图象的运动矢量经细化导出,子图象内每一块的大小随小波分解层数而变化,这能大幅度地减少搜索和匹配时间。 相似文献
14.
自相关函数法、平均幅度差函数法及小波变换法是经典的基音检测方法,本文简要分析了单独使用它们进行基音检测时存在的不足,提出了一种基于小波变换的加权自相关的检测方法。将多级小波变换的近似分量加权求和以突出基音信息,采用改进的平均幅度差函数加权自相关函数的方法以突出真实基音周期处的峰值,提高基音检测的正确率。实验表明,与传统的自相关函数法和平均幅度差函数法相比,本文方法减少了倍频和半频错误,提高了基音检测的精度,在信噪比为-5dB时仍能得到较准确的结果。 相似文献
15.
图像感知哈希技术是一门较新型的技术,哈希提取过程的关键步骤是特征提取,传统的基于DCT变换的感知哈希技术抗几何攻击能力较差。试图在图像生成哈希之前,将几何形变对图像的影响去除,首先将图像进行正则化,使图像具有几何不变性,然后再进行DCT特征系数提取,最后通过量化、编码生成最终哈希。该算法可以抵抗任意的仿射变换。 相似文献
16.
本文提出一种基于变换特征和分层模型的静态手势检测方法,所采用的分层模型由一系列手势表观模型和一个总的判别模型构成,其中每个手势表观模型各包含一个通用模板和一系列子类模板。将这些模板作为转移函数,可以从原始的梯度方向直方图特征中得到一组新的特征表示,即变换特征。将此变换特征用于构造分层模型中的判别模型,可以实现背景与手势以及不同手势间的精确分类。为了提高检测速度,算法在初始阶段引入了肤色滤波器方法,用于排除大部分的非肤色区域。实验表明,所述算法能够有效处理视角变换、手势倾斜、自然形变等因素带来的手势表观波动,处理速度可达20帧/秒以上,在鲁棒性和计算效率方面均体现了明显的优势。 相似文献
17.
基于分段线性频谱弯折函数的说话人归一化方法 总被引:1,自引:0,他引:1
在传统的声道长度归一化方法中 ,基于声道无损级联短管模型假设 ,用一个简单的声道因子来确定频谱弯折函数 ,无法描述出不同说话人的频谱差异的细节 .针对这一缺陷 ,提出用细致的分段线性频谱弯折函数来描述说话人差异 ,在适当的频谱分段下 ,较好地完成了频谱对齐的任务 .此外 ,由于利用了与模型无关的频谱弯折函数 ,该方法被证明是一种快速的、尤其适用于无监督模式的说话人鲁棒性方法 相似文献
18.
19.
脊波变换是一种源于小波又高于小波的多尺度几何分析方法,应用于图像中.借鉴小波去噪的思想提出一种新的图像去噪方法,采用基于Bayesian估计的自适应阈值和半软阈值技术进行去噪,针对脊渡变换所产生的轻微的"划痕",引入平移不变的方法消除这种条纹干扰.实验结果表明,该方法较好地处理了图像细节和边沿保留与噪声抑制的矛盾,是一种有效的去噪方法. 相似文献
20.
由于传统的模板相关匹配算法在目标图像发生较大旋转和放大时,定位结果可能会发生偏差,因此为了取得精度更高的目标识别结果,提出了一种基于对数极坐标变换粗匹配,结合仿射变换精匹配的目标图像识别定位方法,以用于在视场中自动搜索相对于模板图像有平移、旋转和尺度变化的目标图像。实验结果表明,该算法不仅定位精度高,而且相对于传统的模板匹配算法有更强的鲁棒性。 相似文献