首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
提出了一种基于听觉掩蔽效应的语音增强算法。算法对含噪语音的增强包括谱减法语音增强和感知加权语音增强两个步骤,分别从客观和主观两方面来提高含噪语音的质量。在谱减法阶段考虑了语音和噪声谱的交叉项,有效地减少了增强语音中的残余噪声;在感知加权处理中充分利用了人耳的掩蔽效应,设计了感知加权滤波器,对谱减法增强后的语音进行滤波,进一步消除残余噪声。对算法进行了数值实验,实验结果表明该算法能有效提高含噪语音的质量,比传统的谱减法有较大改进。  相似文献   

2.
谢斌  任克强  钟文涛 《通信技术》2009,42(3):183-185
基于听觉掩蔽效应,提出了一种在WAV格式音频信号中嵌入WAV格式音频水印的离散小波变换域高效水印算法,用Matlab7.0编程进行了水印的嵌入、提取及防盗版性能研究。仿真实验表明,该算法嵌入的音频水印具有较好的不可感知性和较强的抗版权篡夺能力,并且对诸如重新采样、低通滤波和叠加噪声等攻击具有较好的鲁棒性。  相似文献   

3.
《信息技术》2015,(5):20-22
基于人耳听觉模型的MFCC参数具有很好的抗噪性,但是其在中高频区域计算精度不足。针对朱鹮鸣声频带较宽、总体频率范围较广的特点,在提取MFCC特征参数时先对幅度谱进行平滑,然后采用IMFCC,Mid MFCC,MFCC相结合的算法,对朱鹮鸣声进行特征提取,以提高在中高频区域中的识别精度。实验结果表明取得了较好的效果。  相似文献   

4.
潘杨  孟子厚 《电声技术》2011,35(2):42-44,48
在视听交互条件下,对听觉掩蔽与视听注意属性之间的关系进行分析与讨论.设视觉、听觉注意属性是影响听觉掩蔽的两个因素,试验采用二因素析因设计.试验结果显示,听觉掩蔽周值只受听觉注意属性的明显影响;听觉判断反应时问则同时受到视觉、听觉注意属性的显著影响,其中反应时间的最大增幅达到100%.  相似文献   

5.
视觉任务对听觉掩蔽效应影响的实验分析   总被引:1,自引:1,他引:1  
张晓璐  潘杨  谢凌云 《电声技术》2010,34(9):43-45,60
视觉和听觉的交互作用是重要的感知心理现象,视觉和听觉同时做感知任务,可能会相互影响。在听觉掩蔽效应实验中,如果同时有视觉任务,听觉掩蔽效应可能会发生变化。变化的听觉掩蔽效应在应用中又可能对视频感知造成影响。设计了3组不同的视觉任务来观察这个问题,要求被试同时完成视觉和听觉系统给予的感知任务。结果发现,同时进行视觉任务,听觉掩蔽效应受到影响,并且视觉任务与听觉感知对象的相关性也表现出干扰效果。  相似文献   

6.
一种基于信号子空间和听觉掩蔽效应的语音增强方法   总被引:5,自引:0,他引:5  
徐望  丁琦  王炳锡 《电声技术》2003,(12):41-44
采用子空间分解法对噪声语音进行信号增强,并用基于Johnston听觉掩蔽模型的感知滤波器对增强后的信号频谱进行平滑以抑制背景音乐噪声。几种噪声背景下对增强语音的客观测试表明,与传统的信号子空间分解法相比,基于信号子空间和听觉掩蔽效应的方法可有效地减少语音信号的失真度。  相似文献   

7.
慢特征分析(SFA)算法是一种基于慢度原则、无人监管的高效算法,其核心思想是从复杂多变的混合信号中提取出其中所隐含的缓慢变化成分.声呐接收到的信号,通常都是用Mel频率倒谱系数算法做特征提取,而对于声呐浮标等需要使用无线通信方式传输目标信号的情况,由于信号在传播过程中受信道影响而产生一定的误码率,使得传统的MFCC方法的特征提取性能下降.在传统MFCC的基础上,提出了一种新的算法——基于SFA的改进MFCC特征提取算法.实验数据分析证明,基于SFA的改进MFCC特征性能较传统的基于离散余弦变换(DCT)的MFCC特征性能有明显的提高,从而证实了所提算法的有效性和实用性.  相似文献   

8.
基于听觉掩蔽效应的小波包语音增强   总被引:1,自引:0,他引:1  
冯流保 《通信技术》2010,43(3):139-141
在分析传统阈值函数小波去噪方法的基础上,提出一种根据人耳掩蔽效应设计的阈值函数去噪方法。该方法利用小波包的多分辨率的优点,把语音分解到反映人耳听觉特性的小波子带中,再使用根据人耳听觉掩蔽原理设计的噪声掩蔽阈值函数对带噪的小波系数进行处理,最后反变换得到增强语音。仿真实验表明:输出的信噪比与听觉评测(PESQ)均取得较好结果。  相似文献   

9.
阚仁根  于凤芹 《电声技术》2008,32(2):55-57,66
谱减法在增强语音、提高信噪比的同时,残留的音乐噪声较大.在利用听觉掩蔽闻值对谱减系数进行修正的基础上,采用实时噪声估计来减少谱减法噪声估计误差,并对谱减后的语音信号进行感知滤波来进一步抑制残留音乐噪声.实验结果表明,该算法能去除噪声,增强语音,并在不影响信噪比的同时降低语音失真测度值.主观测听表明语音音质有明显提高.  相似文献   

10.
针对低信噪比下非平稳噪声环境情况,几何谱减算法产生较大的语音畸变的缺点,提出了一种结合听觉掩蔽效应的改进算法,该算法通过对噪声的实时估计,同时结合听觉掩蔽效应设计一个感知滤波器,对增强后的信号频谱进行滤波以抑制背景噪声,从而将残留噪声强度控制在掩蔽阈值之下.通过计算PESQ、oSNR、语谱图及时域仿真波形图分析及主观试听表明:改进的几何谱减算法不仅提高了语音信号的信噪比,而且残留噪声和语音畸变较小,提高了语音的可懂度.  相似文献   

11.
将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFcc特征参数在较大词汇量情况下,其识别率优于MFCC特征参数的结果。  相似文献   

12.
高谦  张国杰  张树才 《通信技术》2008,41(6):153-154
为了实现高速语音特征参数的提取,在分析了美尔频率倒谱特征参数提取算法的基础上,提出了算法的硬件设计方案,介绍了各模块的设计原理.该方案增加了语音激活检测功能,可对语音信号中的噪音帧进行检测,提高了特征参数的可靠性.最后将设计实现于Stratix Ⅱ系列FPGA上,仿真结果表明设计可以实现高速,高精度的MFCC特征参数提取.  相似文献   

13.
舒倩  李银国 《通信技术》2007,40(11):374-375,378
MFCC是语音识别中常用的特征参数,根据MFCC分量对语音端点的敏感性,提出利用平常舍去的识别特征参数分量MFCC0作为语音端点检测的参量.接着根据MFCC0的特性设计了一种新的端点检测方法,该方法简单且无需增加额外的计算量.实验结果表明,基于该方法的语音识别系统不仅可以通过端点检测大大压缩数据量,而且提高了系统的识别率.  相似文献   

14.
通过对Bark频带和Mel频标之间关系的研究,得到一个BarkMel临界带表,在此基础上详细介绍了一种基于人耳听觉掩蔽特性的MFCC计算方法.实验表明,该方法可使掩蔽特性在MFCC参数提取中达到最优化,提高识别率,具有一定的鲁棒性.  相似文献   

15.
基于MFCC参数的说话人特征提取算法的改进   总被引:3,自引:0,他引:3  
张晶  范明  冯文全  董金明 《电声技术》2009,33(9):61-64,69
在说话人识别系统中,特征参数的提取对语音训练和识别有着重要的影响。对于特征参数提取模块,提出了一种新的特征参数提取算法MFCC_E(Efficient MFCC)。相对于标准算法MFCC_S(StandardMFCC),MFCC_E在特征提取模块部分减少了53%的计算量。最终实验结果说明MFCC_E的识别率为90.3%,仅比标准MFCC算法92.0%的识别率降低1.7%。因为MFCC_E算法的这种特点,使其能够更有效的适用于硬件实现。  相似文献   

16.
将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFCC特征参数在噪声环境和较大词汇量情况下,其抗噪性和识别率均优于MFCC特征参数的结果。  相似文献   

17.
基于小波包变换和MFCC的说话人识别特征参数   总被引:1,自引:0,他引:1  
陈静  张飞云 《电声技术》2009,33(2):49-51
研究了小波包变换及MFCC参数的提取,结合二者特点,提取了基于小波包变换和MFCC的新参数DWT-MFCC.并在基于16阶GMM系统上进行说话人识别实验。实验结果表明,相对于传统的MFCC参数,在相同的噪声环境下,DWT—MFCC参数具有更高的说话人识别率。  相似文献   

18.
但志平  刘勇  田卫新  胡刚 《电声技术》2007,31(5):60-62,77
讨论了以二次等式约束条件为基础的一种改进的向量机即最小二乘向量机(LSSVM)算法,用其对话者进行识别,并与传统的支持向量机(SVM)进行了识别比较。实验中,采用美尔倒谱系数(MFCC)作为话者语音特征参数。实验表明,基于LSSVM的话者识别比传统的SVM话者识别计算复杂度小,训练时间短,效率更高;同时,识别率也有一定的提高,对话者识别有很强的适应性。  相似文献   

19.
Endpoint detection is one of the most important steps in speech recognition. In a high SNR environment, the algorithm based on short-time energy and zero rate could be used. But when the SNR is low, this method may not be accurate. Some researchers proposed an algorithm which is based on MFCC Euclidean distance. It has a better performance in a noise environment. But that algorithm needs two thresholds to find the start and end point. However, when the values of two thresholds are not suitable, the detected result could be extremely bad. In this paper, we proposed an improved algorithm which is based on MFCC cosine value. This method can reduce errors, since it only needs one single threshold. The benefit of this improved algorithm is that the result can surely contain the real voice component. According to the experiment data, this improved algorithm can improve the speech recognition rate by 10% even in noise environment (SNR = 0). Thus, it proved that this improved methods has better robustness.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号