首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
吕钊  吴小培  李密 《振动与冲击》2011,30(2):238-242
为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,文章提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信号的短时谱减去所估计噪声的短时谱,最后根据去噪后语音信号的短时谱计算美尔倒谱系数(MFCC)作为特征参数。在仿真和真实环境下的语音识别实验中,本文所提出的语音特征参数相比较传统的MFCC其识别正确率分别提升了38.2%和35.8%。实验结果表明本文所提算法能够较好地解决卷积噪声环境下训练与识别特征不匹配的问题,有效提高了语音识别系统的识别正确率。  相似文献   

2.
从混合语音中提取出目标语者的基频轨迹,是语音监听、语音门禁、对话管理等应用的关键技术。为提高基频轨迹跟踪的准确率、增强抗八度误差的能力、降低系统复杂度,多基频估计以谐波乘积谱为核心,八度校正与基频分组均以元音段为基本单元,并结合了谐波显著度和语者音色特征。基于MIREX2005语音数据集的实验表明,MIREX的4种多基频估计性能指标均在75%以上,基频分组在混合语音中的判断准确率可达92%。  相似文献   

3.
孔德廷 《声学技术》2020,39(2):208-213
提出了一种基于对数谱估计的改进型语音增强算法。相对于传统语音增强算法,在语音信号存在不确定的条件下,利用软判决增益因子修正技术调正带噪语音信号的对数谱幅度,抑制背景噪声。引入的改进型先验信噪比估计和语音信号先验不存在概率估计方法,能够有效地估计得出语音信号的存在概率,进而求得语音信号存在时的谱增益因子函数,联合语音信号不存在时设定的增益因子函数加权求得谱增益函数。计算机仿真表明,即使在低信噪比条件下,输入背景噪声为高斯白噪声和粉红噪声等加性白噪声时,所提算法对噪声的抑制效果非常明显,且有效地克服了传统算法中引入的“音乐噪声”和语音信号畸变。  相似文献   

4.
彭坦  龚晨  李晔  洪侃  崔慧娟  唐昆 《高技术通讯》2008,18(5):452-457
为了提高在高误码率窄带无线信道下的合成语音质量,提出了一种信源信道联合编解码保护的语音编码抗误码算法。该算法在编码端利用编码后的冗余度进行BCH编码和奇偶校验以保护对语音合成质量影响较大的参数;在解码端对清浊音参数采用分支判决和改进的最大后验概率算法进行恢复,在浊音帧对线谱对(LSP)参数进行基于信源信道联合特性的线谱对参数差错后处理,在清音帧采用BCH解码和前向替代。该算法在不消耗任何额外带宽且无算法延时的条件下可以显著提高语音编码抗信道误码能力和恶劣信道条件下的合成语音质量。仿真实验显示,在较高信道误码率下平均谱失真降低了25%~36.1%,平均意见得分(MOS)提高了12.33%。  相似文献   

5.
基频是语音信号处理中的一个基本声学特征.传统的基频提取算法为了获得较好的检测效果,需要复杂的时频域计算.对于资源受限的应用条件,例如人工耳蜗等嵌入式实时系统,很难应用计算量大的基频提取算法.语音信号的基频具有短时平稳性,根据这个特点来确定基频候选值可以提高提取的准确性.据此,提出一种基于动态平滑的基频提取算法,使用此算法对汉语声调词库进行基频提取,并与另外两种基频提取算法进行比较.实验结果表明,新算法的基频绝对平均估计误差小于3Hz,优于另两种算法,能够准确地提取基频,同时算法计算量低,适合实时应用.  相似文献   

6.
针对传统小波-自相关算法在噪声环境下检测语音的基音周期会出现偏差和漏报的情况,提出一种经验模式分解下的小波-自相关的基音周期检测改进算法。该算法首先利用经验模式分解去除含噪语音趋势项并减噪,再利用改进的小波-自相关法突出每个基音周期的峰值点,提高了基音周期检测的精度。实验结果表明,该改进方法可有效改善加噪语音在基音提取上出现的偏差误报情况以及避免部分倍频和半频错误,提高基音周期检测速率及准确率。  相似文献   

7.
有效提取飞机舱音背景声下的语音信息对飞行事故调查十分重要。提出一种适用于飞机座舱噪声环境下的语音增强方法。以卡方分布作为纯语音谱幅值的先验模型,采用最小均方误差短时谱估计法对带噪语音中的纯语音谱进行估计,误差估计方程中采用权值函数对估计值进行非线性加权。在仿真试验中利用语音质量的客观评价标准选取适合于舱音背景声下的纯语音谱估计参数,使增强语音中噪声抑制和语音失真之间达到平衡。最后将提出的语音增强方法与目前典型方法进行了对比实验,验证算法的有效性。  相似文献   

8.
浊音端点检测在语音处理中占有重要地位,在语音编解码、语音识别、语音增强处理中都需要用到端点检测技术。常规的以短时能量、过零率等作为判决特征参数的方法无法在低信噪比的系统中满足应用需求。本文以信号的共振峰和基音周期检测为基础检测浊音端点,算法首先提取语音信号的第一共振峰以及基音周期信息并以此为判决依据判断浊音的起点和终点。实验证明,这种方法在噪声环境中相对于传统的基于能量检测的或AMR_WB标准中的端点检测算法有更高的正确率。  相似文献   

9.
利用短时过零率来检测清音,用短时能量来检测浊音,两者相配合便实现了信号信噪比较大情况下的端点检测。但是在信噪比较小的环境下,这两种方法便失去了作用。为了能在噪声环境下准确地检测出语音信号的端点,根据对含噪语音在时频域中的研究,提出了一种基于Matching pursuits时频分解算法的语音端点检测方法。该方法使用Matching pursuits算法对含噪信号进行分解,然后再对信号进行魏格纳变换,可以完全去除信号的魏格纳交叉干扰项,使得语音信号和噪声信号在时频平面上具有较直观明显的魏格纳能量分布,利用这个特点再进行端点检测,实验结果表明,该方法能在信噪比较低的情况下,准确地检测出语音信号的端点。  相似文献   

10.
端点检测技术是语音信号处理的关键技术之一,为提高低信噪比环境下端点检测的准确率和稳健性,提出了一种非平稳噪声抑制和调制域谱减结合功率归一化倒谱距离的端点检测算法。该算法首先通过抑制非平稳噪声再采用调制域谱减消除残余噪声来提升信噪比,减少语音失真。然后再提取每帧信号的功率归一化倒谱系数,计算每帧信号与背景噪声的功率归一化倒谱距离。最后将该倒谱距离作为检测参数,采用双门限判决方法进行端点检测。实验结果表明,该端点检测算法对语音帧和噪声帧具有较好的区分性。此外,在低信噪比环境下,所提出的算法对于不同类型的噪声都具有较好的稳健性。  相似文献   

11.
孙燕 《声学技术》2014,33(3):232-236
针对有色噪声,采用自适应神经网络模糊系统模糊(Auto Neural Fuzzy Inference System,ANFIS)逼近有色噪声,利用自适应神经模糊推理系统ANFIS对噪声的非线性动态特性进行建模,提出了语音自适应神经网络模糊小波消噪算法,建立并训练了消噪系统。对被有色噪声污染的测量信号经模糊消噪后,根据信号和噪声的小波系数在不同分解尺度上的传递性,进行中值滤波和小波重构,得到了干净的语音。对算法进行了仿真实验,结果表明,消噪效果明显。  相似文献   

12.
许铭  王冬霞  周城旭  张伟 《声学技术》2019,38(5):560-567
针对单通道非负矩阵分解语音增强算法忽略相位信息的问题,提出了一种改进的Kullback-Leibler复非负矩阵分解的语音增强算法。该算法考虑到传统非负矩阵分解算法在复频域中增强语音时目标函数的影响,构建了一种适用于复频域的Kullback-Leibler散度下的目标函数,同时采用频谱一致性约束相位谱补偿算法,使其重构出的语音数据相位谱得到进一步的调制。实验结果表明,对于不同的非平稳噪声,所提出的算法在不同信噪比下均取得了较好的语音增强效果,尤其在低信噪比条件下(0 dB以下)语音增强效果较为明显,性能评估指标的增量较高,较好地克服了由传统相位谱补偿算法造成的信源失真率较低的缺点,进一步减少失真,抑制背景噪声,实现语音增强。  相似文献   

13.
王科攀  高勇 《声学技术》2010,29(6):615-619
针对信号相位匹配算法能够在信号估计中准确提取信号频率成分的优点,将三子阵信号相位匹配算法应用于提取强背景噪声中的语音信号,同时提出了基于平均段内功率谱密度距离的语音质量客观评价方法,将主观平均意见分(MOS)、信噪比和平均分段功率谱密度距离作为指标,分别对三子阵信号相位匹配法、谱减法和最小均方误差估计法这三种算法的处理结果进行客观评价并对算法的降噪性能做了对比。仿真结果表明,三子阵相位匹配算法能够达到强背景噪声环境下语音降噪的目的;同时基于平均段内功率谱密度距离的语音质量客观评价结果与主观评价结果相符合,该评价方法具有一定的可行性。  相似文献   

14.
张倩  冯海泓  陈友元 《声学技术》2009,28(2):137-141
在房间声场环境下基于传声器阵列的说话人定位中,时延估计算法是其中的关键步骤。与其它常用时延估计方法相比,自适应特征值分解(Adaptive Eigenvalue Decomposition,AED)时延估计算法因其优越的抗混响性能受到越来越多的关注。但在受噪声和混响干扰的语音条件下,传统的自适应特征值分解算法收敛速度较慢,对初值敏感。通过引进动量因式,提出了一种变步长的特征值分解算法,通过理论分析和仿真实验,证实了新算法的收敛性能要优于传统的特征值分解算法,节省收敛时间,使算法的整体性能有所提高。  相似文献   

15.
沈彩凤  俞一彪 《声学技术》2013,32(4):305-311
提出一种新的连续语音的声调评测算法,该算法可应用于计算机辅助语言学习系统和普通话水平测试中的声调评测。考虑到连续语音声调受上下文之间的相互影响,采用三音节单元建立高斯混合模型(Gaussian Mixture Model, GMM),三音节中辅音部分用Spline插值法拟合声调曲线来反映音节间基音频率的转移信息,并利用Fujisaki模型去除语句的语调和说话人个性特征,只对基频曲线中的声调特征建模。实验结果显示,相比于传统方法,采用三音节Spline插值和Fujisaki改进特征的方法使得机器与人工打分的相似度在测试集中分别提高了8.75%和14.09%。  相似文献   

16.
毛维  曾庆宁  龙超 《声学技术》2018,37(3):253-260
针对复杂噪声环境下识别性能显著降低的问题,提出一种用于说话人识别系统前端的双微阵列语音增强算法。该算法采用的是相干滤波和频域宽带最小方差无畸变响应波束形成器后置结合改进的维纳滤波器。其基本原理是首先求出双微麦克风阵列信号中两个相邻通道间的相干函数,再利用通道间信号的相干性来进行初始噪声抑制。其次,通过一个频域宽带最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成器保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音质量。最后,使用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和伽马通滤波器组频率倒谱系数(Gammatone Filter-bank Frequency Cepstral Coefficients,GFCC)对增强后的语音信号做特征参数提取并进行说话人识别。仿真过程采用声学人工头模拟双耳采集数据,实验结果表明,该语音增强算法在复杂噪声环境下能够获得较好的增强效果,能有效提升说话人识别系统的识别率。  相似文献   

17.
基于信号能量累积序列的多传感器水声多目标关联   总被引:1,自引:1,他引:0       下载免费PDF全文
讨论利用接收水声信号的能量累积信息进行多传感器多目标数据关联,采用极性相关方法分析能量累积信息的变化特性,从而得到不同传感器间的多目标关联性检验准则。以声纳接收信号为对象的仿真实验表明,由所提方法计算的判别函数在同源目标和非同源目标间有明显的可分性,且在较低信噪比条件下,该方法仍可得到较好的关联效果。  相似文献   

18.
音乐信号分析中常数Q变换的性能研究   总被引:1,自引:0,他引:1  
丁志中  戴礼荣 《声学技术》2005,24(4):259-263
由于采用指数分布的频域采样点,常数Q变换(ConstantQTransform—CQT)在音乐信号的音调分析中有着独特的优点。但是常数Q变换的性能究竟如何,还需进行多方面的研究,以便能开发其潜力、完善其不足。对于两种CQT定义下的频率估计准确性问题进行了讨论,给出了频率估计误差的计算公式和给定音节频率分辨率下CQT窗函数长度应满足的关系;通过实验研究了CQT和DFT在多音阶频率检测时的性能以及窗函数对CQT性能的影响。通过和DFT的比较,可以看到CQT在某些方面具有比DFT更好的特性。对于CQT的一些局限性文中也作了简单的评述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号