共查询到17条相似文献,搜索用时 218 毫秒
1.
针对复杂噪声环境下识别性能显著降低的问题,提出一种用于说话人识别系统前端的双微阵列语音增强算法。该算法采用的是相干滤波和频域宽带最小方差无畸变响应波束形成器后置结合改进的维纳滤波器。其基本原理是首先求出双微麦克风阵列信号中两个相邻通道间的相干函数,再利用通道间信号的相干性来进行初始噪声抑制。其次,通过一个频域宽带最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成器保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音质量。最后,使用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和伽马通滤波器组频率倒谱系数(Gammatone Filter-bank Frequency Cepstral Coefficients,GFCC)对增强后的语音信号做特征参数提取并进行说话人识别。仿真过程采用声学人工头模拟双耳采集数据,实验结果表明,该语音增强算法在复杂噪声环境下能够获得较好的增强效果,能有效提升说话人识别系统的识别率。 相似文献
2.
深入研究了基于多通道信号子空间的语音增强算法原理,对算法中各个参数对性能的影响进行了深入剖析.同时给出一种选取噪声方差的简单且有效的方法,并通过研究分析,证明多通道信号子空间算法不仅消噪明显而且对语音的损伤微小,而且相比于单通道子空间语音增强算法除了性能上的提升外,还没有导致计算量的增加。最后将多通道子空间语音增强算法用于说话人识别系统.并与其它多通道语音增强算法(延迟求和波束形成、波束形成后维纳滤波、线性约束最小方差波束形成)进行了对比.实验表明多通道信号子空间语音增强算法在多种噪声环境下均可有效的提高说话人识别系统的识别性能。 相似文献
3.
利用短时过零率来检测清音,用短时能量来检测浊音,两者相配合便实现了信号信噪比较大情况下的端点检测。但是在信噪比较小的环境下,这两种方法便失去了作用。为了能在噪声环境下准确地检测出语音信号的端点,根据对含噪语音在时频域中的研究,提出了一种基于Matching pursuits时频分解算法的语音端点检测方法。该方法使用Matching pursuits算法对含噪信号进行分解,然后再对信号进行魏格纳变换,可以完全去除信号的魏格纳交叉干扰项,使得语音信号和噪声信号在时频平面上具有较直观明显的魏格纳能量分布,利用这个特点再进行端点检测,实验结果表明,该方法能在信噪比较低的情况下,准确地检测出语音信号的端点。 相似文献
4.
5.
为了克服噪声对语音识别系统的影响,提出了一种基于主曲线的说话人自适应方法,这种方法可以通过一组主曲线描述所有状态的特征统计信息和码本参数之间的关系,并利用特征统计量在主曲线上的投影更新码本.当有背景噪声存在时,这种方法可以有效修正状态的特征统计信息以减弱或去掉噪声的影响.在863大词汇量连续语音识别数据库上的实验结果证明:这种方法相对于基线以及本征音说话人自适应算法,系统识别性能都有明显的提高. 相似文献
6.
针对噪声环境下说话人识别率较低的问题,提出一种基于正规化线性预测功率谱的说话人识别特征。首先对语音信号线性预测分析和正规化处理求出语音频谱包络,然后通过伽马通滤波器组得到对数子带能量,最后对特征参数进行离散余弦变换,得到了一种说话人识别特征正规化线性预测伽马通滤波器倒谱系数(Regularized Linear Prediction Gammatone Filter Cepstral Coefficient,RLP-GFCC)。仿真结果表明,在噪声环境说话人辨认试验中,相比传统特征美尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)和伽马通滤波器倒谱系数(Gammatone Filter Cepstral Coefficient,GFCC)的系统识别率得到了明显提高,对噪声环境的鲁棒性得到了增强。 相似文献
7.
噪声谱估计是单通道语音增强算法的关键步骤,当前大部分语音增强算法旨在提高语音质量,提高语音可懂度的算法却很少。在传统的单通道语音增强算法中,语音质量的提高往往是以牺牲语音的可懂度为代价的。对目前主流的几种噪声谱估计算法对语音可懂度影响进行分析。在不同噪声背景、不同信噪比情况下进行噪声谱估计,并采用谱减法对含噪语音信号作去噪处理,对比分析不同噪声、不同信噪比下增强前后语音的短时客观可懂度(Short-Time Objective Intelligibility,STOI)值,最后根据信噪比,对比分析了不同噪声环境下,语音增强前后语音能量高于噪声能量的时频块所占比例。实验表明,相比其他噪声估计算法,最小统计(Minima Statistics,MS)算法由于保留了更多的以语音能量为主的时频块,使得去噪后的语音有较高的可懂度。 相似文献
8.
由于矿山环境的复杂性、监测传感器的误差和磁场的干扰,实测爆破振动信号不可避免地包含大量高频噪声。为有效去除噪声成分,引入相关均方根误差获得了具有自适应能力的CEEMD算法,对矿山爆破振动信号进行精细化分解,得到频率由大到小排列的固有模态函数(IMF),对各IMF进行MPE随机性检测,将MPE值大于0.6的IMF成分去除,以达到去噪目的。将自适应CEEMD-MPE算法应用于矿山爆破振动信号去噪处理,研究结果表明:该算法具有较好的保真度和去噪效果,有效地去除了信号所含高频噪声成分,同时对真实振动信息影响较小。对比分析表明自适应CEEMD-MPE算法优于EMD-MPE和EEMD-MPE算法,验证了该算法的有效性。 相似文献
9.
10.
利用希尔伯特.黄变换(Hilbert-Huang Transform,HHT)对情感语音进行处理,得到其边际谱,然后对比分析四种情感即高兴、生气、厌恶、无情感语音信号边际谱的特征,提出四个特征量:子带能量(SE)、子带能量的一阶差分(DSE)、子带能量倒谱系数(SECC)、子带能量倒谱系数的一阶差分(DSECC)用于情感识别。用它们作说话人无关,文本无关的语音情感识别,得到最高90%的识别率,比基于傅立叶变换的梅尔频率倒谱系数(MFCC)高22个百分点。实验结果表明,基于HHT边际谱的特征能够较好地反映语音信号中的情感信息。 相似文献
11.
船舶辐射噪声的包络谱中蕴含着轴频和桨叶数等船舶固有特征信息,对船舶目标识别具有重要意义。为了提高船舶辐射噪声包络谱解调性能,提出了基于变分模态分解(Variational Mode Decomposition, VMD)和窄带包络相关的改进DEMON分析方法。首先利用VMD算法代替传统带通滤波器,将船舶辐射噪声信号分解为若干个子带;然后对各子带进行希尔伯特(Hilbert)检波并计算平均窄带包络相关系数,用于衡量信号的包络调制在频域上的非均匀性;最后提取各子带信号包络谱并按照平均窄带包络相关系数进行加权融合,从而得出宽带噪声信号的包络谱。利用该方法对实测不同类型和不同航速船舶辐射噪声信号进行了处理,结果均表明所提方法能有效提高包络谱解调效果,较传统方法更为有效。 相似文献
12.
针对噪声环境下语音识别率急剧下降的问题,提出了一种基于语音时频域稀疏性原理的改进最小方差无畸变响应波束形成与改进维纳滤波结合的算法。该算法首先利用麦克风阵列语音信号的空间信息,通过基于时频掩蔽的改进最小方差无畸变响应波束形成器,增强目标声源方向的语音信号,抑制其他方向噪声的干扰,然后再使用改进的维纳滤波器去除残留噪声并提高语音可懂度,对增强后的语音信号提取梅尔频率倒谱系数作为特征参数,使用隐马尔可夫模型搭建语音识别系统。实验结果表明,该方法能够有效提高低信噪比环境下的语音识别率,具有较好的鲁棒性。 相似文献
13.
为有效剔除噪声,提高信噪比,提出一种基于双自适应的噪声抵消算法,包括自适应子带分解算法和自适应噪声抵消算法两部分。采用子带分解与噪声功率谱密度匹配的方法来对信号进行非均匀子带分解,根据噪声在子带中的分布进行有效滤波,对低噪或基本上无噪的子带不滤波,而对其它子带采用自适应滤波的算法。仿真对比表明,与传统的均匀子带自适应噪声抵消相比,计算量大大减小,其滤波效果也得到一定的改善。 相似文献
14.
15.
针对有色噪声,采用自适应神经网络模糊系统模糊(Auto Neural Fuzzy Inference System,ANFIS)逼近有色噪声,利用自适应神经模糊推理系统ANFIS对噪声的非线性动态特性进行建模,提出了语音自适应神经网络模糊小波消噪算法,建立并训练了消噪系统。对被有色噪声污染的测量信号经模糊消噪后,根据信号和噪声的小波系数在不同分解尺度上的传递性,进行中值滤波和小波重构,得到了干净的语音。对算法进行了仿真实验,结果表明,消噪效果明显。 相似文献
16.
爆破振动信号是典型的短时非平稳随机信号。应用多分辨率特点的小波包变换对爆破振动信号进行多层分解,得到信号能量分布的细节信息。根据建立在概率统计基础上的信息熵概念,推导得到爆破振动信号能量熵计算方法。分析了4种类型爆破振动信号的能量熵,熵值由大到小为:隧道爆破、管道爆炸、台阶爆破、塌落振动。结果表明,能量熵能够反映不同类型爆破对振动信号的影响。提出将能量熵作为爆破振动信号的新特征量,为爆破振动信号特征提取、不同爆破类型振动信号识别和爆破振动预测提供一种新思路。 相似文献