共查询到18条相似文献,搜索用时 140 毫秒
1.
本文根据语音信号在离散余弦变换(discrete cosine transform,DCT)域上的近似稀疏性,将压缩感知(compressed sensing,CS)应用于语音增强。提出了一种基于压缩感知的语音增强新算法。算法采用对语音信号具有一定鲁棒性的行阶梯矩阵,对含噪语音进行压缩观测,通过改进的正交匹配追踪OMP(orthogonal matching pursuit,OMP)算法重构语音信号,最后用低通滤波器对重构语音进行平滑滤波,实现语音增强。实验结果表明:本文所提语音增强算法在提高输出信噪比的同时,减少了重构时间,具有较强的鲁棒性。 相似文献
2.
3.
利用离散余弦变换后的语音信号能量主要集中在低频段的特点以及语音信号的短时平稳性,研究三种基于一维离散余弦变换的语音压缩方案。Matlab仿真结果表明三种方案的数据压缩率高,重建语音信号具有艮好的清晰度和自然度。 相似文献
4.
传统变换域语音增强方法对语音做短时平稳性假设,这会造成对语音信号和噪声信号谱估计不准确,从而导致语音失真和残留噪声。本文提出一种从联合时频域进行语音增强的方法,该算法无需对语音做短时平稳假设。算法采用具有最佳能量聚集特性的高斯变换核函数,利用能快速实现的实值离散Gabor变换(RDGT)将语音信号变换到联合时频域,然后利用语音和噪声谱服从高斯分布的假设和无语音概率的思想进行基于最小均方误差的语音对数谱估计,采用改进的最小受控递归平均算法(IMCRA)进行噪声时频谱估计,在得到纯净语音的谱估计后利用实值离散Gabor逆变换获得纯净语音估计。实验表明,该算法相比频域变换算法具有较好的语音去噪度和较低的语音失真度。 相似文献
5.
本文提出了一种基于自适应重迭正交变换的音频信号编码算法,讨论了变换系数的量化及自比特分配问题。实验结果表明该方法的编码质量优于传统的离散余弦变换,没有分块效应,而计算量则相当。 相似文献
6.
基于三维离散余弦变换的鲁棒彩色图像水印算法 总被引:1,自引:0,他引:1
针对常见的彩色图像水印算法仅在亮度分量或在每一分量嵌入水印,致透明性和鲁棒性不能达到权衡的问题,提出了一种新颖的基于三维离散余弦变换的RGB彩色图像水印算法。为增强水印的安全性,先对水印图像进行异或加密和Arnold置乱处理;其次对彩色图像进行互不重叠的分块处理,并对每一分块进行三维离散余弦变换;最后对每一分块三维离散余弦变换后的第一个系数采用量化的嵌入方法嵌入水印信号。实验表明,提出的算法具有较好的透明性和鲁棒性,对彩色图像的版权保护应用具有一定的应用价值。 相似文献
7.
8.
该文针对低信噪比噪声环境下的声音事件检测问题,提出基于多频带能量分布图离散余弦变换的声音事件检测的方法。首先,将声音数据转化为gammatone频谱,并计算其多频带能量分布;接着,对多频带能量分布图进行8×8分块与离散余弦变换;然后,对8×8的离散余弦变换系数进行Zigzag扫描,抽取离散余弦变换系数的主要系数作为声音事件的特征;最后,利用随机森林分类器对特征建模与检测。实验结果表明,在低信噪比及各种噪声环境下,该文提出的方法具有良好的检测效果。 相似文献
9.
基于多元Laplace语音模型的语音增强算法 总被引:1,自引:0,他引:1
传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT)系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于该分布模型的语音存在概率,对最小均方误差估计子进行修正。实验结果表明,该算法在抑制背景噪声和减少语音失真等方面优于传统的语音增强方法。 相似文献
10.
11.
12.
在小波阈值语音增强算法中,阈值函数是一个重要的部分,其直接决定着语音增强效果的好坏,但现存的阈值函数存在着不连续、计算复杂、不同分解层函数形式固定等问题。为了解决上述问题,本文提出了一种可根据小波分解尺度自适应调整,同时具有调整参数的改进连续阈值函数。该阈值函数在小波域对带噪语音信号的小波系数进行处理,通过遗传算法获取最优解,重构处理后的最优小波系数得到增强的语音信号。本文在仿真与真实环境下进行了实验,改进的阈值函数较传统的阈值函数在信噪比、均方误差以及语音信号主观评价三个方面均得到了提升。实验结果表明,改进小波阈值函数的语音增强算法能有效提升语音信号的可懂度和整体质量。 相似文献
13.
14.
15.
语音端点检测是语音信号预处理过程中的一个重要环节,而在实际的噪声环境下,一些传统的端点检测方法已经不适用,为了提高在强背景噪声条件下语音端点检测的性能,提出了一种在DCT变换域下,基于Gaussian-Gamma模型的语音端点检测算法,设定其纯净语音信号的统计分布函数为Gamma分布,其相应参数使用了最大似然估计以及预测估计的方法.该算法具有较高的准确性和稳健性.仿真实验表明,该方法鲁棒性较好,在较低的信噪比下仍能比较准确的检测到语音信号的端点. 相似文献
16.
本文提出了一种新的基于Laplacian语音模型的语音增强算法。首先,在假定语音和噪声的短时DCT系数分别服从Laplacian和Gaussian分布的基础上,推导了最小均方误差意义下的语音信号短时DCT系数估计;然后,根据语音存在概率估计,提出了语音信号短时DCT系数估计的修正因子。在增强算法中,提出了面向判决的Laplacian语音模型参数估计和基于Laplacian语音模型的改进最小量控制递归平均(IMCRA)噪声估计算法。仿真结果表明,本文算法不仅在噪声抑制性能方面优于近两年国际上提出的几种基于Gaussian语音模型的语音增强算法,而且在增强语音质量方面也具有更好的性能。 相似文献
17.
谱减法是常用的单通道语音降噪方法,传统谱减法在抑制背景噪声的同时引入了“音乐噪声”,影响听觉效果。为了抑制音乐噪声,提出了一种基于后验信噪比的频域语音增强新方法,当后验信噪比较高时,采用基于后验信噪比的谱减法增强语音信号;当后验信噪比较低时,采用基于后验信噪比的谱衰减方法对含噪语音信号谱线进行衰减,达到语音增强的目的。仿真结果表明,基于后验信噪比的频域语音增强法具有较好的背景噪声和音乐噪声抑制效果,并保持了较好语音可懂度。 相似文献
18.
Speech enhancement using an MMSE short time DCT coefficients estimator with supergaussian speech modeling 总被引:1,自引:0,他引:1
Zou Xia Zhang Xiongwei 《电子科学学刊(英文版)》2007,24(3):332-337
In this paper, two speech enhancement systems with supergaussian speech modeling are presented. The clean speech components are estimated by Minimum-Mean-Square-Error (MMSE) estimator under the assumption that the DCT coefficients of clean speech are modeled by a Laplacian or a Gamma distribution and the DCT coefficients of the noise are Gaussian distributed. Then, MMSE estimators under speech presence uncertainty are derived. Furthermore, the proper estimators of the speech statistical parameters are proposed. The speech Laplacian factor is estimated by a new decision-directed method. The simulation results show that the proposed algorithm yields less residual noise and better speech quality than the Gaussian based speech enhancement algorithms proposed in recent years. 相似文献