首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
传统的FFT谱分析会产生比较严重的频谱泄漏,应用到语音增强中就会产生严重的音乐噪声.因此使用更加准确的频谱分析将会对整个语音增强系统有很大的改进.将全相位FFT谱分析与最优改进对数谱幅度(OM-LSA)语音估计器结合,提出了新型最优改进对数全相位谱幅度(OM-LapSA)语音估计器,给出了新型语音估计器的流程框图.实验仿真表明,提出的语音估计器增强算法在抑制音乐噪声、提高信噪比和减少语音失真方面要优于传统OM-LSA语音估计器增强算法.  相似文献   

2.
针对基于FFT系数实部的频率插值算法在峰值谱线相位接近于±π/2时频率估计误差较大的问题,提出了一种改进的正弦信号频率估计算法。该算法首先利用FFT系数的实部和虚部序列索引出峰值谱线位置,然后根据峰值谱线的相位,选取实部与虚部序列中幅度较大的序列进行频率插值。仿真结果表明:在信噪比为3 dB、采样点为128的情况下,整个频段上归一化频率估计误差均方根小于0.02,接近Cramer Rao下限,整体性能优于基于FFT系数实部的频率插值算法和Rife算法。改进的算法频率估计精度高,计算量小,易于硬件实现。  相似文献   

3.
米波雷达在探测低空目标时存在严重的多径效应,直达波和反射波相当于距离较近的两个强相干点源,目标回波信号协方差矩阵存在噪声子空间与信号子空间相互渗透的问题,经典的超分辨物理算法仰角估计精度会急剧变差。为解决上述问题,文中基于米波雷达经典镜像多径反射模型,利用深度神经网络和全连接网络构造了一个深度学习网络用于低仰角目标波达方向(DOA)估计,将子空间相互渗透的原始协方差矩阵数据实部、虚部及相位特征作为深度学习网络输入,利用智能学习方法解决了多径反射条件下DOA估计问题。相比于基于子空间分解或信号拟合类的超分辨估计方法,文中所提方法仰角估计精度更高且计算量更小。仿真实验验证了新方法的优越性和有效性。  相似文献   

4.
针对米波雷达低仰角目标的DOA估计问题,该文提出一种新的基于多帧相位特征增强方法,所提方法可以有效解决低仰角条件下阵列接收信号中直达信号相位特征模糊问题,进而提高DOA估计精度。通过学习多帧原始数据的相位分布特征与理想环境下直达波信号的相位分布特征之间的复杂映射关系,有效削弱多径信号引起的相位误差,将增强后的相位信息与原始的幅度信息进行数据重组,并利用已有的超分辨算法进行DOA估计。通过计算机仿真实验和实测数据验证,该文所提方法在DOA估计性能以及泛化能力上优于基于物理驱动的MUSIC算法以及数据驱动的基于特征反演和基于支持向量回归的两种估计方法。  相似文献   

5.
袁榕嵘  吴鸣  杨军 《电声技术》2011,35(5):50-54
结合基于传声器阵列和相位差的语音增强算法的优点,提出了可以在同时存在平稳噪声和干扰语音环境下使用的语音增强算法.首先对噪声估计技术进行了改进,利用相位差信息和幅度信息对语音存在概率进行估计,提高了噪声估计性能.其次用相位差信息对原谱减法的幅度增益函数进行改进.在普通房间使用间距为0.08m端射结构双传声器测试,实验结果...  相似文献   

6.
针对传统深度神经网络语音增强算法未区分在不同信噪比环境中去噪的侧重点,同时考虑到预测相位信息对于语音增强的重要性,提出了时频掩码优化的两阶段语音增强算法.第一阶段将带噪语音的幅度谱特征输入深度神经网络进行训练,预测得到干净语音幅度谱和噪声幅度谱;第二阶段通过信噪比信息估计增益系数,以控制残留噪声和语音失真之间的平衡;同...  相似文献   

7.
为改善低信噪比环境下语音的质量,论文提出了一种改进相位估计的语音增强算法。算法首先根据语音和噪声频谱的统计模型的对称性得到用先验信噪比倒数形式表示的噪声频谱估计值,然后通过分析低信噪比条件下(0dB)相位估计对于幅度估计的重要性,利用噪声频谱估计值估计每一个频点的相位修正值,并给出了一种优化的先验信噪比估计算法,得到一种新的语音增强算法。由仿真实验给出的客观测试和非正式听音测试表明:该算法处理后取得了较好的效果,在抑制低信噪比语音增强所产生的音乐噪声的前提下,相比未改进相位估计的算法处理后的信号,语音失真度更小,语音质量有明显提高。   相似文献   

8.
张天骐  张晓艳  周琳  胡延平 《信号处理》2020,36(11):1867-1876
相位谱补偿语音增强算法通过调整相位谱对噪声进行压缩,提高重构信号的质量。针对传统的相位谱补偿(phase spectrum compensation, PSC)语音增强算法采用固定的相位补偿因子,且算法的性能易受噪声估计准确性的影响,提出了一种基于稀疏性的相位谱补偿(sparsity-based phase spectrum compensation, SPSC)语音增强算法。首先,利用噪声估计算法得到噪声幅度谱,利用基于幅度谱的语音增强算法得到目标语音幅度谱;接着,通过噪声和目标语音幅度谱之间的局部信噪比(Signal-to-Noise Ratio, SNR)来估计谱时间稀疏性;然后,利用sigmoid函数改进相位补偿因子,联合补偿因子和谱时间稀疏性,得到SPSC函数。最后,使用SPSC函数对相位谱中的谱分量进行补偿,通过短时傅里叶逆变换得到最终增强后的语音信号。仿真实验表明,在四种不同背景噪声的低信噪比下,新的相位谱补偿算法使增强语音获得了更好的LSD、PESQ和segSNR指标,说明新的算法在低信噪比下,可以有效恢复带噪语音中的语音成分,对噪声抑制效果明显,增强语音的质量和听感均有一定提升。   相似文献   

9.
介绍了单话筒采集条件下基于语音短时对数谱的最小均方误差(MMSE-LSA)估计的语音增强算法,以及语音帧和噪声帧判别的有声/无声检测方法.将语音信号的相位提取后存储起来,然后对纯净语音的短时对数谱作最小均方误差估计,处理后的语音由估计得到的幅度谱和存储的相位重建.试验证明MMSE-LSA的增强效果很好,尤其在信噪比低时更为明显.  相似文献   

10.
为改善旋翼飞机空地语音通信质量,针对旋翼飞机螺旋桨造成的幅度调制(Amplitude Modulation, AM)信号复杂多频干扰以及恶劣机舱背景噪声,提出了一种通信语音时频掩膜智能增强方法,从而实现对机舱噪声与复杂干扰的有效抑制。该方法首先对原始时域语音信号进行分帧与加窗,通过短时傅里叶变换获取幅度谱与相位谱;然后将原始幅度谱作为网络输入,采用深度神经网络分析其语音信号的特征,采用长短期记忆网络挖掘语音信号的时序上下文信息,实现对语音时频掩膜的准确估计,并将其用于增强原始幅度谱以得到网络输出;最后结合原始相位谱,通过逆短时傅里叶变换获得增强后的时域语音信号。仿真与实际测试表明,该方法可有效抑制旋翼飞机环境下的干扰噪声,提高通信语音信号质量。  相似文献   

11.
现有的深度神经网络语音增强方法忽视了相位谱学习的重要性,从而造成增强语音质量不理想。针对这一问题,文中提出了一种基于卷积循环网络与非局部模块的语音增强方法。通过设计一种编解码网络,将语音信号的时域表示作为编码端的输入进行深层特征提取,从而充分利用语音信号的幅值信息以及相位信息。在编码端和解码端的卷积层中加入非局部模块,在提取语音序列关键特征的同时,抑制无用特征,并引入门控循环单元网络捕捉语音序列间的时序相关性信息。在ST-CMDS中文语音数据集上实验结果表明,与未处理的含噪语音相比,使用文中方法生成的增强语音质量和可懂度平均提升了61%和7.93%。  相似文献   

12.
针对在跳频信号跳变时刻和跳变频率估计方面实时性和估计精度无法同时兼顾的问题,提出了一种基于短时傅立叶变换(STFT)和多重信号分类(MUSIC)算法的跳频信号参数估计方法。在建立跳频信号数学模型的基础上,利用STFT选取较大时间窗对整个信号在时域进行粗搜索,生成时频谱图,提取时频脊线从而获得跳变时刻,然后选取较小时间窗在已知跳变时间段利用STFT进行跳变时刻的细估计,并利用MUSIC算法进行频率的精确估计。该方法利用STFT的二次估计,减少了MUSIC搜索范围,从而降低了时间开销。仿真表明该算法的跳变时刻频率估计精度高,实时性能满足参数测量需求。  相似文献   

13.
In 2005, Griffin showed that an InP phase-shift-keying/duobinary Mach–Zehnder interferometer (MZI) modulator could achieve good transmission performance at 10 Gb/s, despite modest residual amplitude modulation in the phase modulators in the MZI (ratio of real to imaginary part of index change was $sim$0.1). Here we show that even strong amplitude modulation in the “phase” modulators (ratio of real to imaginary part of index change is $sim$ 1.0) gives good transmission performance. Allowing for strong amplitude modulation allows a significant increase in modulator bandwidth. We demonstrate low-chirp 85.4-Gb/s optical duobinary generation in a fully packaged InP photonic integrated circuit.   相似文献   

14.
黄伟  欧世峰 《现代电子技术》2010,33(21):100-103
针对拉普拉斯先验模型下的语音增强问题,给出了一种模型因子估计算法,它利用语音分量方差与模型因子的对应关系来获取模型因子的估计;在语音分量方差的估计过程中,通过利用带噪语音分量与先前帧语音方差计算当前帧语音分量方差,提出一种新的语音分量方差估计算法。通过结合这两种新算法获得的拉普拉斯模型因子估计能够有效消除噪声分量能量对估计精度的影响,且提高系统的语音增强性能。多种噪声背景下的仿真结果表明,基于该模型因子估计方案的方法的语音增强算法具有更好的增强效果。  相似文献   

15.
Most speech enhancement algorithms are derived by applying gauss hypothesis based on decor related speech samples. And recently it is accepted that the real pdf of speech spectral amplitude lies between the Laplace and Gamma amplitude approximation. This paper presents a supper gauss mixture model of speech spectral amplitude which can accurately approximates real speech spectral amplitude distribution. With this model, a new speech enhancement algorithm on the basis of MMSE estimator is derived. Simulations show that this algorithm has a better noise reduction performance and improve output SNR in the sense of speech segmentation.  相似文献   

16.
欧世峰  赵晓晖 《电子学报》2007,35(10):2007-2013
通过讨论纯净语音分量的概率分布特征以及相邻分量间的统计相关特性,在自适应K-L变换(KLT,Karhunen-Loève Transform)域给出了一种新的语音信号统计模型,然后基于该信号模型,利用最大后验(MAP,Maximum a Posterior)估计理论提出了一种新型的单通道语音增强算法.该算法充分考虑到在KLT域相邻时刻语音分量间存在的相关信息,利用信号的高斯模型假设条件,以联合概率密度函数的形式将这种相关信息融合到MAP中,获得纯净语音分量的估计.算法不仅结构简单利于实现,且有效地避免了传统算法对语音分量估计的不足.仿真结果表明本文算法在客观和主观测试中都具有较好的语音增强效果.  相似文献   

17.
In this paper, the authors present optimal multichannel frequency domain estimators for minimum mean-square error (MMSE) short-time spectral amplitude (STSA), log-spectral amplitude (LSA), and spectral phase estimation in a widely distributed microphone configuration. The estimators utilize Rayleigh and Gaussian statistical models for the speech prior and noise likelihood with a diffuse noise field for the surrounding environment. Based on the Signal-to-Noise Ratio (SNR) and Segmental Signal-to-Noise Ratio (SSNR) along with the Log-Likelihood Ratio (LLR) and Perceptual Evaluation of Speech Quality (PESQ) as objective metrics, the multichannel LSA estimator decreases background noise and speech distortion and increases speech quality compared to the baseline single channel STSA and LSA estimators, where the optimal multichannel spectral phase estimator serves as a significant quantity to the improvements, and demonstrates robustness due to time alignment and attenuation factor estimation. Overall, the optimal distributed microphone spectral estimators show strong results in noisy environments with application to many consumer, industrial, and military products.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号