首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
结合小波滤波器组理论和自适应波束形成技术,提出了一种基于宽带波束形成的麦克风阵列语音增强方法。该方法利用小波分析滤波器组将含噪语音信号变换到小波域;进行小波域阵列自适应波束形成;通过小波综合滤波器组重构增强后的语音信号。计算机仿真实验验证了该方法的有效性。  相似文献   

2.
麦克风阵列的自适应算法通过迭代运算获取波束形成的最优权矢量时,噪声模型的估计是一个非常关键的因素.它的好坏直接影响着系统波束形成的性能.系统地分析了最小均方(LMS)自适应语音增强算法,并针对阻塞矩阵在估计噪声时存在的缺陷,在该算法的基础上提出了一种利用最小值控制递归平均(MCRA)来估计噪声的方法.将此方法应用于波束形成,并用 Matlab 软件进行仿真.仿真实验结果表明,MCRA 估计出的噪声使 LMS 自适应语音增强的效果更好和抗噪性更强.  相似文献   

3.
文章介绍了各种基本的麦克风阵列语音增强算法,对其消噪性能进行了系统地分析,并以实测数据进行了测试。并介绍了基于稳健波束形成器、近场超定向波束形成器、广义奇异值分解和传输函数广义旁瓣相消器等结构的麦克风阵列语音增强的基本原理,总结了各种算法的特点及其所适用的声学环境特性。  相似文献   

4.
随着近年来人机语音交互场景不断增加,利用麦克风阵列语音增强提高语音质量成为研究热点之一。与环境噪声不同,多说话人分离场景下干扰说话人语音与目标说话人同为语音信号,呈现类似的时、频特性,对传统麦克风阵列语音增强技术提出更高的挑战。针对多说话人分离场景,基于深度学习网络构建麦阵空间响应代价函数并进行优化,通过深度学习模型训练设计麦克风阵列期望空间传输特性,从而通过改善波束指向性能提高分离效果。仿真和实验结果表明,该方法有效提高了多说话人分离性能。  相似文献   

5.
黄斌 《计算机仿真》2009,26(12):342-346
为了进一步改善波束形成的降噪性能,研究了一种稳键后置滤波自适应空间波束形成算法.用麦克风代替传统波束形成器的延时抽头线,使所有的麦克风都有一阶的滤波器,利用经典的线性约束最小方差准则使空间波束形成产生语音参考信号,同阻塞矩阵输出的噪声参考信号一起经自适应多路相消器,从而有效的消除干扰噪声;最后结合后置滤波技术进一步改善语音质量.实验结果表明,相对于传统后置滤波自适应波束形成算法,在消噪性能上有明显的改善且具有更高的输出信噪比.  相似文献   

6.
针对噪声与混响环境下的声源定位问题,采用了一种基于粒子滤波的麦克风阵列的声源定位方法。在粒子滤波框架下,将到达麦克风的语音信号作为观测信息,通过计算麦克风阵列波束形成器的输出能量来构建似然函数。实验结果表明,方法提高了声源定位系统的抗噪声与抗混响能力,即使在低信噪比强混响的环境下也能获得较高的定位精度。  相似文献   

7.
龙超  曾庆宁  罗瀛 《计算机应用》2020,40(8):2386-2391
为了提高麦克风小阵的语音增强效果,将阵列抗串扰自适应噪声抵消(ACRANC)方法与波束形成(BF)方法相结合,提出了一种效果更好的小阵语音增强方法。首先,通过生成多个ACRANC子系统,获得多路增强语音信号;然后,通过所提的自适应模式控制(AMC)算法和延迟求和(DAS)波束形成方法进一步提高多路增强语音信号的增强效果。对提出的方法进行了计算复杂度估计,验证了所提方法可以通过普通芯片实时实现。实际环境下的实验结果也表明,所提方法的语音增强效果相较ACRANC方法有所提高,具有一定的优越性。  相似文献   

8.
基于子带广义旁瓣相消器的麦克风阵列语音增强*   总被引:2,自引:0,他引:2  
为了加快基于广义旁瓣相消器的麦克风阵列语音增强系统的收敛速度,将其自适应模块的输入信号分解到子带以进行处理,并将多通道维纳滤波器引入广义旁瓣相消器的非自适应支路,以更有效地抑制非相干噪声。实际测试结果表明,相对于基于全带广义旁瓣相消器的麦克风阵列语音增强系统,采用该子带广义旁瓣相消器结构的语音增强系统具有更快的收敛速度和更高的输出信噪比。  相似文献   

9.
研究讨论了用于麦克风阵列的高信噪比定向采音算法,设计实现了麦克风阵列语音采集系统.通过对采集到的空间中不同方向音频进行数字信号处理,使阵列形成的波束主瓣指向目标语音,零陷指向干扰源,提高采音信噪比,实现对声源的定向采音等.测试结果表明,本系统采音效果良好,采集到的声音信号主瓣很窄,能够实现高信噪比定向采音.  相似文献   

10.
张伟  王冬霞  于玲 《计算机应用》2020,40(4):1191-1195
考虑到智能音箱中多采用麦克风阵列作为拾音装置,而单通道自适应滤波技术对声学回声消除具有失真性和复杂性,提出一种麦克风阵列快速回声消除算法。该算法首先用自适应滤波技术估计第一通道回声,然后估计阵列间的相对回声传递函数,把两者相乘得到其他通道回声;其次,把估计出的回声和噪声当作广义旁瓣抵消器(GSC)波束形成下支路的噪声参考信号,利用GSC波束形成算法去除回声和噪声。仿真结果表明,在中度混响、远距离、低回噪比且用音乐作为回声环境时,该算法具有良好的回声消除与噪声抑制性能,不仅运算量小,而且使目标语音信号具有较高的信源失真率和可懂度。  相似文献   

11.
通过传声器阵列采用波束形成技术采集语音信号,同时使用参考传声器获得背景噪声信号,本文提出一种基于波束形成和自适应多参考噪声对消的语音增强算法。该算法不依赖任何信号模型且无需对噪声信号的统计特性进行先验假设,可以适应背景噪声的突然改变,同时具有良好的实时性和鲁棒性。可广泛应用于复杂噪声环境下目标语音识别,仿真结果表明了该算法的有效性。  相似文献   

12.
在数字助听器和小型语音设备的实际应用中,非平稳噪声干扰与自适应方法的收敛过程会造成语音性能下降。为了实际解决该问题,设计了一种新型的实时语音增强系统。该系统基于双通道一阶差分麦克风阵列,同时采用结构分时复用和高效汉宁窗分帧等方法,提高了性能并节约了硬件成本。该语音增强系统可获得3.5db左右的信噪比增益,同时克服了单通道增强系统和自适应方法的局限,并用Verilog语言在FPGA上设计实现该系统。从而在硬件层次上提高了小型语音设备的抗噪性能,为数字助听器或相关ASIC芯片的研制奠定了基础。  相似文献   

13.
This paper addresses the problem of distant speech acquisition in multiparty meetings, using multiple microphones and cameras. Microphone array beamforming techniques present a potential alternative to close-talking microphones by providing speech enhancement through spatial filtering. Beamforming techniques, however, rely on knowledge of the speaker location. In this paper, we present an integrated approach, in which an audio-visual multiperson tracker is used to track active speakers with high accuracy. Speech enhancement is then achieved using microphone array beamforming followed by a novel postfiltering stage. Finally, speech recognition is performed to evaluate the quality of the enhanced speech signal. The approach is evaluated on data recorded in a real meeting room for stationary speaker, moving speaker, and overlapping speech scenarios. The results show that the speech enhancement and recognition performance achieved using our approach are significantly better than a single table-top microphone and are comparable to a lapel microphone for some of the scenarios. The results also indicate that the audio-visual-based system performs significantly better than audio-only system, both in terms of enhancement and recognition. This reveals that the accurate speaker tracking provided by the audio-visual sensor array proved beneficial to improve the recognition performance in a microphone array-based speech recognition system.  相似文献   

14.
This paper proposes a speech enhancement approach to suppress the interference of car noise. A linear microphone array is adopted for far-talking speech acquisition and delay-and-sum beamforming noise reduction. We present an effective time delay estimator using the coherence function between the reference microphone and the beamformed speech. To further enhance the beamformed speech, we exploit an improved Wiener filter where the resulting noise correlation in microphone array is relatively small so that the performance of optimal Wiener filtering could be achieved. Also, due to the serious degradation in low frequency car speech, we develop a spectral weighting function to compensate the low frequency filtering. These two processing units serve as the post filters to attain the desirable enhancement performance. In the experiments on microphone array speech in presence of real and simulated car noises, we find that the proposed algorithm performs well. Performance is measured in terms of the signal-to-noise ratio and the word error rate. The combined delay-and-sum beamformer and two post filters obtain the best results compared to other methods.  相似文献   

15.
基于微分麦克风阵列的自适应语音增强算法研究及DSP实现   总被引:3,自引:1,他引:2  
宋辉  刘加 《自动化学报》2009,35(9):1240-1244
自适应滤波是语音增强算法中的常用技术, 而算法复杂度与收敛速度是设计各种自适应算法需要首要考虑的问题. 本文提出一种用于片上的语音增强自适应滤波新算法. 该算法分两步实现, 首先, 利用一阶微分麦克风阵列, 获得噪声的实时估计; 其次, 对传统的仿射投影算法(Affine projection algorithm, APA)加以改进, 得到计算误差向量的快速算法, 并根据估计误差动态调整搜索步长以及仿射投影维数, 对带噪语音进行自适应滤波消噪. 在TMS320VC5509 DSP芯片上实现该算法. 实验表明, 算法的自适应滤波过程具有接近递推最小二乘算法(Recursive least squares, RLS)的快速收敛速度, 以及类似最小均方误差算法(Least mean squares, LMS)的低算法复杂度.  相似文献   

16.
麦克风阵列语音增强技术及其应用   总被引:3,自引:5,他引:3  
洪鸥 《微计算机信息》2006,22(1):142-144
本文简要叙述了应用麦克风阵列进行语音增强的原理及方法。且由于麦克风阵列在实际语音处理时具有良好的拾取语音能力及噪声鲁棒性,本文将介绍该技术在车载系统环境、机器人语音识别、大型场所的记录会议、助听装置及声源定位等系统中的应用。  相似文献   

17.
通过使用多波束形成器对盲分离系统进行预处理滤波,结合频域内独立分量分析的方法,提出了一种基于麦克阵列的快速实时盲语音分离系统,它能够有效地分离在真实环境中的卷积混叠语音信号。  相似文献   

18.
Voice activity detection (VAD) is essential for multiple microphone arrays processing, in which massive potential devices, such as microphone devices for far-field voice-based interaction in smart home environments, will be activated when sound sources appear. Therefore, the VAD can save a lot of computing resources in massive microphone arrays processing for the sparsity in sound source activity. However, it may not be feasible to obtain an accurate VAD in harsh environments, such as far-field, time-varying noise field. In this paper, the long-term speech information (LTSI) and the log-energy are modeled for deriving a more accurate VAD. First, the LTSI can be obtained by measuring the differential entropy of long-term smoothed noisy signal spectrum. Then, the LTSI is used to get labeled data for the initialization of a Gaussian mixture model (GMM), which is used to fit the log-energy distribution of noise and (noisy) speech. Finally, combining the LTSI and the GMM parameters of noise and speech distribution, this paper derives an adaptive threshold, which represents a reasonable boundary between noise and speech. Experimental results show that our VAD method has a remarkable improvement for a massive microphone network.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号