首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 952 毫秒
1.
基于分层采样粒子滤波的麦克风阵列说话人跟踪方法   总被引:2,自引:0,他引:2  
金乃高  殷福亮  陈喆 《电子学报》2008,36(1):194-198
针对噪声与混响环境下的说话人跟踪问题,本文提出了一种基于粒子滤波的麦克风阵列声源定位与跟踪方法.该方法在粒子滤波框架下,将无混响影响的语音建立信号作为观测信息,通过计算麦克风阵列波束形成器的输出能量来构建似然函数,同时考虑语音信号不同频率成分在声源定位中的作用,利用分层采样方法提高粒子的采样效率.实验结果表明,本文方法提高了说话人声源跟踪系统的抗噪声与抗混响能力.  相似文献   

2.
改进的SRP-PHAT声源定位方法   总被引:6,自引:0,他引:6  
基于联合可控响应功率和相位变换(SRP-PHAT)的传声器阵列声源定位方法是一种鲁棒的声源定位方法。该方法在弱噪声和适度混响的环境下,可以获得较精确的波达方向角(DOA)估计,但在低信噪比或强混响的环境下,该方法的性能并不理想,而且庞大的运算量也限制了其在实时定位系统中的应用。针对这两方面的问题,本文提出了一种改进的SRP-PHAT传声器阵列声源定位方法,从而使定位方法的运算量大大降低。仿真实验表明,改进的SRP-PHAT定位方法即使在噪声干扰较大和混响影响较严重的环境下,仍具有较高的定位精度。  相似文献   

3.
一种基于麦克风阵列的声源定位算法研究   总被引:1,自引:0,他引:1  
麦克风阵列声源定位广泛应用于视音频会议系统及枪声定位系统等领域。提出了一种基于最小熵值(ME)的麦克风阵列声源定位新方法,其特点在于利用最小熵值方法对麦克风阵列进行时延估计,并与离散网格方法相结合,对声源进行空间搜索。实验结果表明,在同等混响或噪声条件下,该方法定位优于广义互相关-相位变换方法(GCC-PHAT)。  相似文献   

4.
以EasyARM2100实验板为硬件平台,设计了一个可以在二维平面内对声源进行实时定位的实验系统。系统软件部分采用了基于到达时延估计双步定位法,并使用二次相关时延估计法和三元阵几何定位法分别对时延和声源的位置进行估计。通过在系统上的大量试验测试,表明系统硬件性能良好,软件定位算法实现简单,运算量小,精度较高,有较强的抗混响和抗噪声能力,可用在实时定位系统中。  相似文献   

5.
针对复杂声学环境下,现有目标声源定位算法精度低的问题,该文提出了一种基于时频单元选择的双耳目标声源定位算法。该算法首先利用双耳目标声源的频谱特征训练1个基于深度学习的时频单元选择模型,然后使用时频单元选择器从双耳输入信号中提取可靠的时频单元,减少非目标时频单元对定位精度的负面影响。同时,基于深度神经网络的定位系统将双耳空间线索映射到方位角的后验概率。最后,依据与可靠时频单元相对应的后验概率完成目标语音的声源定位。实验结果表明,该算法在低信噪比和各种混响环境,特别是存在与目标声源类似的噪声环境下目标声源的定位精度得到明显改善,性能优于对比算法。  相似文献   

6.
提出了一种基于上升过零点检测的双传声器声源定位方法,该方法可以根据双传声器信号时间差样本的统计特性求得信噪比,再统计满足信噪比要求的可靠时间差样本,将其转换成对应的方位角样本,最后根据样本数量的统计分析结果确定声源方位。针对不同声源、信噪比及混响条件,在实际房间中进行了定位实验。结果显示:该方法对宽带声源具有更好的定位效果;定位精度受信噪比的影响很小,但受室内混响的影响显著。  相似文献   

7.
传声器阵列的声源定位研究   总被引:2,自引:0,他引:2  
严素清  黄冰 《电声技术》2004,(12):27-30
对传声器阵列进行了总体概述,研究了基于传声器阵列的声源定位所面临的问题,分析和比较了几类主要的声源定位方法。给出了一种基于时间到达差的声源定位在处于混响环境下时延估计的有效算法并通过实验验证了该算法。  相似文献   

8.
赵小燕  陈书文  周琳 《信号处理》2020,36(3):449-456
为了提高噪声和混响环境下麦克风阵列的声源定位算法性能,提出了一种基于频率信噪比加权的可控响应功率定位算法。该算法首先根据每帧阵列信号的频域协方差矩阵估计每个频率的信噪比;然后通过激活函数将频率信噪比映射为加权值,并修正传统的相位变换可控响应功率计算公式;最后利用修正公式计算每个候选位置的可控响应功率值,通过搜索可控响应功率的最大值实现声源定位。该算法根据实时估计的频率信噪比自适应地调整各频率分量对可控响应功率的贡献。仿真结果表明,与传统的相位变换可控响应功率算法、维纳预滤波波束形成算法相比,在噪声和混响的复杂声学环境下,本文算法的定位正确率更高,均方根误差更小,对噪声的鲁棒性更强。   相似文献   

9.
为了改善在复杂环境下声源定位算法的性能,提出了一种新的时延估计(TDE)方法,即基于传递函数比的统计模型方法(ATFR-SM)。该方法采用统计模型去除噪声对传递函数(ATF)的影响,在计算传递函数时对功率谱密度(PSD)进行平滑和“白化”,以去除混响对传递函数的影响。同时,算法中引入话音激活检测(VAD)去除对求取传递函数无用的噪声段,以提高时延估计的准确性。此外,将所提时延估计方法与线性定位法相结合,构成一套完整的声源定位方法。实验结果表明,在复杂环境下,时延估计方法具有更低的异常点百分比(PAP)和均方根误差(RMSE),且明显优于传统的参考算法,同时声源定位方法具有更高的定位精度。  相似文献   

10.
为了提高复杂声学环境中双耳声源定位性能,本文利用多种双耳空间特征参数,提出了基于神经网络方法的鲁棒双耳声源定位算法。本文将不同声学环境下双耳声信号对应的互相关函数、耳间强度差等空间定位线索,作为输入特征,用于训练BP神经网络。在混响和噪声环境下,与传统双耳定位算法相比,本文基于BP神经网络的双耳定位算法的定位性能有显著提高,特别是低信噪比条件下,定位正确率提高更为显著。  相似文献   

11.
The letter proposed a sound source localization method of digital hearing aids using wavelet based multivariate statistics with the Generalized Cross Correlation (GCC) algorithm. Haar wavelet is used to decompose GCC sequences and extract four wavelet characteristics. And then, Hotelling T2 statistical method is used to fuse the four wavelet characteristics. The statistical value is used to judge the number of sound sources and obtain corresponding time delay estimation which is used to localize the position of sound source. The experimental results show that the proposed method has better robustness in an environment with severe noise and reverberation. Meanwhile, the complexity of algorithm is moderate, which is available for sound source localization of hearing aids.  相似文献   

12.
基于广义互相关的时延估计算法研究   总被引:4,自引:0,他引:4  
严素清  黄冰 《信息技术》2005,29(12):26-28
采用到达时间差的声源定位,最重要的就是进行时延估计,其精确性直接影响到定位的准确与否。本文主要分析研究了广义互相关算法在无混响和混响环境下时延估计及估计性能,实现了不同环境下的时延估计,实验结果表明广义互相关在无混响和弱混响下具有较好的优势。  相似文献   

13.
蔡卫平 《黑龙江电子技术》2013,(11):173-175,179
相位变换加权的可控响应功率(SRP-PHAT)算法是一种基于麦克风阵列的鲁棒声源定位方法,该算法在有混响和噪声的环境下仍有较高的定位精度.但该算法用网格法对整个声源空间进行搜索,逐点计算其目标函数,因而总的计算量非常大,不适用于实时定位系统.针对SRP-PHAT的特点,采用遗传算法进行搜索,使总的计算量大幅度降低.仿真结果表明在混响时间为300ms,信噪比为5dB的条件下,该算法仍可达到较高的定位精度.  相似文献   

14.
结合噪声源定位方法和阵列信号处理技术,设计了一种能提取输电线噪声的传声器阵列,利用该阵列采集了复杂声场条件下的输电线噪声数据,并分析了噪声源的频谱特性和空间分布特征,验证了宽带频域近场聚焦波束形成方法对输电线噪声源定位的有效性.通过实验观测发现,西安上苑330 kV高压输电线噪声源主要为高频随机噪声,其频率集中在2~ 10 kHz范围内,信号能量分布较均匀;在频段为2~8 kHz范围内的噪声信号,增大信号处理的带宽可以提高声源定位的精度,但如果信号处理的带宽超过了输电线的主频范围,定位性能会变差.  相似文献   

15.
Yi ZHANG  Juan LI  Min ZHANG 《通信学报》2019,40(1):102-109
In traditional multi-source localization field,it is necessary to guarantee that the number of microphone is more than the number of source.To overcome this constraint,a dual-microphone multi-source localization algorithm based on CS was proposed,where the number of sound source localized successfully was more than 3.The multi-source localization was regarded as the block sparse signal reconstruction in this algorithm,and the full room impulse responses normalized were exploited to construct the compressed observation matrix in frequency domain.In reconstructed block sparse signal,the positions of non-zero blocks were corresponded to the positions of sound sources in space.The simulation shows that compared with the SRP-sub algorithm,in reverberation time 0.6s with dual-microphone,the proposed multi-source localization algorithm based on compressed sensing has higher capability which can reach 80% success rate by using 40 frequency points to localize 3 sound sources.  相似文献   

16.
邱保安  吕辉  李力力 《现代雷达》2019,41(11):85-89
声阵列技术通过特定方式排布的声传感器阵列接收声场信号,采用波束形成原理对声场信号进行特殊处理,获取噪声源的幅值、相位、方位等信息,得到声场的空间分布,实现混响环境多个声源的检测与识别。针对某轮轨式大型相控阵雷达天线座滚轮的异响噪声故障,基于声阵列噪声源识别技术,利用平面螺旋声像检测系统对滚轮噪声的辐射声场进行测量,获得了滚轮噪声的频率特性和声场能量分布特征,并通过声场图像和光学视频图像的透明重叠,以云图方式准确直观地呈现了滚轮噪声源的频率、分布位置。研究结果表明:声阵列技术能够快速准确地进行噪声源的诊断和空间定位,为雷达传动系统异响噪声故障的诊断分析提供了有效的工程经验。  相似文献   

17.
张佩  夏秀渝  胡连锋  李志昌 《通信技术》2009,42(11):160-162
基于麦克风阵列的声源定位技术可以广泛应用于音视频会议、说话人跟踪与识别以及助听器等众多场合中。根据语音信号的短时平稳特性,文中提出了一种改进的基于MUSIC算法进行声源二维定位的方法。该方法按帧交叉进行声源数估计和声源方位估计,最后对多帧信号的估计值进行统计、平均得到最终的方位估计和较准确的声源数估计。仿真结果表明,这种方法能有效解决由于声源数估计不准确导致的峰值搜索时偏差较大的问题,并且具有良好的抗噪性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号