共查询到20条相似文献,搜索用时 31 毫秒
1.
本文主要采用TDOA算法,重点研究了基于麦克风阵列的声源定位技术。在对广义互相关时延估计算法分析的基础上,通过引入基于C_0复杂度的端点检测技术、线性预测和IIR平滑滤波,设计了基于线性预测残差的广义互相关算法。本文同时给出了平面四元十字麦克风阵列的设计及定位原理,完成了基于DM368的嵌入式语音定位系统设计。测试结果表明,本文所设计的系统有效改进了时延估计的准确性,提升了噪声环境下的定位性能。 相似文献
2.
3.
随着多媒体技术的进一步发展,语音接收和声音信号处理得到了日益广泛的关注和应用,而声源的定位和声源增强是实现语音增强,语音识别的前提和基础.基于麦克风阵列的声源定位技术由于其广泛的应用前景得到了众多学者的关注.单个麦克风接收到的信息量较少,缺少声源定位所需要的信息,而麦克风阵列克服了上述的缺点,利用了各麦克风信号之间信号的相关性对数据进行相关分析和处理从而实现声源的定位.文中阐述了麦克风阵列声源定位的原理,推导计算目标方位角、俯仰角以及距离的计算公式;阐述了硬件系统的组成以及各个部分的作用并通过实验进行了系统的测试,通过对测试数据的分析得出麦克风阵列声源定位系统能够实现声源的快速定位. 相似文献
4.
5.
实现了一种基于四元十字麦克风阵列的声源定位系统。选取四元十字阵作为麦克风阵列的阵型,推导了基于四元十字麦克风阵列的声源定位算法的公式。针对传统互相关时延估计算法在低信噪比、混响大的环境下鲁棒性较差的问题,系统采用广义互相关算法来进行定位的时延估计,并使用Cortex-A8嵌入式平台实现了鲁棒的声源定位系统。 相似文献
6.
7.
8.
基于任意麦克风阵列的声源二维DOA估计算法研究 总被引:7,自引:0,他引:7
对基于麦克风阵列的声源定位技术进行了研究,分析了基于麦克风阵列的远场信号模型,并结合子空间的方法推导出了声源二维(水平角和俯仰角)DOA估计——2D-MUSIC算法,该算法适用于任意拓扑结构的麦克风阵列。利用MATLAB仿真工具,对几种典型阵列结构进行了对比分析,提出了2种新型的三维麦克风阵列:均匀球面阵和三维均匀直线阵。仿真结果表明,提出的DOA估计算法在二维的均匀圆阵、三维的均匀球面阵和三维均匀直线阵中,均能得到较好的DOA估计效果。 相似文献
9.
基于双麦克风的2维平面定位算法 总被引:1,自引:0,他引:1
基于麦克风阵列的声源定位技术受到了越来越多的关注。在视频会议、助听器、免提电话系统中,声源定位被用于检测说话人的位置信息来自动调节摄像头,或者形成波束。在各种声源定位方法中,基于到达时间差(time delay of arrival,TDOA)估计的双步定位算法是普遍采用的一种行之有效的方法。Birchfield从能量的角度出发提出了一种基于双耳电平差(interaural level difference,ILD)的双步定位算法,它通过检测多个麦克风对所接收到的信号能量比来确定声源的位置。然而,所有的这些方法如果要确定出声源在二维平面内的位置坐标,都至少需要三个麦克风。针对这一问题,本文提出了一种基于双麦克风的二维平面定位算法,类似于人的双耳定位原理,我们通过同时估计声源到达两个麦克风的能量比和时延信息,来达到定位的目的,而进一步推导出的闭合解可以用于实时地跟踪运动声源。最后的仿真结果证明了这一算法在一般的混响条件下都可以获得好的结果,然而它减小了阵列的尺寸,这对于体积受限的通信设备来说具有极大的吸引力。 相似文献
10.
本文提出了一种在干扰声源和背景噪声存在条件下麦克风阵列噪声消除的方法。麦克风阵列通过波束形成增强由导向矢量所指定方向的目标声源来抑制背景噪声。然而,现有的波束形成算法在干扰声源存在的情况下,无法进行准确的导向矢量估计。为此,本文提出一种基于音频信号互相关功率谱相位的麦克风阵列噪声消除方法。首先通过音频信号的相位时频掩码估计导向矢量,并对其进行波束形成,从而有效抑制干扰声源和背景噪声;然后利用语音存在概率,采用最大似然的方法估计波束形成后信号中残留的干扰噪声功率谱密度,对其进行后处理,进一步抑制残留干扰和噪声。实验结果表明在干扰声源和背景噪声存在的条件下,所提方法有效地实现了麦克风阵列噪声消除,且各种性能指标优于基线方法。 相似文献
11.
基于传声器阵列的声源定位 总被引:26,自引:4,他引:22
概括了利用传声器阵列进行语音声源定位几种方法,同时分析了几种声达时间延迟的相关算法,并给出了几种搜索算法,给出了基于互功率谱相位加权延迟估计的声源定位实验结果。 相似文献
12.
13.
14.
15.
16.
《信息技术》2015,(10):103-107
声源定位已广泛地应用于视频会议和语音控制系统中,针对传统的声源定位系统中采集电路采集到的声音信号易受噪音和混响的影响,提出采用运动传感输入设备Kinect中集成的小型线性麦克风阵列采集音频信号,通过Kinect采集四通道音频信号,并应用互相关(CC)、相位变换(PHAT)、最大似然估计(ML)和平均平方差函数(ASDF)等四种时延算法对采集的音频信号进行处理分析,从而获取时延实现声源的定位。另外,从信号-噪音比(SNR)、峰值锐化两个方面分别利用MATLAB仿真和实测实验比较了四种算法的性能。实验结果表明,利用Kinect线性麦克风阵列采集定位能更有效地去除噪声,提高信噪比,并且四种算法中相位变换法拥有尖锐的峰值和较低的信噪比门限,从而能够适用于声源定位中获取精确时延。 相似文献
17.
时延估计是常用的声源定位方法,传统的算法将定位分为两个步骤,即先估计麦克风阵列中每一对基元的接收信号时延,然后根据这些时延用几何的方法确定声源的位置。在低信噪比下,一对麦克风的时延估计误差较大,导致定位误差较大。相容时延矢量估计算法将两步合为一步,没有逐对估计时延,而是构造一个目标函数,通过搜索得到声源的位置。仿真结果表明,在低信噪比下,只需要较短的数据,该算法仍可得到较高的定位精度。 相似文献
18.
19.
20.
针对真实环境中的多说话人定位问题,提出一种基于子帧分析的多声源定位算法。该算法将一帧语音信号分为8个子帧,利用每个子帧信号计算相位变换加权的可控响应功率函数,分别搜索其最大值得到声源位置的子帧估计。由于语音信号在时域具有稀疏性,这些估计值对应多个声源的位置。利用会聚聚类算法将子帧估计值分为若干类,然后用平均子帧可控响应功率函数对估计值进行评价,得到最终的声源位置估计。实验表明,在2~3个说话人的情况下,该算法比传统算法的定位性能有较大幅度提高。 相似文献