期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于分层采样粒子滤波的麦克风阵列说话人跟踪方法 总被引：2，自引：0，他引：2

金乃高殷福亮陈喆《电子学报》2008,36(1):194-198

针对噪声与混响环境下的说话人跟踪问题,本文提出了一种基于粒子滤波的麦克风阵列声源定位与跟踪方法.该方法在粒子滤波框架下,将无混响影响的语音建立信号作为观测信息,通过计算麦克风阵列波束形成器的输出能量来构建似然函数,同时考虑语音信号不同频率成分在声源定位中的作用,利用分层采样方法提高粒子的采样效率.实验结果表明,本文方法提高了说话人声源跟踪系统的抗噪声与抗混响能力. 相似文献

2.

基于sigma点H∞滤波的说话人跟踪方法

侯代文殷福亮陈喆《信号处理》2009,25(3)

在基于麦克风阵列的说话人跟踪系统中,存在观测方程的非线性程度较强,观测误差的统计特性不易准确描述等问题.本文提出了一种基于sigma点H∞滤波的说话人跟踪方法.该方法用sigma点转换技术减小观测方程的线性化误差,用H∞滤波方法降低观测误差不确定性对说话人位置估计的影响,从而提高了说话人跟踪精度,增强了跟踪系统对噪声的鲁棒性.仿真实验结果表明,相对于扩展卡尔曼滤波方法,本文方法在多种噪声条件下可将说话人跟踪误差降低25%以上. 相似文献

3.

基于数值积分卡尔曼-概率假设密度滤波的多说话人跟踪方法

陈里铭陈喆殷福亮侯代文《信号处理》2012,28(9):1209-1218

针对多说话人跟踪的非线性系统模型,提出了一种基于数值积分卡尔曼-概率假设密度滤波的多说话人跟踪方法。该方法采用麦克风阵列的时间延迟估计作为观测数据,利用具有三次代数精度的球面-径向数值积分准则计算非线性系统贝叶斯滤波器中的多维积分,通过数值积分卡尔曼滤波和概率假设密度滤波对后验多说话人状态的一阶统计量进行估计,并通过递推更新得到说话人状态信息,实现非线性高斯系统的多说话人跟踪。该方法无需求解非线性系统函数的雅克比矩阵,且计算量较小。仿真实验分析了检测概率、虚警点数目、采样周期、信噪比以及混响时间变化时跟踪算法的性能。实验结果表明,该方法降低了系统模型非线性对滤波算法的影响,增强了跟踪算法的鲁棒性,提高了说话人状态和数目的估计精度。相似文献

4.

近场声源定位算法研究

于向丽吕成国《智能计算机与应用》2011,(5):69-70,76

麦克风阵列声源定位可为在复杂环境下的说话人的空间位置估计提供有效的解决方案.而传统的应用于雷达,声呐系统领域的阵列信号处理理论已趋于完美,很多应用于阵列信号处理的算法加以修改就可以用来进行麦克风阵列的声源定位.以阵列信号处理中的经典算法MUSIC(Multiple Signal Classification)算法为原型... 相似文献

5.

基于线性校正总体最小二乘准则的三维说话人定位算法 总被引：1，自引：0，他引：1

张奕殷福亮陈喆《通信学报》2009,30(12):106-112

针对到达时间差(TDOA)度量误差和麦克风阵列误差,提出了一种基于线性校正总体最小二乘准则的三维说话人定位算法.该定位算法通过对球面误差准则进行总体最小二乘优化来控制阵列误差的影响,并通过对优化过程引入方向参数的二次约束来控制算法的方差.仿真实验表明,本算法可以同时兼顾定位的方差性能和偏差性能,给出稳健的定位结果. 相似文献

6.

基于加权子空间拟合的声源定位与跟踪方法

金乃高殷福亮陈喆《电子与信息学报》2008,30(9):2134-2137

麦克风阵列声源定位可为复杂环境下的说话人空间位置估计问题提供一种有效的解决方案。该文基于粒子滤波框架,提出了一种加权子空间拟合声源定位与跟踪方法。该方法将窄带子空间拟合算法的代价函数推广至宽带情形,构建了一种适用于宽带语音信号的似然函数,并结合说话人的运动模型估计声源的位置。计算机仿真与实测结果验证了该方法的有效性。相似文献

7.

一种基于自适应阵列天线的波束赋形算法 总被引：1，自引：0，他引：1

王靖施刚李娟《电讯技术》2007,47(4):138-142

自适应阵列天线中的数字波束赋形(DBF)技术是智能天线数字信号处理部分的核心.提出了一种可用于自适应阵列波束赋形的SMI-LMS算法--由SMI(采样协方差矩阵求逆)算法决定LMS(最小均方)算法的初始权向量.该算法充分结合了SMI算法收敛速度快和LMS算法稳态误差小的优点,能在较强干扰环境下,确保权向量的快速收敛和跟踪速度.与传统的LMS算法相比,SMI-LMS算法具有良好的收敛性能、较快的跟踪速度和较小的输出误差,并可以有效改善自适应方向图的副瓣性能.仿真结果验证了该结论. 相似文献

8.

基于双麦克风的2维平面定位算法 总被引：1，自引：0，他引：1

崔玮玮曹志刚魏建强《信号处理》2008,24(2):299-302

基于麦克风阵列的声源定位技术受到了越来越多的关注。在视频会议、助听器、免提电话系统中,声源定位被用于检测说话人的位置信息来自动调节摄像头,或者形成波束。在各种声源定位方法中,基于到达时间差(time delay of arrival,TDOA)估计的双步定位算法是普遍采用的一种行之有效的方法。Birchfield从能量的角度出发提出了一种基于双耳电平差(interaural level difference,ILD)的双步定位算法,它通过检测多个麦克风对所接收到的信号能量比来确定声源的位置。然而,所有的这些方法如果要确定出声源在二维平面内的位置坐标,都至少需要三个麦克风。针对这一问题,本文提出了一种基于双麦克风的二维平面定位算法,类似于人的双耳定位原理,我们通过同时估计声源到达两个麦克风的能量比和时延信息,来达到定位的目的,而进一步推导出的闭合解可以用于实时地跟踪运动声源。最后的仿真结果证明了这一算法在一般的混响条件下都可以获得好的结果,然而它减小了阵列的尺寸,这对于体积受限的通信设备来说具有极大的吸引力。相似文献

9.

麦克风阵列的协同自适应滤波语音增强方法

《现代电子技术》2019,(8):16-20

在麦克风阵列语音增强方法中,传统的广义旁瓣抵消器在处理存在显著脉冲噪声的语音信号时效果较差。为提高在脉冲噪声干扰下的语音信号增强效果,提出一种麦克风阵列的协同自适应滤波语音增强方法。该方法采用协同自适应滤波取代线性自适应滤波,基于NLMS算法导出了滤波器权值和协同因子的自适应更新算法。仿真实验结果表明,所提方法能有效地消除掉语音信号的脉冲噪声和高斯噪声,克服线性自适应滤波对非线性脉冲噪声的不敏感性,比广义旁瓣抵消器效果优越很多。相似文献

10.

基于自适应RBFN阵列的说话人识别

连翰汪峥王建军张立明《太赫兹科学与电子信息学报》2004,2(3):171-175

提出一种可用于说话人识别的自适应RBFN阵列。RBF网设计的核心在于确定网络中心的数目及位置，该自适应算法有效地融合了IOC与ROLS算法的优点，不仅能动态调节RBF网的隐节点数，还能使网络的数据中心自适应变化，很好地优化了网络的结构。用与文本无关的闭集说话人识别系统对该算法进行了验证，实验结果表明，该方法与传统的RBF算法相比，自适应RBF网具有较好的鲁棒性以及精简的网络结构等优点。相似文献

11.

基于统计的近场声源定位方法

张佩夏秀渝胡连锋李志昌《通信技术》2009,42(11):160-162

基于麦克风阵列的声源定位技术可以广泛应用于音视频会议、说话人跟踪与识别以及助听器等众多场合中。根据语音信号的短时平稳特性,文中提出了一种改进的基于MUSIC算法进行声源二维定位的方法。该方法按帧交叉进行声源数估计和声源方位估计,最后对多帧信号的估计值进行统计、平均得到最终的方位估计和较准确的声源数估计。仿真结果表明,这种方法能有效解决由于声源数估计不准确导致的峰值搜索时偏差较大的问题,并且具有良好的抗噪性能。相似文献

12.

Harmonic Structure Features for Robust Speaker Diarization

Yu Zhou Hon gbin Suo Junfeng Li Yonghong Yan 《ETRI Journal》2012,34(4):583-590

相似文献

13.

基于等边三角形的二阶差分传声器阵列

陈卓粱维谦董保帅《电声技术》2011,35(7):38-41

实现了一种等边三角形结构微型传声器阵列的语音增强方法.不同于以往的线性一阶差分传声器阵列结构和线性二阶差分传声器阵列结构,提出并且验证了一种基于延时相加的二阶三角差分传声器阵列的算法,通过真实环境的检测,证明该算法能够实现12个方向的语音增强,同时方向性信噪比比线性一阶差分传声器阵列增强3～4 dB. 相似文献

14.

SVD-based optimal filtering for noise reduction in dual microphone hearing aids: a real time implementation and perceptual evaluation

Maj JB Royackers L Moonen M Wouters J 《IEEE transactions on bio-medical engineering》2005,52(9):1563-1573

In this paper, the first real-time implementation and perceptual evaluation of a singular value decomposition (SVD)-based optimal filtering technique for noise reduction in a dual microphone behind-the-ear (BTE) hearing aid is presented. This evaluation was carried out for a speech weighted noise and multitalker babble, for single and multiple jammer sound source scenarios. Two basic microphone configurations in the hearing aid were used. The SVD-based optimal filtering technique was compared against an adaptive beamformer, which is known to give significant improvements in speech intelligibility in noisy environment. The optimal filtering technique works without assumptions about a speaker position, unlike the two-stage adaptive beamformer. However this strategy needs a robust voice activity detector (VAD). A method to improve the performance of the VAD was presented and evaluated physically. By connecting the VAD to the output of the noise reduction algorithms, a good discrimination between the speech-and-noise periods and the noise-only periods of the signals was obtained. The perceptual experiments demonstrated that the SVD-based optimal filtering technique could perform as well as the adaptive beamformer in a single noise source scenario, i.e., the ideal scenario for the latter technique, and could outperform the adaptive beamformer in multiple noise source scenarios. 相似文献

15.

基于相干性滤波器的广义旁瓣抵消器麦克风小阵列语音增强方法 总被引：1，自引：0，他引：1

杨立春钱沄涛《电子与信息学报》2012,34(12):3027-3033

为了克服传统麦克风小阵列语音增强算法噪音抑制能力有限的问题,该文提出一种基于相干性滤波器的广义旁瓣抵消器语音增强算法, 该算法基于动态平滑系数噪声谱估计来获得相干性滤波器,分别对每个阵元接收到的信号进行滤波用以抑制包括混响等噪声信号的干扰,并把滤波后的信号作为输入信号,使用基于小阵列的广义旁瓣抵消器波束形成算法抑制残余噪声信号的干扰。模拟和实际试验表明,该文提出的算法明显优于单独使用小阵列波束形成算法和相干性滤波器算法。相似文献

16.

结合差分阵列与幅度谱减的双麦语音增强算法

下载免费PDF全文

徐娜吴长奇《信号处理》2018,34(7):876-881

为了抑制小型语音通信设备中的方向性噪声干扰问题,提出了一种结合差分阵列与幅度谱减的双麦语音增强算法。该算法首先利用一阶差分阵列技术,对两麦克风采集到的带噪语音信号进行处理,得到语音通道信号和噪声通道信号。接着利用差分阵列处理后的两通道信号对语音通道信号的信噪比进行估计。最后利用幅度谱减法对语音通道信号中残留噪声进行消除。针对语音通道信号的信噪比估计,本文给出了两种新奇的计算方法。仿真实验表明,该算法有效的抑制了方向噪声,改善了语音的质量,去噪效果及语音质量均优于对比算法。相似文献

17.

Phone-based filter parameter optimization of filter and sum robust speech recognition using likelihood maximization

Bahram Kouhi-Jelehkaran Hamidreza Bakhshi Farbod Razzazi 《AEUE-International Journal of Electronics and Communications》2010,64(12):1167-1172

Because of noise and reverberation, accuracy of speech recognition systems decreases when the distance between talker and microphone increases. By the using of microphone arrays and appropriate filtering of received signals, the accuracy of recognizer can be increased. Many different methods for using microphone arrays have been proposed that can be classified into two main approaches: systems that perform in two independent stages of array processing and then recognition and systems that use array processing to generate a sequence of features which maximize the likelihood of generating the correct hypothesis in recognition phase. Following second approach, in this paper a new method for microphone array processing is proposed in which the parameters of array processing are adjusted in calibration phase based on phones used in language and maximum likelihood method. Optimized filter parameters are stored and used during recognition phase. A new modified Viterbi algorithm using optimal phone-based filter parameters is used for recognition phase. The proposed algorithm is analytically formulated and Persian language is used to find any improvement in speech recognition accuracy compared with results of delay and sum and utterance-based filter and sum algorithms. The results show 12.2% improvement in accuracy compared to utterance-based algorithm. 相似文献

18.

Optimal Design of Nearfield Wideband Beamformers Robust Against Errors in Microphone Array Characteristics 总被引：1，自引：0，他引：1

Huawei Chen Wee Ser Zhu Liang Yu 《IEEE transactions on circuits and systems. I, Regular papers》2007,54(9):1950-1959

Nearfield wideband beamformers for microphone arrays have wide applications, such as hands-free telephony, hearing aids, and speech input devices to computers. The existing design approaches for nearfield wideband beamformers are highly sensitive to errors in microphone array characteristics, i.e., microphone gain, phase, and position errors, as well as sound speed errors. In this paper, a robust design approach for nearfield wideband beamformers for microphone arrays is proposed. The robust nearfield wideband beamformers are designed based on the minimax criterion with the worst case performance optimization. The design problems can be formulated as second-order cone programming and be solved efficiently using the well-established polynomial time interior-point methods. Several interesting properties of the robust nearfield wideband beamformers are derived. Numerical examples are given to demonstrate the efficacy of the proposed beamformers in the presence of errors in microphone array characteristics. 相似文献

19.

会议电视系统中自动声学定位原理应用

王敏庆宋代科行晓亮《电声技术》2007,31(3):11-13

建立了会议电视系统自动声学定位模型。讨论了利用传声器阵列估计与会者方位角的问题。分析了时延估计的方法,给出目标方位角、信号带宽、信噪比等因素对定位误差量的影响并提出了减小误差的途径。最后讨论了实验仿真结果,证明了所提出方法的有效性和可行性。相似文献

20.

A multichannel subspace approach with signal presence probability for speech enhancement

Hong Jungpyo 《Multidimensional Systems and Signal Processing》2019,30(4):2045-2058

Multidimensional Systems and Signal Processing - For the last few decades, speech enhancement based on microphone arrays has primarily utilized prior information about system models, e.g., array... 相似文献