首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 203 毫秒
1.
多通道子空间算法在说话人识别中的应用   总被引:2,自引:2,他引:0       下载免费PDF全文
关海欣  曾庆宁 《声学技术》2008,27(3):396-402
深入研究了基于多通道信号子空间的语音增强算法原理,对算法中各个参数对性能的影响进行了深入剖析.同时给出一种选取噪声方差的简单且有效的方法,并通过研究分析,证明多通道信号子空间算法不仅消噪明显而且对语音的损伤微小,而且相比于单通道子空间语音增强算法除了性能上的提升外,还没有导致计算量的增加。最后将多通道子空间语音增强算法用于说话人识别系统.并与其它多通道语音增强算法(延迟求和波束形成、波束形成后维纳滤波、线性约束最小方差波束形成)进行了对比.实验表明多通道信号子空间语音增强算法在多种噪声环境下均可有效的提高说话人识别系统的识别性能。  相似文献   

2.
后端滤波处理是多通道语音增强系统中一种比较常用的技术,其目的是为了进一步提高语音增强系统的性能,提高波束形成后的输出信噪比。但是,常用的后滤波方法需要相当繁琐的参数调整过程才能实现噪声抑制和语音质量之间的合理权衡。本文提出一种基于最小方差无畸变(MVDR)波束形成和生成对抗深层神经网络相结合的多通道语音增强算法。前端使用波束形成器对信号进行初步增强;后端滤波处理采用生成对抗深层神经网络,避免了繁琐的参数调整过程。实验系统是通过MATLAB和Tensor Flow仿真实现,结果证明了该方法的有效性。  相似文献   

3.
邱作春  曾庆宁 《声学技术》2008,27(1):119-125
介绍了自适应宽带波束形成和快速独立分量分析的基本理论和算法,分析了固定波束形成的理论局限性及自适应宽带波束形成的优越性。提出了一种基于自适应波束形成和独立分量分析的消噪系统,算法显著地抑制了噪声、增强了语音,又具有稳定快速的性能。同时分析了自适应波束形成单元数或者输入信号数对算法性能的影响,对实际应用具有指导意义。  相似文献   

4.
0引言超指向性波束形成方法能获得比常规方法更好的指向性。文献[1]已经证明,当阵元间距无穷小时,M元端射直线阵的指向性因子能达到2M,即所谓的2M规律,可见超指向性的巨大潜力。对于实际中常用的圆环形阵列,文献[2]给出了高阶超指向性的精确闭式解,指出最优波束和最大指向性因子都可以分别表达为各阶特征波束及其指向性因子叠加和的形式,并且高阶特征波束指向性高而稳健性差。对于指向性因子,文献[2]数值计算了半径波长比趋于0时各阶特征波束所能达到的极大值。  相似文献   

5.
针对噪声环境下语音识别率急剧下降的问题,提出了一种基于语音时频域稀疏性原理的改进最小方差无畸变响应波束形成与改进维纳滤波结合的算法。该算法首先利用麦克风阵列语音信号的空间信息,通过基于时频掩蔽的改进最小方差无畸变响应波束形成器,增强目标声源方向的语音信号,抑制其他方向噪声的干扰,然后再使用改进的维纳滤波器去除残留噪声并提高语音可懂度,对增强后的语音信号提取梅尔频率倒谱系数作为特征参数,使用隐马尔可夫模型搭建语音识别系统。实验结果表明,该方法能够有效提高低信噪比环境下的语音识别率,具有较好的鲁棒性。  相似文献   

6.
许铭  王冬霞  周城旭  张伟 《声学技术》2019,38(5):560-567
针对单通道非负矩阵分解语音增强算法忽略相位信息的问题,提出了一种改进的Kullback-Leibler复非负矩阵分解的语音增强算法。该算法考虑到传统非负矩阵分解算法在复频域中增强语音时目标函数的影响,构建了一种适用于复频域的Kullback-Leibler散度下的目标函数,同时采用频谱一致性约束相位谱补偿算法,使其重构出的语音数据相位谱得到进一步的调制。实验结果表明,对于不同的非平稳噪声,所提出的算法在不同信噪比下均取得了较好的语音增强效果,尤其在低信噪比条件下(0 dB以下)语音增强效果较为明显,性能评估指标的增量较高,较好地克服了由传统相位谱补偿算法造成的信源失真率较低的缺点,进一步减少失真,抑制背景噪声,实现语音增强。  相似文献   

7.
旁瓣约束方向不变恒定束宽波束自适应综合   总被引:1,自引:0,他引:1       下载免费PDF全文
幸高翔  蔡志明 《声学技术》2009,28(2):172-175
将自适应加权方法应用于波束图的主瓣控制研究,提出了方向不变恒定束宽波束形成算法。在波束图旁瓣区域引入若干虚拟干扰源,自适应调整干扰强度,改变波束形状。以主瓣某一指向的波束宽度为参考,以每次迭代后波束图最低旁瓣峰值与主瓣峰值的差作为下次迭代运算的预设主旁瓣比,在保持主瓣区域宽度不变的情况下,用自适应综合的方法获得不同主瓣指向上的最低均匀旁瓣。将该算法应用于均匀线阵和半球面阵,均在±60°的范围内得到了方向不变恒定束宽波束。研究表明,该算法不仅适用于均匀线列阵,也可用于任意结构阵列。  相似文献   

8.
毛维  曾庆宁  龙超 《声学技术》2018,37(3):253-260
针对复杂噪声环境下识别性能显著降低的问题,提出一种用于说话人识别系统前端的双微阵列语音增强算法。该算法采用的是相干滤波和频域宽带最小方差无畸变响应波束形成器后置结合改进的维纳滤波器。其基本原理是首先求出双微麦克风阵列信号中两个相邻通道间的相干函数,再利用通道间信号的相干性来进行初始噪声抑制。其次,通过一个频域宽带最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成器保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音质量。最后,使用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和伽马通滤波器组频率倒谱系数(Gammatone Filter-bank Frequency Cepstral Coefficients,GFCC)对增强后的语音信号做特征参数提取并进行说话人识别。仿真过程采用声学人工头模拟双耳采集数据,实验结果表明,该语音增强算法在复杂噪声环境下能够获得较好的增强效果,能有效提升说话人识别系统的识别率。  相似文献   

9.
空间飞行器内空间狭小,存在较大的语音混响现像,飞行器内乘员不带专用耳戴进行语音通话时,混响信号影响通话质量。利用声源方位的信号进行语音增强的方法可以抑制混响的干扰,获得较好的通话效果。常用的声源定位算法由于受混响的影响,很难对乘员的语音进行有效地定位。通过研究空间飞行器的语音传输特性,提出了基于相关系数波束形成算法,该算法利用波形的相似性来抑制混响的干扰。实验证明:算法具有较好的声源定位效果,为语音增强提供声源方位参数。  相似文献   

10.
驾驶员语音增强质量的评价指标是保证语音增强算法性能的关键,而现有的语音增强质量评价方法不能准确地反映人对声音感知的主观性。针对上述问题,分析了言语可懂度指数对语音增强算法评价的适用性,并在某品牌汽车上进行实验。通过在汽车内建立均匀线性传声器阵列来对驾驶员语音进行信号采集,然后利用波束形成算法对阵列中不同传声器组合的语音信号进行增强,得到汽车在不同行驶速度时不同阵列组合的语音增强结果。使用信噪比和言语可懂度指数分别对实验得到的语音增强结果进行评价,结果表明言语可懂度指数更适合评价汽车内驾驶员的语音增强算法的性能。  相似文献   

11.
康峥  黄志华  赖惠成 《声学技术》2022,41(6):862-870
随着压缩感知的深入研究,压缩感知在语音增强方面的应用也备受关注。针对传统压缩感知语音增强算法中存在的不足,将压缩感知与深度学习结合构建名为基于深度压缩感知的语音增强模型(Speech Enhancement based on Deep Compressed Sensing, SEDCS)。基于压缩感知原理使用编解码模型代替压缩感知中语音信号稀疏过程,使用卷积神经网络代替测量矩阵实现语音信号观测降维过程,通过联合训练的方式实现语音增强。实验结果表明:该模型能够完成语音增强任务,并且与现有的压缩感知语音增强算法相比,该模型能取得较好的语音增强效果;相比利用深度学习的语音增强算法,该模型虽性能一般,但在模型泛化性能和测试阶段的增强时间效率上有一定提升。  相似文献   

12.
单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。  相似文献   

13.
介绍语音增强的原理和从强噪声背景中提取语音信号的方法,并对基于减谱法的增强算法、基于自适应滤波法的增强算法和基于小波变换的增强算法进行对比研究。鉴于语音增强算法的两个目标即增强语音的清晰度与理解度并不是相关联的,有时甚至相互矛盾,因此任何一个语音增强算法都是根据不同的应用做适当的选择和折衷。基于此,对三种算法进行仿真实验的比较研究,实验结果证明应用小波变换的语音增强算法比其它的方法更有效。  相似文献   

14.
鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽(Equivalent Rectangular Bandwidth,ERB)子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。  相似文献   

15.
增益-波形乘积码书结构广泛用于 CELP 语音编码算法, 它们使用 Levinson-Durbin(L-D)方法更新增益滤波器系数. 本文对 BP 神经网络算法与 L-D 方法进行了比较. 用 BP 神经网络增益滤波器进行语音编码, 其计算量仅为 G.728 的 L-D 方法的 6.7%, 但平均分段 SNR 高出 G.728 算法 0.156 dB. 同时, 用 BP 神经网络算法评价了 16 和 20 样点激励矢量增益滤波器, 效果同样很好. 但是, 由于考察增益预测器时量化器还不存在, 因此无法用量化信噪比评价滤波器性能. 本文提出一种信噪比估计方法, 可使增益预测器的优化与量化问题分开处理. 实验表明用这种信噪比估计方法选择增益滤波器十分有效.  相似文献   

16.
芮功兵 《声学技术》2013,32(1):11-14
在水下电报、远程控制、语音和图像传递等水声通信技术中,由于海洋水声信道是一个时变、频变、空变的非平稳随参信道,使得水声信道的传输速率低、频率资源利用率有限、码间干扰严重、误码率高。针对海洋水声信道的特点,描述如何利用基阵声纳的多通道结构,来实现多通道分集与联合均衡,从而减小多途效应引起的水声通信中的码间干扰,使得陆地移动通信系统中的一些先进技术能够在此基础上得到应用,并为现有的目标探测声纳增加水声通信功能提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号