期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

毛维曾庆宁龙超《声学技术》2018,37(3):253-260

针对复杂噪声环境下识别性能显著降低的问题,提出一种用于说话人识别系统前端的双微阵列语音增强算法。该算法采用的是相干滤波和频域宽带最小方差无畸变响应波束形成器后置结合改进的维纳滤波器。其基本原理是首先求出双微麦克风阵列信号中两个相邻通道间的相干函数,再利用通道间信号的相干性来进行初始噪声抑制。其次,通过一个频域宽带最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成器保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音质量。最后,使用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和伽马通滤波器组频率倒谱系数(Gammatone Filter-bank Frequency Cepstral Coefficients,GFCC)对增强后的语音信号做特征参数提取并进行说话人识别。仿真过程采用声学人工头模拟双耳采集数据,实验结果表明,该语音增强算法在复杂噪声环境下能够获得较好的增强效果,能有效提升说话人识别系统的识别率。相似文献

2.

低信噪比环境下的语音识别方法研究

下载免费PDF全文

王群曾庆宁谢先明郑展恒《声学技术》2017,36(1):50-56

单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。相似文献

3.

基于MVDR参数谱特征提取的语音识别

吴名钊马震李建磊陈延萍《声学与电子工程》2009,(2)

介绍了最小方差无失真响应建模方法,并与线性预测方法进行了比较,比较发现最小方差无失真响应滤波器能提供一个更好的原始语音包络。进而将MVDR参数提取方法应用于ICA中,并与基于传统LP的ICA方法的语音识别性能进行了比较,对结果进行了分析。相似文献

4.

一种适用于低信噪比条件的DOA估计方法 总被引：1，自引：0，他引：1

邢超陈克安张成《声学技术》2010,29(4):380-384

波达方向（Direction of Arrival,DOA）估计技术是信号处理中一个非常活跃的研究领域。但是无论传统的波束形成技术还是现代谱估计技术均适应于高信噪比的环境,当信噪比较低时,这些方法的波达方向（DOA）估计性能急剧下降。根据信号在时间上的强相关性和噪声在时间的弱相关性,提出了一种协方差矩阵的重构方法,该方法能够明显地提高协方差矩阵的信噪比。将新的协方差矩阵应用到最小方差无畸变响应（Minimum Variance Distortionless Re-sponse,MVDR）算法进行DOA估计,改善了传统MVDR算法在低信噪比条件下的DOA估计性能。计算机仿真和定向实验均表明在信噪比较低的环境中可以进行高精度的DOA估计。相似文献

5.

无方位模糊的非均匀稀疏阵MVDR测向方法

李倩茹宋志杰王良杨晴《声学技术》2015,34(5):389-394

稀疏阵能够获得更大的阵列孔径,但常规波束形成(Conventional Beam-Forming,CBF)对非均匀稀疏阵测向时会出现方位模糊。提出了一种基于最小方差无畸变响应(Minimal Variance Distortionless Response,MVDR)同局部非稀疏的非均匀稀疏阵(Non-Uniform Sparse Array,NUSA)的设计相结合来抑制方位模糊的方法(NUSA+MVDR),对其无方位模糊现象进行了理论分析,表明MVDR这一非线性处理方法对伪峰有很好的抑制能力。针对一种典型的NUSA(Typical NUSA,TNUSA),进行了TNUSA+MVDR数值仿真实验,其结果和理论分析一致,表明:1 MVDR有很强的NUSA检测能力,在所给仿真条件下,等效阵元间距为50倍波长时,仍能很好地抑制方位模糊;2TNUSA+MVDR较阵元数相同的均匀非稀疏阵列的CBF和MVDR有更高的方位分辨力;3阵元数一定,TNUSA+MVDR方位分辨力随着等效间距增加而提高,最小可分辨角度反比于等效间距;4等效间距一定,TNUSA+MVDR方位分辨力随阵元数增加而增加。海上实验在等效阵元间距为10倍波长条件下部分验证了NUSA+MVDR的检测性能。相似文献

6.

一种强背景噪声下语音识别方案

林娟李雪耀《声学与电子工程》1999,(1):38-40

本文提出了一种在高背景噪声下进行语音识别的方案,即利用两个话筒的采集系统,一个采集带噪语音,另一个采集噪声。处理后的语音含有明显的“音乐噪声”,再采用时频滤波将其去掉。相似文献

7.

鲁棒性语音识别的在线自适应匹配

阮玲英《硅谷》2010,(24):14-14,109

语音识别的一个最重要的领域就是鲁棒性问题,这个问题的核心是如何处理训练和识别不匹配的问题。提出一个在线自适应匹配算法,此算法能够根据当前语音信号,自适应的估计出语音畸变参数,从而调正模型来匹配当前的测试环境,在Aurora2测试集上,正确率显著提升。相似文献

8.

鲁棒性语音识别的在线自适应匹配

阮玲英《硅谷》2009,(24)

语音识别的一个最重要的领域就是鲁棒性问题,这个问题的核心是如何处理训练和识别不匹配的问题。提出一个在线自适应匹配算法,此算法能够根据当前语音信号,自适应的估计出语音畸变参数,从而调正模型来匹配当前的测试环境,在Aurora2测试集上,正确率显著提升。相似文献

9.

阵列信号维纳滤波用于主动声呐图像增强处理

下载免费PDF全文

陈敬军范威《声学技术》2021,40(6):858-863

声呐图像的噪声背景抑制是提高水下目标检测能力的重要问题.针对声呐图像背景斑点噪声强、目标轮廓模糊、目标回波对比度低等问题,利用确定性目标回波信号与随机分布的干扰噪声之间的相关统计特性差异,采用基于最小均方差准则的阵列信号维纳滤波器,通过主动最小方差无畸变响应(Minimum Variance Distortionles... 相似文献

10.

海洋资料浮标声学特征采集系统设计

下载免费PDF全文

王麟煜黄海宁郑恩明陈新华《声学技术》2019,38(5):508-513

为利用我国现有的10 m大型资源浮标,实现对海上侵权船只进行探测和识别,介绍了一种加装在浮标上的声学特征采集系统设计。该系统设计包括声学基阵设计,信号采集处理机设计,目标探测与方位估计算法和声学基阵方位补偿方法等。2014年6月进行了一次湖上试验,试验结果表明：声学特征采集系统的硬件可靠,目标探测、方位估计和方位补偿算法有效。该系统已在我国特定敏感区域开展的维权执法目标探测识别与信息传输技术的信息综合监视中示范应用。相似文献

11.

语音识别方法在水下目标识别中的应用

曾渊李钢虎赵亚楠苗雨《声学技术》2012,(5):530-534

水下目标识别是潜艇在海战中,先敌发现并有效进行水声对抗的关键技术。然而,如何根据声纳接收到的舰船辐射噪声对三类目标进行分类识别是长期困扰人们的问题。研究了四种语音识别中常用的方法——线性预测系数（LPC）,线性预测倒谱系数（LPCC）,美尔倒谱系数（MFCC）和最小均方无失真响应（MVDR）,在水下目标识别中的应用效果,并比较了这四种方法在无噪声情况下的识别概率,以及在不同信噪比下的识别概率,并通过比较找到在无噪声和有噪声情况下的最佳方法。实验表明,在无噪声的情况下,MFCC方法总体识别率最高,第一类目标MFCC方法的识别率最高,第二类目标MFCC和MVDR方法识别率相似,好于其他两者,第三类目标MVDR方法识别率最高。在加入噪声的情况下,MVDR方法对三类目标的识别和抗噪声性能明显好于其余三者。相似文献

12.

一种低信噪比环境下的语音端点检测算法

下载免费PDF全文

卜玉婷曾庆宁郑展恒《声学技术》2020,39(5):592-602

端点检测技术是语音信号处理的关键技术之一，为提高低信噪比环境下端点检测的准确率和稳健性，提出了一种非平稳噪声抑制和调制域谱减结合功率归一化倒谱距离的端点检测算法。该算法首先通过抑制非平稳噪声再采用调制域谱减消除残余噪声来提升信噪比，减少语音失真。然后再提取每帧信号的功率归一化倒谱系数，计算每帧信号与背景噪声的功率归一化倒谱距离。最后将该倒谱距离作为检测参数，采用双门限判决方法进行端点检测。实验结果表明，该端点检测算法对语音帧和噪声帧具有较好的区分性。此外，在低信噪比环境下，所提出的算法对于不同类型的噪声都具有较好的稳健性。相似文献

13.

噪声环境下语音识别方法的研究

商敏红赵力邹采荣《声学技术》2005,24(Z1):127-128

1引言语音识别的性能常常与环境背景噪声等的干扰有密切关系A[1],这些都是语音识别的识别率得不到进一步提高的主要因素. 相似文献

14.

Fuzzy clustering based parameter clustering method in mandarin speech recognition

Xianghua Xu Jie Zhu Qiang Guo 《中国工程学刊》2013,36(5):887-891

Abstract

In a large vocabulary continuous speech recognition system, to efficiently decrease parameter size and improve the robustness of parameter training, a parameter clustering method by fuzzy clustering is proposed. Based on the structure of the phonetic decision tree, leaf nodes are used for Gaussian clustering and root nodes or shallow leaf nodes are used for covariance sharing. Experimental results show that when the number of Gaussians is reduced by 50%, recognition accuracy only decreases by 0.55%. By combining fuzzy covariance sharing, a total of 4.16% in recognition increase is achieved over the conventional system with approximately the same parameter size. 相似文献

15.

A comparative study on the performance of several speech recognition techniques applied on the highly confusing mandarin syllables

Hung‐Yan Gu Lin‐Shan Lee Chiu‐Yu Tseng 《中国工程学刊》2013,36(6):705-713

Abstract

In this paper, the performance of several speech recognition techniques applied on the highly confusing Mandarin syllables were carefully compared, including dynamic time warping (DTW), the newly proposed DTW with superimposed weighting function (DTWW), the discrete hidden Markov models (DHMM) and the continuous hidden Markov models (CHMM). The vocabulary used here consists of 409 first tone isolated Mandarin syllables. Due to the fact that many confusing sets exist in this vocabulary, the accurate recognition of these syllables is relatively difficult, and all the recognition experiments were performed in the speaker dependent mode. After a series of 13 experiments, it was found that the recognition rate of the newly proposed DTWW (88.3) is higher than that of DTW (85.1), DHMM (65.0) and CHMM (83.9), and that the CPU time used for DTWW is 1.03 times that for DTW, 24 times that for DHMM and 4.3 times that for CHMM. In addition, the memory space required for DTWW and DTW is 3.4 times that of DHMM and 8.5 times that of CHMM. Therefore, DTWW has the highest recognition rate, DHMM has the fastest recognition speed, whereas CHMM appears to be very attractive when all the different factors including recognition rate, recognition speed and memory space requirement are considered. 相似文献

16.

汽车内驾驶员语音增强评价研究

下载免费PDF全文

景亚鹏苏海涛王绍桂文华郭庆王明杰《声学技术》2021,40(6):832-838

驾驶员语音增强质量的评价指标是保证语音增强算法性能的关键,而现有的语音增强质量评价方法不能准确地反映人对声音感知的主观性.针对上述问题,分析了言语可懂度指数对语音增强算法评价的适用性,并在某品牌汽车上进行实验.通过在汽车内建立均匀线性传声器阵列来对驾驶员语音进行信号采集,然后利用波束形成算法对阵列中不同传声器组合的语音... 相似文献