期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

邱作春曾庆宁《声学技术》2008,27(6):863-866

独立分量分析方法能够将线性混合信号进行分离,得到统计独立的源信号,能用于提取组合语音的特征基函数。倒谱矢量符合ICA变换的假设条件,用ICA方法对MFCC特征进行转换得到ICA特征基,继而用于说话人识别,建立了一个基于独立分量分析的说话人识别系统。实验结果表明,在噪声环境下此系统具有更高的识别率。相似文献

2.

飞机舱音背景声下语音增强技术

下载免费PDF全文

雷鸣程洪炳李学仁《振动与冲击》2010,29(3):63-66

有效提取飞机舱音背景声下的语音信息对飞行事故调查十分重要。提出一种适用于飞机座舱噪声环境下的语音增强方法。以卡方分布作为纯语音谱幅值的先验模型,采用最小均方误差短时谱估计法对带噪语音中的纯语音谱进行估计,误差估计方程中采用权值函数对估计值进行非线性加权。在仿真试验中利用语音质量的客观评价标准选取适合于舱音背景声下的纯语音谱估计参数,使增强语音中噪声抑制和语音失真之间达到平衡。最后将提出的语音增强方法与目前典型方法进行了对比实验,验证算法的有效性。相似文献

3.

基于MFCC和SVM的车窗电机异常噪声辨识方法研究

刘思思谭建平易子馗《振动与冲击》2017,36(5):102-107

为提高车窗电机异常噪声特征提取的有效性及分类识别的准确性,提出一种以优化的梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)为特征值,以支持向量机(Support Vector Machine,SVM)为噪声辨识模型的电机异常噪声辨识方法。在MFCC提取方法基础上,针对频谱泄漏,用Hanning自卷积窗代替Hanning窗,获得优化的MFCC,并将其作为特征值输入到SVM进行异常噪声辨识。为提高SVM判别准确率,采用人工蜂群算法实现SVM参数选择优化。实验结果表明,该方法能够有效判别电机是否存在异响,准确率达到91%。相似文献

4.

双微阵列语音增强算法在说话人识别中的应用

下载免费PDF全文

毛维曾庆宁龙超《声学技术》2018,37(3):253-260

针对复杂噪声环境下识别性能显著降低的问题,提出一种用于说话人识别系统前端的双微阵列语音增强算法。该算法采用的是相干滤波和频域宽带最小方差无畸变响应波束形成器后置结合改进的维纳滤波器。其基本原理是首先求出双微麦克风阵列信号中两个相邻通道间的相干函数,再利用通道间信号的相干性来进行初始噪声抑制。其次,通过一个频域宽带最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成器保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音质量。最后,使用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和伽马通滤波器组频率倒谱系数(Gammatone Filter-bank Frequency Cepstral Coefficients,GFCC)对增强后的语音信号做特征参数提取并进行说话人识别。仿真过程采用声学人工头模拟双耳采集数据,实验结果表明,该语音增强算法在复杂噪声环境下能够获得较好的增强效果,能有效提升说话人识别系统的识别率。相似文献

5.

基于均值特征和改进深度神经网络的说话人识别算法

下载免费PDF全文

罗春梅张风雷《声学技术》2021,40(4):503-507

为提高神经网络在说话人识别应用中的识别性能,提出基于高斯增值矩阵特征和改进深度卷积神经网络的说话人识别算法。算法首先通过最大后验概率提取基于梅尔频率倒谱系数（Mel Frequency Cepstrum Coefficient,MFCC）特征的高斯均值矩阵,并对特征进行噪声适应性补偿,以增强信号的帧间关联和说话人特征信息,然后采用改进的深度卷积神经网络进一步对准帧间信息,以提高说话人识别特征对背景噪声的适应性。实验结果表明,相比于高斯混合模型-通用背景模型等识别框架及传统MFCC等特征,该算法可取得更高的识别准确率和最小的识别均方误差。相似文献

6.

低信噪比环境下的语音识别方法研究

下载免费PDF全文

王群曾庆宁谢先明郑展恒《声学技术》2017,36(1):50-56

单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。相似文献

7.

基于ICA的多人脚步声信号分离和识别

周文军徐彭韩亮亮曹淑斌苗春静《中国科技博览》2012,(33):403-403

独立分量分析方法能够将线性混合信号进行分离得到统计独立的源信号,能用于提取脚步声信号的特征基函数。倒谱矢量符合ICA变换的假设条件。用ICA方法对MFCC特征进行转换得到ICA特征基继而用于脚步声先好的分离。实验结果表明在噪声环境下此系统具有一定的识别率。相似文献

8.

基于卷积神经网络和Transformer网络的鸟声识别

下载免费PDF全文

王基豪周晓彦李大鹏韩智超王丽丽《声学技术》2023,42(5):675-683

针对传统鸟声识别算法中特征提取方式单一、分类识别准确率低等问题,提出一种结合卷积神经网络和Transformer网络的鸟声识别方法。该方法综合考虑网络局部特征学习和全局上下文依赖性构造,从原始鸟声音频信号中提取短时傅里叶变换(Short Time Fourier Transform,STFT)语谱图特征,将其输入到卷积神经网络(ConvolutionalNeural Network,CNN)中提取局部频谱特征信息,同时提取鸟声信号的对数梅尔特征及一阶差分、二阶差分特征用于合成梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)混合特征向量,将其输入到Transformer网络中获取全局序列特征信息,最后融合所提取的特征可得到更丰富的鸟声特征参数,通过Softmax分类器得到鸟声识别结果。在Birdsdata和xeno-canto鸟声数据集上进行实验,平均识别准确率分别达到了97.81%和89.47%。实验结果表明该方法相较于其他现有的鸟声识别模型具有更高的识别准确率。相似文献

9.

分谱处理算法在基于超声导波损伤识别中的应用

下载免费PDF全文

苗晓婷；李富才；孟光《振动与冲击》2012,31(1):5-10,34

利用分谱处理（SSP）算法,通过比较基准波信号和检测波信号的瞬时相位变化度（IPVD）来评估损伤散射的基础阶对称（S0）模式的飞行时间（ToF）,最终实现基于超声导波的损伤识别。首先在理想的工作环境中（无噪声）,对无缺陷的铝板进行检测,并把所采集的波信号作为基准信号。然后在不同的工作环境中（无噪声和有噪声）检测带有切缝缺陷的铝板,并把所采集的波信号作为检测信号。实验结果表明,当检测波信号的信噪比较低时,噪声能量严重干扰了检测波信号的能量分布。然而,SSP算法所提取的检测波信号的IPVD几乎不受噪声的干扰,因此利用SSP算法能够有效地抵抗强噪声的干扰,精确地评估损伤散射的S0模式的ToF,并进一步结合三角定位算法成功地定位出铝板中的切缝缺陷。相似文献

10.

基于卷积盲源分离的噪声鲁棒性语音识别的研究 总被引：1，自引：0，他引：1

下载免费PDF全文

王振力刘志华白志强《声学技术》2009,28(3):276-279

研究了一种基于卷积盲分离算法与MFCC（Mel-Frequency Cepstral Coefficient）特征相结合的噪声鲁棒语音识别方法。该方法在预处理阶段,首先计算预白化观测数据的多阶自相关协方差矩阵,以获得多时延处理的二阶解相关统计信息。然后利用得到的二阶统计信息构建两个对称正定矩阵,通过Cholesky因式分解等一系列变换获得唯一存在的矩阵,根据此矩阵估算语音信号并提取MFCC特征用于后续识别。实验结果表明,在低信噪比条件下,该方法对于数字语音的识别性能优于基本的MFCC识别器和文献中已有的卷积分离算法。相似文献

11.

噪声谱估计算法对语音可懂度的影响

张建伟陶亮周健王华彬《声学技术》2015,34(5):424-430

噪声谱估计是单通道语音增强算法的关键步骤,当前大部分语音增强算法旨在提高语音质量,提高语音可懂度的算法却很少。在传统的单通道语音增强算法中,语音质量的提高往往是以牺牲语音的可懂度为代价的。对目前主流的几种噪声谱估计算法对语音可懂度影响进行分析。在不同噪声背景、不同信噪比情况下进行噪声谱估计,并采用谱减法对含噪语音信号作去噪处理,对比分析不同噪声、不同信噪比下增强前后语音的短时客观可懂度(Short-Time Objective Intelligibility,STOI)值,最后根据信噪比,对比分析了不同噪声环境下,语音增强前后语音能量高于噪声能量的时频块所占比例。实验表明,相比其他噪声估计算法,最小统计(Minima Statistics,MS)算法由于保留了更多的以语音能量为主的时频块,使得去噪后的语音有较高的可懂度。相似文献

12.

改进的最小均方误差语音增强算法的研究

下载免费PDF全文

张鑫琪冯海泓徐海东《声学技术》2008,27(2):230-234

针对传统最小均方误差谱幅度估计（MMSE—STSA．minimum mean-square error-short time spectral amplitude）语音增强算法无法有效的跟踪非平稳噪声变化的问题,对一种改进的MMSE-STSA语音增强算法进行了研究和仿真。该算法对背景噪声的估计利用加权噪声估计方法：采用一个非线性函数根据带噪语音信噪比（SNR．signal—to-noise ratio）的变化计算得到相应的加权因子并作用于带噪语音信号,对加权的带噪语音求平均得到估计的背景噪声。算法中的谱增益修正,还可以抑制低信噪比时的残留噪声以及避免对带噪语音的过抵消。实验结果表明,该方法能很好的跟踪非平稳噪声的变化,不仅在增强性能上有很好的效果,同时降低了语音的失真。相似文献

13.

一种快速自适应噪声谱估计方法

下载免费PDF全文

焦人杰侯丽敏《声学技术》2007,26(4):735-740

提出了一种快速自适应的噪声谱估计方法。该方法在Doblinger和Cohen的噪声谱估计方法基础上,提出了改进算法,修正了带噪语音子带中语音存在的判断门限和噪声谱更新公式,估计的噪声谱既能快速适应背景噪声变化,又能保证准确性。实验结果表明,结合文中噪声谱估计方法构成的语音增强系统能有效抑制带噪语音中平稳和非平稳噪声,对于噪声突变的情况也适用。相似文献

14.

一种高效的弱目标线谱检测算法

下载免费PDF全文

罗斌王茂法王世闯《声学技术》2017,36(2):171-176

为实现弱目标线谱检测,在自适应线谱增强(Adaptive Line Enhancement,ALE)算法的基础上,结合频域批处理技术,提出了一种能降低计算量的高效线谱检测算法——归一化频域批处理最小均方(Normalized Frequency-domain Block Least Mean Square,NFBLMS)算法;所提NFBLMS算法在权值迭代过程中,步长参数不受输入信号功率的影响。理论分析和数值仿真结果表明:相比于已有的线谱检测算法,NFBLMS算法能较好地解决ALE算法实时处理运算量问题,并可获得较高的系统增益,且其步长参数具有较强的鲁棒性,能同时兼顾算法的收敛速度和稳态误差。因此NFBLMS算法更适合实际工程应用。相似文献

15.

Cutting force denoising in micro-milling tool condition monitoring

K. Zhu Y. S. Wong W. Wang 《国际生产研究杂志》2013,51(16):4391-4408

An independent component analysis (ICA) algorithm for cutting force denoising was applied in micro-milling tool condition monitoring. In micro-milling, the comparatively small cutting force signal is prone to contamination by relatively large noise, and as a result it is important to denoise the force signal before further processing it. However, the traditional denoising methods, based on Gaussian noise assumption, lose here because the noise is identified as containing a high non-Gaussian component in the experiment. ICA was recently developed to deal with the blind source separation (BSS) problem. It solves the BSS problem by measuring the non-Gaussianity of the signal and it is particularly effective in the separation of non-Gaussian signals. This approach employs fixed-point ICA (FastICA), assuming the noises are sources and the force signal is an instantaneous mixture of sources and by treating the signal denoising process as a BSS. The results are illustrated both in time and frequency domains. The FastICA denoising performances are compared with the popular wavelet thresholding. The results show that FastICA performs better than wavelet. Theoretical discussion of the nature of ICA and wavelet thresholding supports the results: ICA separates both Gaussian and non-Gaussian noise sources, while wavelet only suppresses Gaussian noise. 相似文献

16.

基于双耳语音分离和丢失数据技术的鲁棒语音识别算法

下载免费PDF全文

周琳赵一良朱竑谕汤一彬《声学技术》2019,38(5):545-553

鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽（Equivalent Rectangular Bandwidth,ERB）子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。相似文献

17.

基于DBLSTM-DCNN的骨导和气导语音转换

下载免费PDF全文

储有亮李梁《声学技术》2021,40(6):815-821

为了解决人们在强噪声环境下,通过空气途径传递的语音信号会严重失真的问题,提出了一种基于深层双向长短期记忆-深度卷积神经网络（Deep Bidirectional Long and Short Term Memory-Deep Convolutional Neural Network,DBLSTM-DCNN）的骨导语音转气导语音的语音转换模型。该模型利用DBLSTM层收集和保存相邻连续帧的隐藏信息,再通过DCNN层来提取频域方面的特征信息,可以很好地解决由于骨导语音高频成份严重缺失导致的转换语音不够自然的问题。实验结果表明,该模型的语音质量感知评价（Perceptual Evaluation of Speech Quality,PESQ）、短时客观可懂度（Short-Time Objective Intelligibility,STOI）、对数谱距离（Log-spectral Distance,LSD）等客观评价指标均有良好的表现,证明了该模型在骨导语音转气导语音方面具有较好的转换效果。相似文献

18.

基于VMD和窄带包络相关的船舶辐射噪声改进DEMON分析

下载免费PDF全文

倪俊帅胡长青赵梅吕国涛郭政《声学技术》2023,42(6):701-708

船舶辐射噪声的包络谱中蕴含着轴频和桨叶数等船舶固有特征信息,对船舶目标识别具有重要意义。为了提高船舶辐射噪声包络谱解调性能,提出了基于变分模态分解(Variational Mode Decomposition, VMD)和窄带包络相关的改进DEMON分析方法。首先利用VMD算法代替传统带通滤波器,将船舶辐射噪声信号分解为若干个子带;然后对各子带进行希尔伯特(Hilbert)检波并计算平均窄带包络相关系数,用于衡量信号的包络调制在频域上的非均匀性;最后提取各子带信号包络谱并按照平均窄带包络相关系数进行加权融合,从而得出宽带噪声信号的包络谱。利用该方法对实测不同类型和不同航速船舶辐射噪声信号进行了处理,结果均表明所提方法能有效提高包络谱解调效果,较传统方法更为有效。相似文献

19.

改进的Kullback-Leibler复非负矩阵分解语音增强算法

下载免费PDF全文

许铭王冬霞周城旭张伟《声学技术》2019,38(5):560-567

针对单通道非负矩阵分解语音增强算法忽略相位信息的问题，提出了一种改进的Kullback-Leibler复非负矩阵分解的语音增强算法。该算法考虑到传统非负矩阵分解算法在复频域中增强语音时目标函数的影响，构建了一种适用于复频域的Kullback-Leibler散度下的目标函数，同时采用频谱一致性约束相位谱补偿算法，使其重构出的语音数据相位谱得到进一步的调制。实验结果表明，对于不同的非平稳噪声，所提出的算法在不同信噪比下均取得了较好的语音增强效果，尤其在低信噪比条件下（0 dB以下）语音增强效果较为明显，性能评估指标的增量较高，较好地克服了由传统相位谱补偿算法造成的信源失真率较低的缺点，进一步减少失真，抑制背景噪声，实现语音增强。相似文献

20.

基于独立分量分析的高速微铣削力混合信号噪声分离方法

李一全孙岳董山恒于占江于化东许金凯《中国测试》2013,(2):6-9,13

为得到高速微铣削力的真实信号,并且准确识别各激励源,对微铣削力混合信号分离和识别技术进行研究。首先对铣削力混合信号矩阵进行预处理,利用对预处理结果的独立成分分析(ICA)分离得到独立源信号矩阵,再通过快速傅里叶变换(FFT)得到独立源信号的频谱,最后分析并结合实验工况识别出微铣削力信号、机械噪声信号和环境噪声信号。实验结果表明:该方法具有同时分离非高斯性的机械噪声信号和高斯性的环境噪声信号的优点,可以弥补传统方法只能抑制高斯噪声信号的不足。相似文献