首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
提出了一种把音频片段分类成语音或音乐的新系统.系统能自动选取在相应的信噪比下具有最高分类精度的特征参数.将从音频片段提取的特征参数值与门限值相比较进行语音/音乐的分类,其中的门限值与一定的信噪比相适应.介绍了一种新特征参数,即低频带能量率方差,在低信噪比环境下,它对分类精度有很大地提高.考察了系统在不同的信噪比环境下的分类性能.实验结果表明,所提系统分类性能良好.  相似文献   

2.
杨立东  王晶  谢湘  匡镜明 《信号处理》2015,31(2):221-225
提出一种利用Tucker分解获得鲁棒性较强的音频信号不同属性的特征,在高斯混合模型上测试音频信号分类性能的方法。音频信号经过预处理后,提取其不同类型特征集合,包括常规声学特征参数集合、听觉感知特征参数集合、心理声学特征参数集合;然后由三种特征集合构建三阶特征张量,通过Tucker分解得到每一类特征阶投影矩阵并进行主分量分析;最后使用包括音乐、语音、噪声3种类型的300条音频数据测试不同特征集合的分类效果,在此过程中使用了有监督学习的高斯混合模型作为分类器。实验中比较了不同特征集合使用高斯混合模型的分类正确率。实验结果表明,Tucker分解获得的特征集合实现了较好的分类,说明该方法性能优于传统特征集合。   相似文献   

3.
齐峰岩  鲍长春 《电子学报》2006,34(4):605-611
本文将支持向量机(SVM)方法应用于语音信号的清/浊/静音检测中,提出并验证了一种在各种信噪比等级下将语音信号有效地分为清音、浊音和静音三类信号的新型分类算法.首先,在高信噪比情况下,本文采用了G.729B VAD中的四个差分参数作为SVM分类器的输入特征参数,进行了静音分类的对比实验,得到了优于G.729B VAD和BP神经网络传统算法的实验结果,说明引入这种机器学习方法做语音分类是可行的,并分析讨论了在核函数不同的情况下支持向量机在实验中所表现出的性能.其次,又讨论了在低信噪比条件下,如何通过对含噪语音建立统计模型,提取对噪音免疫的统计特征参数,并给出了一种对时变背景噪声自适应的估计方法.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的分类性能要优于其他传统算法.  相似文献   

4.
为解决单一语音、音乐音频及其两者的混合音频进行语音/音乐分类时分类结果不准确的问题,提出一种基于音频分割的音频分类算法.利用能熵比特征进行音频分割,分割出的音乐段较为准确,而利用幅度均方根特征进行音频分割,分割出的语音段较为准确,避免了对语音段的过度分割.将两种分割方法分割所得音频段的起点和终点升序排列并两两组合形成新...  相似文献   

5.
高欢芹  酆广增  朱琦 《电子学报》2009,37(7):1465-1469
 自适应调制根据瞬时信道信噪比选择适当的调制方式,能够改善系统的BER性能以及平均吞吐量性能.在常用于高速移动环境的六径瑞利衰落信道模型下,研究自适应调制系统的最佳信噪比门限值,使系统的平均吞吐量最大,同时能够保证系统达到目标BER性能.得到的最佳信噪比门限值可以用于ITU-R M.1225 Vehicular Test A 模型的自适应调制系统.给出了最佳信噪比门限值用于IEEE802.16e OFDM自适应调制系统的性能仿真,并对仿真结果进行了分析.  相似文献   

6.
采用特征分类直方图均衡化的鲁棒性语音识别   总被引:1,自引:0,他引:1  
姜莹  俞一彪 《信号处理》2011,27(6):896-900
大部分噪声会引起语音倒谱域特征参数的非线性失真,导致识别系统性能下降。直方图均衡化方法是一种非线性补偿变换技术,较传统的基于线性变换技术的抗噪声方法进一步提高了系统的鲁棒性。但实际识别系统中,除了噪声引起语音特征的非线性失真外,还存在训练和测试数据的语音特征类分布不一致问题,从而难以保证传统的直方图均衡化方法发挥其优势。本文提出一种基于特征分类的直方图均衡化方法,首先对初步均衡化后的含噪语音特征矢量进行K均值分类,然后对各类别下的特征矢量再进行直方图均衡变换。实验结果表明,低信噪比时无论在平稳噪声还是非平稳噪声环境下,与传统的直方图均衡化方法相比都进一步增强了识别系统的鲁棒性。   相似文献   

7.
张晋宁 《电声技术》2023,(11):101-104
视觉语音识别(Audio-Visual Speech Recognition,AVSR)系统结合音频和视觉信息,提供可靠的语音识别功能。为了提高AVSR系统在低信噪比(Signal-to-Noise Ratio,SNR)环境下的识别准确率,提出一种基于循环神经网络(Recurrent Neural Network,RNN)的AVSR系统。该系统由音频特征提取模块、视觉特征提取模块以及音频和视觉特征联合模块3部分组成。特征联合模块利用RNN将基于梅尔频率倒谱系数的音频特征与OpenCV库中的Haar级联检测提取的视觉信息相结合,以提高系统识别率。实验结果表明,在低信噪比条件下,所提系统的正确识别率保持在89%左右。  相似文献   

8.
针对传统的瞬时特征参数识别法在低信噪比下识别信号种类少、识别率低等问题,文中提出了一种基于瞬时特征参数与功率谱熵联合的调制识别方法。该方法通过改进后的瞬时幅度及相位特征参数对调制信号进行识别,并引入了功率谱熵特征参数,可进一步实现对更多信号的类内识别。在信号类内识别方面,采用决策树分类方法,选取合适的门限值对常用的9种数字调制信号{ASK、4ASK、2FSK、4FSK、8FSK、BPSK、QPSK、8PSK、16QAM}进行识别分类。蒙特卡洛实验结果表明,相较于现有的识别方法,文中所提出的方法增加了识别信号的种类,还提高了低信噪比情况下的信号识别准确率。  相似文献   

9.
噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。  相似文献   

10.
《无线电工程》2016,(12):21-25
针对瞬时信息量的调制识别算法抗噪性能差的问题,提出了一种基于改进的瞬时信息量的数字调制识别算法。通过提取5种新的瞬时信息特征参数,确定其判别次序和判决门限值,使得算法在低信噪比条件下依然能保持很高的识别性能。实验结果表明,算法在信噪比低至5 dB时,对不同的数字调制信号的识别率均达到90%以上,与同条件下的原有识别算法相比,识别正确率提升了15%。  相似文献   

11.
辐射源识别技术是当前电子侦察的重要研究方向。文中利用雷达模拟器的脉冲包络指纹特征,构建特征数据库,提出一种新的指纹特征向量匹配识别方法。该方法根据自适应评分机制,衡量不同特征向量之间的相似性,实现对辐射源脉冲的分类和识别处理。利用同型号雷达模拟器的外场实录数据,验证了该识别方法的有效性,分类性能优于传统的M-距离法。文中还定量分析了辐射源分类正确率与信噪比的关系,结果表明,分类正确率与SNR成正相关,当信噪比高于20 dB时,分类正确率超过95%。  相似文献   

12.
Myoelectric signals (MESs) from the speaker's mouth region have been successfully shown to improve the noise robustness of automatic speech recognizers (ASRs), thus promising to extend their usability in implementing noise-robust ASR. In the recognition system presented herein, extracted audio and facial MES features were integrated by a decision fusion method, where the likelihood score of the audio-MES observation vector was given by a linear combination of class-conditional observation log-likelihoods of two classifiers, using appropriate weights. We developed a weighting process adaptive to SNRs. The main objective of the paper involves determining the optimal SNR classification boundaries and constructing a set of optimum stream weights for each SNR class. These two parameters were determined by a method based on a maximum mutual information criterion. Acoustic and facial MES data were collected from five subjects, using a 60-word vocabulary. Four types of acoustic noise including babble, car, aircraft, and white noise were acoustically added to clean speech signals with SNR ranging from -14 to 31 dB. The classification accuracy of the audio ASR was as low as 25.5%. Whereas, the classification accuracy of the MES ASR was 85.2%. The classification accuracy could be further improved by employing the proposed audio-MES weighting method, which was as high as 89.4% in the case of babble noise. A similar result was also found for the other types of noise.  相似文献   

13.
王哲昊  简涛  王海鹏  张健 《信号处理》2021,37(6):932-940
针对低信噪比条件下海面目标分类识别精度差的问题,该文提出了一种基于去噪卷积神经网络(Denois-ing convolutional neural network,DnCNN)的海面目标高分辨一维距离像(High Resolution Range Profile,HRRP)识别方法.所提方法设计了一个海面目标分类识别模...  相似文献   

14.
针对传统降噪算法损伤高信噪比(SNR)信号而造成信号识别准确率下降的问题,该文提出基于卷积神经网络的信噪比分类算法,该算法利用卷积神经网络对信号进行特征提取,用固定K均值(FK-means)算法对提取的特征进行聚类处理,准确分类高低信噪比信号。低信噪比信号采用改进的中值滤波算法降噪,改进的中值滤波算法在传统中值滤波的基础上增加了前后采样窗口的关联性机制,来改善传统中值滤波算法处理连续噪声效果不佳的问题。为充分提取信号的空间特征和时间特征,该文提出卷积神经网络和长短时记忆网络并联的卷积长短时(P-CL)网络,利用卷积神经网络和长短时记忆网络分别提取信号的空间特征与时间特征,并进行特征融合与分类。实验表明,该文提出的调制信号分类模型识别准确率为91%,相比于卷积长短时(CNN-LSTM)网络提高了6%。  相似文献   

15.
在基于布里渊散射的分布式光纤传感系统中,沿途光电检测信号信噪比(SNR)过低为被测量的信息反演带来困难。针对高精度解调传感布里渊散射谱的布里渊频偏量的需求,提出了一种利用粒子群优化(PSO)和拉凡格氏(L-M)混合优化算法对传感散射谱进行特征提取的方法。利用PSO算法粗调得到一组全局最优解,再以全局最优解作为L-M算法的初值,最终将L-M算法的运算结果作为结果输出。它克服了PSO算法过早收敛于局部极值和L-M算法依赖初值的问题,保证了求解的速度和精度。数值分析表明,新算法适合对不同权重比、不同线宽和低SNR、大测量范围情况下的散射谱进行参数估计,并且在SNR为10dB的情况下得到的绝对误差仅为2.18838MHz,优于其他两种算法。实验研究表明新算法适用于多种脉宽状况下的布里渊散射谱的特征提取,并可有效提高预测精度。  相似文献   

16.
Currently, many speaker recognition applications must handle speech corrupted by environmental additive noise without having a priori knowledge about the characteristics of noise. Some previous works in speaker recognition have used the missing feature (MF) approach to compensate for noise. In most of those applications, the spectral reliability decision step is performed using the signal to noise ratio (SNR) criterion, which attempts to directly measure the relative signal to noise energy at each frequency. An alternative approach to spectral data reliability has been used with some success in the MF approach to speech recognition. Here, we compare the use of this new criterion with the SNR criterion for MF mask estimation in speaker recognition. The new reliability decision is based on the extraction and analysis of several spectro-temporal features from across the entire speech frame, but not across the time, which highlight the differences between spectral regions dominated by speech and by noise. We call it the feature classification (FC) criterion. It uses several spectral features to establish spectrogram reliability unlike SNR criterion that relies only in one feature: SNR. We evaluated our proposal through speaker verification experiments, in Ahumada speech database corrupted by different types of noise at various SNR levels. Experiments demonstrated that the FC criterion achieves considerably better recognition accuracy than the SNR criterion in the speaker verification tasks tested.  相似文献   

17.
基于信号特征进行模式识别的调制识别方法需要先计算信号的高阶特征、高阶累积量再进行模式识别,整体设计复杂,特征不易计算。机器学习技术由于其强大的特征提取能力和分类能力,被广泛应用到模式识别领域中。针对调制识别问题,提出了一种基于欠完备自编码器的调制识别技术,使用欠完备自编码器进行调制信号的特征自动提取,再使用神经网络分类器进行分类识别。整体模型更为简洁,运算复杂度较低,有利于部署在硬件上进行实时识别。对常见的BPSK、QPSK、2ASK、2FSK、16QAM数字调制方式进行的识别实验表明,算法在信噪比10 dB时平均识别率高于0.97,并且在信噪比为0 dB时仍然有0.92以上的平均识别率。  相似文献   

18.
Deep learning (DL) requires massive volume of data to train the network. Insufficient training data will cause serious overfitting problem and degrade the classification accuracy. In order to solve this problem, a method for automatic modulation classification ( AMC) using AlexNet with data augmentation was proposed. Three data augmentation methods is considered, i. e. , random erasing, CutMix, and rotation. Firstly, modulated signals are converted into constellation representations. And all constellation representations are divided into training dataset and test dataset. Then, training dataset are augmented by three methods. Secondly, the optimal value of execution probability for random erasing and CutMix are determined. Simulation results show that both of them perform optimally when execution probability is 0.5. Thirdly, the performance of three data augmentation methods are evaluated. Simulation results demonstrate that all augmentation methods can improve the classification accuracy. Rotation improves the classification accuracy by 13.04% when signal noise ratio (SNR) is 2 dB. Among three methods, rotation outperforms random erasing and CutMix when SNR is greater than - 6 dB. Finally, compared with other classification algorithms, random erasing, CutMix, and rotation used in this paper achieved the performance significantly improved. It is worth mentioning that the classification accuracy can reach 90.5% with SNR at 10 dB.  相似文献   

19.
从GAR模型参数提取特征的数字调制识别新方法   总被引:1,自引:0,他引:1  
本文提出了一种从观察序列的广义自回归(GAR)模型参数提取待识别信号的伪瞬时中心频率和伪瞬时3dB带宽特征,并利用神经网络分类器的数字调制识别新方法。这种方法充分利用了GAR模型良好的抗噪声能力和神经网络优异的模式分类能力,能有效地改善低SNR条件下的调制识别性能。计算机模拟结果证实了该方法具有很高的识别率和良好的稳健性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号