首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
鸟声识别研究中声音特征选取对识别分类的准确度有很大影响.为了提高鸟声识别正确率,针对传统的梅尔倒谱系数(MFCC)对鸟声高频信息表征不足.提出了基于Fisher准则MFCC和翻转梅尔倒谱系数(IMFCC)的特征融合,得到新的特征参数MFCC-IMFCC应用于鸟声识别,提高对鸟声高频信息表征.同时通过遗传算法(GA)对支持向量机(SVM)中的惩罚因子C和核参数g进行优化,训练出GA-SVM分类模型.实验表明,在同一条件下,MFCC-IMFCC与MFCC相比,识别率有一定的提高.  相似文献   

2.
张小霞  李应 《计算机应用》2013,33(10):2945-2949
针对实际环境噪声使得鸟鸣识别准确率受到影响的问题,提出一种基于能量检测的抗噪鸟鸣识别方法。首先,对包含有噪声的鸟鸣信号用能量检测方法检测并筛选出有用鸟鸣信号;其次,根据梅尔尺度的分布,对有用鸟鸣信号提取小波包分解子带倒谱系数(WPSCC)特征;最后,用支持向量机(SVM)分类器分别对提取的小波包分解子带倒谱系数(WPSCC)和梅尔频率倒谱系数(MFCC)特征进行建模分类识别。同时还对比了在添加不同信噪比的噪声下15类鸟鸣在能量检测前后的识别性能差异。实验结果表明,提取的WPSCC特征具有较好的抗噪功能,且经过能量检测后的识别性能更佳,更适用于复杂环境下的鸟鸣识别  相似文献   

3.
基于萤火虫算法的匹配追踪用于生态声音辨识   总被引:1,自引:0,他引:1  
针对生态环境中背景噪声对声音辨识产生干扰的问题,提出利用萤火虫算法优化匹配追踪的方法进行生态声音辨识。利用匹配追踪(MP)稀疏分解声音信号,在保留信号主体结构的前提下对其进行重构,减小噪声的影响。使用萤火虫(GSO)算法优化搜索最佳匹配原子,实现MP快速分解。对重构信号提取Mel频率倒谱系数(MFCCs),MP时频特征及基音频率。结合支持向量机(SVM)对56种生态声音在不同环境和信噪比情况下进行分类识别。实验结果表明,与传统MFCC与SVM的方法相比,该方法对生态声音在不同信噪比下的识别性能得到不同程度的改善并且具有较好的抗噪性,尤其适合低信噪比(30 dB以下)噪声情境下使用。  相似文献   

4.
《传感器与微系统》2019,(2):143-146
提出一种基于变步长最小均方(LMS)和支持向量机(SVM)的电能表内异物声音自动识别方法。由于SVM分类器对噪声敏感,通过变步长LMS实现对采集的电能表内异物声音信号的降噪,相较于固定步长LMS,信噪比提升明显,耗用时间较少。对声音信号进行时、频域和倒谱分析,并提取其短时特征系数及改进梅尔频率倒谱系数(MFCC)。并采用短时能量和MFCC系数构成混合特征矩阵,对该矩阵降维后输入SVM进行异物声音识别。实验证明:提出的方法计算量小、识别率高,有很好的应用价值。  相似文献   

5.
针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性,分类器的平均识别率可达到90%以上,并且计算复杂度小。  相似文献   

6.
对鸣笛声的准确识别是机动车鸣笛抓拍系统得以运用的关键。为了克服单一特征对鸣笛声表征不足的缺陷,提高识别的准确性,文章将Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)与Gama频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)融合得到M-GFCC特征,并分别使用支持向量机(Support Vector Machines,SVM)和BP(Back Propagation,BP)神经网络算法进行分类。实验结果表明,与使用单一的MFCC特征相比,BP神经网络对鸣笛声识别的有效率提高了10.4%,SVM的有效率提高了4.4%;相较于单一的GFCC特征,BP神经网络的有效率提高了6.6%,SVM的有效率提高了4.2%,证明了该融合特征能提高鸣笛声识别准确性。  相似文献   

7.
利用支持向量机识别汽车颜色   总被引:3,自引:0,他引:3  
大类别数分类时支持向量机(SVM)数量较多,文中通过类别合并和特征空间分解,结合决策树判别方法.对SVM数量进行优化,提出了一种基于优化SVM的汽车颜色识别方法.该方法与最近邻分类方法相比,无论是在速度上还是识别正确率上都得到了提高.实验结果表明,该方法是一种快速且正确率较高的多类别分类方法,可以满足实时识别的要求.  相似文献   

8.
王杨  赵红东 《计算机应用》2020,40(3):665-671
针对目前人体活动类别识别准确率偏低的问题,提出一种支持向量机(SVM)与情景分析(人体运动状态转换的实际逻辑或统计模型)相结合的识别方法,对人体日常的六种活动(步行、上楼、下楼、坐下、站立、躺下)进行识别。该方法利用了人体活动样本之间存在逻辑关系的特点,首先使用经改进的粒子群优化(IPSO)算法对SVM模型进行优化,然后利用优化后的SVM对人体活动进行分类,最后通过情景分析的方法对错误的识别结果进行修正。实验结果表明,所提方法在加州大学欧文分校(UCI)的人体活动识别数据集(HARUS)上的分类准确率达到了94.2%,高于传统的仅使用模式识别进行分类的方法。  相似文献   

9.
该文针对短语音(语段时长小于等于1s)和易混淆语音的语种识别进行研究。选取东方多语种识别竞赛数据集为实验数据集,对比了音素对数似然比特征、梅尔频率倒谱系数特征、深度瓶颈层特征(DBF)在短语音及易混淆语种识别中的性能,证明DBF在两种识别任务中均具有较好的性能。为提升识别准确率提出DBF-I-VECTOR语种识别改进系统,该系统分别将基线DBF-I-VECTOR系统的短语音识别等错误率最优结果从12.26%降低为10.55%,易混淆语音识别等错误率(EER)最优结果从5.53%降低为2.86%。在对比改进系统后端的余弦距离(CDS)、概率线性判别分析(PLDA)、支持向量机(SVM)、极端梯度提升(XGBoost)、随机森林(RF)分类性能时发现RF在短语音任务中分类效果最好,SVM在易混淆任务中分类效果最好。  相似文献   

10.
近年来,通过分析脑电图(EEG)信号来实现情感识别的课题越来越被研究者所重视。为了丰富特征的表示能力,获得更高的情感识别分类准确率,尝试将语音信号特征梅尔频率倒谱系数MFCC应用于脑电信号。在对EEG信号小波变换的基础上将提取得到的MFCC特征与EEG特征相互融合,通过利用深度残差网络(ResNet18)的特性进行情感分类识别。实验结果表明,比起传统的单一利用EEG特征,添加了MFCC特征使得情感维度Arousal和Valence两者的识别准确率分别提升了6%和4%,达到了86.01%和85.46%,从而提升了情感的识别准确度。  相似文献   

11.
心音信号识别对心血管疾病的诊断具有重要意义,为了提高心音信号的识别性能,提出一种基于支持向量机的心音信号自动识别方法。首先采用小波分析对心音信号进行降噪预处理,然后提取心音信号的Mel频率倒谱系数作为心音信号特征,最后采用支持向量机建立心音信号分类器,对采集心音信号数据的识别性能进行验证。实验结果表明,本文方法的心音信号平均识别率高达93%以上,可以准确识别正常和各种异常的心音信号。   相似文献   

12.
为了提高利用高压水射流靶物反射声信号识别靶物材质的效率,针对地雷探测过程常见的地雷、石块、砖块和木块4种靶物,采用不同的特征提取方法来识别靶物材质。在分析Mel频率倒谱系数及小波包变换倒谱系数基本原理的基础上,结合靶物反射声信号的特点,提出了一种基于Mel频率倒谱和小波包变换倒谱特征融合的特征提取方法:利用小波包变换将原始靶物反射声信号划分为若干子频段,选取其中一个子频段作为低频和高频的划分层;低频部分提取Mel频率倒谱系数作为特征值,高频部分则提取小波包变换倒谱系数作为特征值,将2组特征值线性合并为一组新的特征向量,用于靶物材质的识别。采用最小二乘支持向量机建立多分类模型,验证基于单一特征和基于特征融合的特征提取方法的识别率。实验结果表明,在取得低频与高频的最佳划分层时,基于特征融合的特征提取方法的平均识别率达到82.812 5%,较单一的利用Mel频率倒谱系数或小波包变换倒谱系数作为特征向量时的平均识别率分别提高了10.312 5%和7.812 5%。  相似文献   

13.
杨曜  郭斌  於志文 《软件学报》2013,24(S2):24-31
随着社会需求的不断扩大及技术的不断发展,人与人之间的社会交互也越来越多.理解社会交互特征并能感知用户所处的社会情境语义(如在开会、在上课),对于促进和辅助用户社会活动具有重要意义.从背景声音的角度对社会交互进行理解,目的是通过对背景声音差异性特征的提取,识别用户所处的社会情境.提出了一种基于背景声音识别的社会情境感知方法,该方法采用Mel frequency cepstral coefficients (MFCCs,即Mel 频率倒谱系数)分析声音信号,将路径搜索限制和搜索过滤的改进Dynamic Time Warping(DTW)算法作为识别器.通过对11 种社会情境背景声音的采集和识别,表明该算法能够有效地识别用户所处的社会情境,且其运算效率与识别率比传统DTW 算法有所提高.  相似文献   

14.
基于人类听觉特性的Mel频率倒谱系数广泛用于声音识别,然而在生态环境中噪声的出现导致其识别率剧减。提出一种在噪声背景下生态环境声音分类方法。利用非线性多频带谱减法对声音功率谱进行去噪处理并提取改进Mel频率倒谱系数,有效削弱不同频率段噪声功率谱干扰。利用支持向量机良好的鲁棒性和抗噪能力对含有噪声的生态环境声音进行分类。实验表明该方法能有效在噪声背景下对生态环境声音准确分类。  相似文献   

15.
基于HHT-MFCC和短时能量的慢性阻塞性肺病患者呼吸声识别   总被引:1,自引:0,他引:1  
常峥  罗萍  杨波  张晓晓 《计算机应用》2021,41(2):598-603
为了优化梅尔频率倒谱系数(MFCC)特征提取算法,提高对呼吸声信号识别的准确率,实现识别慢性阻塞性肺病(COPD)的目的,提出了基于希尔伯特黄变换(HHT)的MFCC与短时能量(Energy)融合的特征提取算法HHT-MFCC+Energy.首先,经预处理的呼吸声信号通过HHT计算出Hilbert边际谱和边际谱能量;其...  相似文献   

16.
付燕  聂亚娜  靳玉萍 《计算机测量与控制》2012,20(9):2491-2493,2500
为提高肝脏B超图像的诊断准确率,研究了将粒子群算法(Particle Swarm Optimization,PSO)和支持向量机(Support Vec-tor Machine,SVM)相结合进行肝脏B超图像识别的方法;该方法首先提取肝脏B超图像的空域和频域的纹理特征,然后运用SVM对108幅肝脏B超图像进行分类,利用PSO算法优化SVM的模型参数,最后将该方法与基于网格搜索法优化的SVM和基于BP神经网络的分类方法进行了对比;实验结果表明,在PSO-SVM算法下,所提取的两种纹理特征相结合能够有效地描述肝脏B超图像,基于粒子群优化算法的支持向量机模型具有较高的识别精度,平均分类准确率达94.44%,这就表明PSO-SVM算法适用于对肝脏B超图像的识别。  相似文献   

17.
Recently, lots of research has been directed towards natural language processing. However, the baby's cry, which serves as the primary means of communication for infants, has not yet been extensively explored, because it is not a language that can be easily understood. Since cry signals carry information about a babies' wellbeing and can be understood by experienced parents and experts to an extent, recognition and analysis of an infant's cry is not only possible, but also has profound medical and societal applications. In this paper, we obtain and analyze audio features of infant cry signals in time and frequency domains. Based on the related features, we can classify given cry signals to specific cry meanings for cry language recognition. Features extracted from audio feature space include linear predictive coding (LPC), linear predictive cepstral coefficients (LPCC), Bark frequency cepstral coefficients (BFCC), and Mel frequency cepstral coefficients (MFCC). Compressed sensing technique was used for classification and practical data were used to design and verify the proposed approaches. Experiments show that the proposed infant cry recognition approaches offer accurate and promising results.   相似文献   

18.
声音事件识别时受到各种环境声的影响,采用优化正交匹配跟踪(Orthogonal Matching Pursuit,OMP)和短时谱估计对声音信号进行二次重构,能有效提高识别性能。采用粒子群算法(Particle Swarm Optimization,PSO)优化OMP稀疏分解作首次重构,保留声音信号的主体;采用短时谱估计对首次重构后的残余信号作声音增强处理,完成二次重构,去除非平稳噪声和提高重构声音信号的精度;对重构信号提取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征、优化OMP时-频特征和基频(Pitch)特征,组成复合抗噪特征集OOMP;使用深度置信网络(Deep Belief Network,DBN)对OOMP特征进行学习,并对40种声音事件在不同环境不同信噪比下进行识别。实验结果表明,该方法在不同信噪比的各种环境声中平均识别率为70.44%,且在?5?dB的情况下仍然可以达到49.90%的识别率,从而说明所提方法能有效地识别各种环境下的声音事件。  相似文献   

19.
张少华  秦会斌 《测控技术》2019,38(11):86-89
音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义。提出了一种新型音高估计和发声分类方法。利用梅尔频率倒谱系数(MFCC)进行频谱重构,并在对数下对重构的频谱进行压缩和过滤。通过高斯混合模型(GMM)对音高频率和滤波频率的联合密度建模来实现音高估计,实验结果在TIMIT数据库上的相对误差为6.62%。基于高斯混合模型的模型也可以完成发声分类任务,经试验测试表明发声分类的准确率超过99%,为音高估计和发声分类提供了一种新的模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号