首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 127 毫秒
1.
王晓峰  蒋先涛 《微机发展》2012,(10):59-61,65
音频分类在多媒体应用中十分广泛,主要有时域分析和频域分析方法。文中提出了一种基于自适应间距比(APR)算法和支持向量机(svrd)算法的音频分类方法,先用APR算法区分语音与非语音;对于非语音,再通过SVM进行音频分类。APR算法是比较PR参数和阈值来区分语音和非语音,它和信噪比密切相关;而将非语音分成四组:音乐,汽车,会议,雨声,提取特征因子。实验结果表明:文中设计的分类器的精度达到93.75%以上,能很好地把各类型音频分开。  相似文献   

2.
音频分类在多媒体应用中十分广泛,主要有时域分析和频域分析方法.文中提出了一种基于自适应间距比(APR)算法和支持向量机(SVM)算法的音频分类方法,先用APR算法区分语音与非语音;对于非语音,再通过SVM进行音频分类. APR算法是比较PR参数和阈值来区分语音和非语音,它和信噪比密切相关;而将非语音分成四组:音乐,汽车,会议,雨声,提取特征因子.实验结果表明:文中设计的分类器的精度达到93.75%以上,能很好地把各类型音频分开.  相似文献   

3.
孙文静  李士强 《计算机科学》2010,37(12):209-210
分析音频时域特征及提取方法,研究基于支持向量机的语音分类系统流程、分类系统架构以及SVM语音分类器的设计,并进行了相关实验。结果表明,设计的基于SVM的音频分类系统能够有效地对音频进行分类,平均识别准确率达到90%以上。  相似文献   

4.
研究一种用支持向量机(SVM)进行多类音频分类的方法,其中引入增广两类分类法(AB法)设计多类分类器。该算法把音频分为四类:音乐、纯语音、带背景音的语音和典型的环境音,并分析了这几类音频的八个区别性特征,包括修正低能量成分比率(MLER)和修正基频(MPF)两个新特征以及频域总能量、子带能量、频率中心等其它六个基本特征,综合考察了不同特征集在基于SVM分类器中的分类精度。实验结果表明,提取的音频特征有效,基于SVM的多类音频分类效果良好。  相似文献   

5.
基于局域判别基的音频信号特征提取方法   总被引:1,自引:0,他引:1  
音频特征提取在音频信号分析和处理中起着非常重要的作用。考虑到音频信号的非平稳性,对音频信号进行小波包分解,为了获取健壮的特征,采用改进的局域判别基(LDB)技术对小波包树进行裁剪,提取局域判别基各子空间能量的统计特征组成特征矢量,并利用Fisher准则函数进行特征选择,根据特征矢量设计支持向量机分类器,对三类音频进行分类识别。实验结果表明,该方法提取的特征矢量在音频信号分类中是非常有效的。  相似文献   

6.
针对运动想象脑电信号的分类识别,提出一种基于小波变换和共空间模式滤波的方法进行特征提取。对EEG进行3层小波分解,提取相关层数小波系数的特征量;同时利用共空间模式对EEG进行空间滤波,提取其转换后信号的方差作为特征量,并将这两类特征量进行组合。该方法结合了时频域和空间域的特征信息,可提高分类识别的效果。最后选取BCI2003中Data setⅢ数据作为样本,分别用极限学习机和基于粒子群算法的支持向量机进行分类识别。实验结果表明极限学习机分类学习时间较快,最优识别率为94.2857%,证明了该方法更适用于脑机接口系统。  相似文献   

7.
语音/音乐区分是音频高效编码、音频检索、自动语音识别等音频处理和分析的重要步骤。本文提出一种新颖的语音/音乐分割与分类方法,首先根据相邻帧间的均方能量差异检测音频的变化点,实现分割;然后对音频段提取低带能量方差比、倒谱能量调制、熵调制等八维特征,用人工神经网络做分类。实验结果显示,本文算法和特征具有很高的分割准确率和分类正确率。  相似文献   

8.
在分析篡改音频特征变化的基础上,提出了一种语音被动取证方法。采用语音的美尔倒谱域参数及其动态特征参数和小波域统计矩特征来建立模型,并选取支持向量机(SVM)作为分类器以寻找最优分类平面,实现对可疑语音信号真实性的盲取证。实验结果表明,该方法对语音片段的删除、剪接和替换等改变语音内容真实性的篡改操作能够达到较高的检测准确率。  相似文献   

9.
王忠民  刘戈  宋辉 《计算机工程》2019,45(8):248-254
在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基础上,使用多核学习算法融合音频特征,并将生成的核函数应用于支持向量机进行情感分类。在2种语音情感数据集上的实验结果表明,与单一特征的分类器相比,该方法的语音情感识别准确率高达96%。  相似文献   

10.
基于小波变换和支持向量机的音频分类   总被引:2,自引:0,他引:2       下载免费PDF全文
音频特征提取是音频分类的基础,而音频分类又是内容的音频检索的关键。综合分析了语音和音乐的区别性特征,提出一种基于小波变换和支持向量机的音频特征提取和分类的方法,用于纯语音、音乐、带背景音乐的语音以及环境音的分类,并且评估了新特征集合在SVM分类器上的分类效果。实验结果表明,提出的音频特征有效、合理,分类性能较好。  相似文献   

11.
王晓霞  李振龙  辛乐 《计算机工程》2011,37(15):171-173,176
采用主动形状模型提取人脸嘴巴几何特征,利用Gabor小波提取眼睛和眉毛频域特征.根据人脸表情特征基于分类树思想将表情进行三层分类.第1层以嘴宽高比、嘴高、嘴宽高差作为最近邻的输入进行训练实现粗分类;第2层以嘴宽、嘴宽高差作为最近邻的输入进行训练实现分类;第3层以眼睛和眉毛区域15个关键点的Gabor小波特征作为最近邻的...  相似文献   

12.
为了对数字音频的版权进行有效的保护,结合人类听觉系统和奇异值分解的重要特性,提出了一种小波域数字音频零水印算法。用混沌序列对水印图像进行加密,根据音频信号的时域局部特征选择最适合于构造零水印的音频段,对选取的音频段进行离散小波变换,提取小波域的低频分量作奇异值分解,利用低频系数的最大奇异值构造零水印,实现数字音频的版权保护。实验结果表明,水印的安全性和不可感知性很好;对于不同风格的音频信号,算法均具有良好的鲁棒性,能够有效抵抗高斯噪声、低通滤波、重采样、重量化、剪切以及压缩等攻击。  相似文献   

13.
This paper addresses a model-based audio content analysis for classification of speech-music mixed audio signals into speech and music. A set of new features is presented and evaluated based on sinusoidal modeling of audio signals. The new feature set, including variance of the birth frequencies and duration of the longest frequency track in sinusoidal model, as a measure of the harmony and signal continuity, is introduced and discussed in detail. These features are used and compared to typical features as inputs to an audio classifier. Performance of these sinusoidal model features is evaluated through classification of audio into speech and music using both the GMM (Gaussian Mixture Model) and the SVM (Support Vector Machine) classifiers. Experimental results show that the proposed features are quite successful in speech/music discrimination. By using only a set of two sinusoidal model features, extracted from 1-s segments of the signal, we achieved 96.84% accuracy in the audio classification. Experimental comparisons also confirm superiority of the sinusoidal model features to the popular time domain and frequency domain features in audio classification.  相似文献   

14.
基于微阵列表达数据,探索新的有效特征提取和分类方法。采用小波多分辩率分析方法提取基因表达的特征,利用支持向量机和BP神经网络方法进行分类。基因表达具有明显的多尺度特征,分类率最大达到98.61%,结果稳定。采用多尺度理论对基因表达数据进行分析是一种新的有效的生物信息学方法,值得进一步探索与研究。  相似文献   

15.
为了提高脑思维任务分类精度,提出了一种基于小波包分解和多分类器投票组合的运动想象任务分类方法。该方法利用小波包分解对经过预处理的脑电信号进行分解,提取所有频带上的相对小波包能量特征;根据不同脑思维任务下左右半脑各通道间的差异性对C3、C4两通道求取特定频带上的小波包系数的L-2范数作为特征;采用基于投票策略的组合分类器对两种联合特征进行分类,得到了92.85%的识别精度。实验结果表明,联合特征向量较好地反映了左右手运动想象脑电信号的事件相关去同步(ERD)和事件相关同步(ERS)的本质特性;组合分类器识别效果优于单一分类器。  相似文献   

16.
基于频域卷积信号盲源分离的乐曲数据库构建*   总被引:1,自引:1,他引:0  
将通过频域卷积信号盲源分离算法从MP3歌曲音频信号中分离出人声主唱信号,再从人声主唱信号中提取出能够表征歌曲的旋律特征构建哼唱检索系统的歌曲数据库。盲源分离要求观测信号数目不小于源信号数目,因此先用小波多分辨率分析构造一路观测信号,再用频域独立成分分析(FDICA)实现MP3歌曲音频信号的盲源分离(BSS)。实验证明,采用FDICA-based BSS从歌曲MP3中分离出的人声主唱信号的旋律特征与待检索的人声哼唱信号的旋律特征有较高的相似度,可以用歌曲MP3构建哼唱检索系统的歌曲数据库。  相似文献   

17.
基于EGI公司64导脑电采集系统,采集了16位青少年抑郁症患者和16位正常人静息态下闭眼4分钟的脑电数据。运用频谱不对称分析法(Spectral Asymmetry Index,SASI)和去趋势波动分析(Detrended Fluctuation Analysis,DFA)算法提取脑电时域和频域特征。针对提取的特征的导联,一方面,选择最佳电极Pz作为分类的导联,另一方面,通过遗传算法对所有导联进行筛选,将筛选后的导联特征用于分类。使用支持向量机(Support Vector Machine,SVM)在单导联和多导联的情况下,对抑郁症患者和正常人进行分类,结果发现,单导联下,使用SVM分类器对抑郁组和对照组的SASI和DFA结果进行分类,分类精度分别为45.5%和51.5%,使用遗传算法的分类精度分别为78.1%和90.6%,SASI算法的计算实时性优于DFA算法,DFA算法的准确性优于SASI算法。该研究为抑郁症的计算机辅助诊断提供了理论依据。  相似文献   

18.
以均值量化索引调制(MQIM)、特征点为理论基础,提出一种新颖的强鲁棒性数字音频水印技术。该算法选取数字音频的局部能量峰值点作为特征,提取稳定的特征点;以特征点为标记,对特征点后的区域进行分段,利用均值量化索引调制将水印嵌入到原始音频的小波域中。水印提取时无需原始图像。仿真实验表明,提出的算法对常规信号处理(MP3压缩、叠加噪声、重新采样、重新量化等)和去同步攻击(随机剪切、幅度缩放、变调、抖动等)均具有较好的鲁棒性。  相似文献   

19.
基于小波包分解和遗传神经网络对正常脑电和癫痫脑电进行识别。通过分析脑电数据找出信号特征;利用一维离散小波包分解提取含有识别特征的脑电信号频率段,并以脑电各频段的相对能量作为信号特征;然后建立基于遗传算法优化的BP网络,用于对癫痫脑电识别。实验结果表明,该方法可以有效提取信号特征,并且对信号进行准确的识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号