首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
李坚  毛先领  文贵华 《计算机工程》2008,34(11):211-213
提出利用分形几何抽取音频特征的全局化音频检索,将其学习阶段计算音频数据库中每个音频的分维作为特征向量,保存在音频特征数据库中,并建立索引。其检索阶段则首先计算查询音频的分维,然后从音频数据库中快速找出分维最相似的若干音频对象。分维刻画了音频的内在属性如自相似性,使其具有片段检索对匹配的起点不敏感、抗噪音、检索速度快等优点。用FRACTAL, MFCC和SOLAR 3种方法对数据集分别检索,实验结果表明基于分维的音频检索在性能和时间复杂度上有显著优势。  相似文献   

2.
音频自动分类中的特征分析和抽取   总被引:8,自引:1,他引:8  
音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频”流”特征-High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.  相似文献   

3.
音频数据的一种空间特征模型   总被引:3,自引:0,他引:3  
程凯  李应  黄樟钦 《计算机应用》2004,24(1):143-146
音频是多媒体中一种典型的媒体,音频检索也自然成为多媒体检索的重要内容。本文针对波形声音,提出一种用于产生音频数据索引的空间特征模型,并给出该模型中各个元素的获取算法,举例说明了该空间特征模型的应用。  相似文献   

4.
利用小波分解和分形维数进行声纳图像识别   总被引:6,自引:0,他引:6  
以分形维数和多重分形的概念为基础,通过计算原图像和灰度差分图像的分形维数和多重分形维数,形成了纹理特征集的第一部分;然后对声纳图像采用树式结构小波变换,将小波变换各个频带输出的熵作为纹理分类的特征,并根据特征本身的离散程度对其进行规范化处理,构成了纹理特征集的第二部分;最后将这两部分组合,对不同信噪比的声纳图像进行分类识别.识别结果表明,文中方法的识别率可达到90%以上.  相似文献   

5.
音频具有数据量大、维数高等特点,直接进行音频检索会造成“特征维数灾难”,因此有必要从音频提取最能表现音频特征的音频帧。提出一种基于模糊粗糙集模型(Fuzzy Rough Set Model,FRSM)的音频数据约简算法,根据隶属度对音频数据进行模糊离散,基于知识表达能力约简属性,以等价划分计算具有等同分类能力的知识核。实验结果表明,该算法能够得到最小约简,并且最大程度地保持音频特征,提高检索效率。  相似文献   

6.
音频内容分割与聚类的研究   总被引:1,自引:0,他引:1  
分析了采用音频特征检测音频边缘来分割音频的过程,给出了采用高斯混合模型GMM描述音频段的方法;介绍了音频段聚类的实现;并给出了实验结果,实验结果说明分割和聚类的效果较好。  相似文献   

7.
根据地震资料和少量标定井预测油气储层横向变化是油气勘探开发的重要课题,基于分形理论和地质变量具有分形特征,提出了分形模式识别地震储层分析思想,为实现该思想,提出了基于二维分形布朗运动的油气识别方法并将其成功地应用于某油田的油气储层横向预测。  相似文献   

8.
基于COM规范的实时音频特征提取技术及实现   总被引:2,自引:0,他引:2  
蔡波  于俊清  周洞汝 《计算机工程》2003,29(11):116-118
数字视频中含有大量的音频信息,通过声音分类建立基于内容的视频索引是一个有效的途径。该文提出了基于COM规范的实时音频特征提取的系统框架,并按此框架使用DirectShow样本捕捉器进行了音频帧和音频特征实时提取的试验,取得了满意的结果。  相似文献   

9.
按照Mandelbrot的分形理论,医学图象及许多自然图象的灰度表面的形成均符合分形布朗运动规律,而且可以用分形的维数来表征图象灰度表面的精细与粗糙程度。文中正是基于这种思想,采用图象的分形维数作为一个特征参量,对人体的肌肉组织进行超声定征。对60 多个样本三类病变图象提取分形维数,并采用基于Bayes法则的分类器分类,实验表明:用分形维数对组织进行定征,正确率达88.33% 。这为医学的临床辅助诊断提供了一种新的参考量,对提高病变诊断的正确率有重大的意义  相似文献   

10.
基于分形的水声图像目标探测   总被引:4,自引:0,他引:4       下载免费PDF全文
针对水声图像中人造物体的探测问题,给出了一种基于分形分析的方法,由于分形模型可以较好地模拟自然物体,而与人工物体存在较大差距,所以以其为主要特征可以准确地将人造物体从自然背景中探测出来。本文讨论了分维的提取方法,根据分形特征将水声图像标记为人造目标区域和非人造目标区域,并对一定噪声干扰下该方法的应用进行了研究,给出了相应的实验结果。实验结果表明,分形特征可以实现人造目标和自然物体的分类,并具有一定的抗噪声性,适宜对水声图像中的目标进行探测和识别。  相似文献   

11.
基于AdaBoost特征约减的入侵检测分类方法   总被引:1,自引:0,他引:1  
陶晓玲  王勇  罗鹏 《计算机工程》2008,34(18):199-201
提出一种基于AdaBoost的入侵特征约减算法,利用该算法约减入侵特征中的冗余特征,构造Ada-加权和Ada-域值分类器,并与支持向量机分类器进行对比。设计并实现Linux实时入侵检测实验平台,并将特征约减算法和3种分类方法应用于该平台。实验结果表明,由特征约减算法挑选出来的入侵特征集较优,Ada-加权和Ada-域值分类器的分类效果优于支持向量机分类器,且Ada-域值分类器在测试集上的检测性能最佳。  相似文献   

12.
文章处理的是中国民族乐器的识别分类问题.提出了一种基于合适的音频特征值选择方法,该方法在基于MPEG_7标准的声学特征,在特征值的时间特性上进行改造,并加入改进后的特征值.从提取的音频特征值数据集选择K-最近邻算法.特别是对没有加入新特征值和加入新特征值后生成分类器模型的性能进行了比较.实验结果证明新特征值的加入提高了分类器的F1度量值.  相似文献   

13.
This paper addresses a model-based audio content analysis for classification of speech-music mixed audio signals into speech and music. A set of new features is presented and evaluated based on sinusoidal modeling of audio signals. The new feature set, including variance of the birth frequencies and duration of the longest frequency track in sinusoidal model, as a measure of the harmony and signal continuity, is introduced and discussed in detail. These features are used and compared to typical features as inputs to an audio classifier. Performance of these sinusoidal model features is evaluated through classification of audio into speech and music using both the GMM (Gaussian Mixture Model) and the SVM (Support Vector Machine) classifiers. Experimental results show that the proposed features are quite successful in speech/music discrimination. By using only a set of two sinusoidal model features, extracted from 1-s segments of the signal, we achieved 96.84% accuracy in the audio classification. Experimental comparisons also confirm superiority of the sinusoidal model features to the popular time domain and frequency domain features in audio classification.  相似文献   

14.
针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性,分类器的平均识别率可达到90%以上,并且计算复杂度小。  相似文献   

15.
音频分类是提取音频结构和内容语义的重要手段,是基于内容的音频检索和分析的基础.本文对几种常用的音频分类算法作了综述,介绍了最小距离法、神经网络、支持向量机、决策树方法、隐马尔可夫模型等典型算法的特征,并对它们的优缺点进行了比较.  相似文献   

16.
Content-based audio classification and segmentation is a basis for further audio/video analysis. In this paper, we present our work on audio segmentation and classification which employs support vector machines (SVMs). Five audio classes are considered in this paper: silence, music, background sound, pure speech, and non- pure speech which includes speech over music and speech over noise. A sound stream is segmented by classifying each sub-segment into one of these five classes. We have evaluated the performance of SVM on different audio type-pairs classification with testing unit of different- length and compared the performance of SVM, K-Nearest Neighbor (KNN), and Gaussian Mixture Model (GMM). We also evaluated the effectiveness of some new proposed features. Experiments on a database composed of about 4- hour audio data show that the proposed classifier is very efficient on audio classification and segmentation. It also shows the accuracy of the SVM-based method is much better than the method based on KNN and GMM.  相似文献   

17.
We present an algorithm that predicts musical genre and artist from an audio waveform. Our method uses the ensemble learner ADABOOST to select from a set of audio features that have been extracted from segmented audio and then aggregated. Our classifier proved to be the most effective method for genre classification at the recent MIREX 2005 international contests in music information extraction, and the second-best method for recognizing artists. This paper describes our method in detail, from feature extraction to song classification, and presents an evaluation of our method on three genre databases and two artist-recognition databases. Furthermore, we present evidence collected from a variety of popular features and classifiers that the technique of classifying features aggregated over segments of audio is better than classifying either entire songs or individual short-timescale features. Editor: Gerhard Widmer  相似文献   

18.
论文使用音频分析技术和模式识别技术相结合的方法对传统京剧中的3种典型角色(生、旦、净)的唱腔和2种典型的纯伴奏形式(文场和武场)进行了基于内容的自动分类研究。实验测试数据包括266个片段,来自于许多著名京剧演员如梅兰芳、袁世海、于魁智等人的演出。实验结果表明,对于5类分类问题可以达到88.7%的平均分类正确率,对于有伴奏下的唱腔和纯伴奏之间的2类分类问题可以取得高达96.6%的平均分类正确率。这一结果对京剧的进一步研究有着重要意义。  相似文献   

19.
王晓峰  蒋先涛 《微机发展》2012,(10):59-61,65
音频分类在多媒体应用中十分广泛,主要有时域分析和频域分析方法。文中提出了一种基于自适应间距比(APR)算法和支持向量机(svrd)算法的音频分类方法,先用APR算法区分语音与非语音;对于非语音,再通过SVM进行音频分类。APR算法是比较PR参数和阈值来区分语音和非语音,它和信噪比密切相关;而将非语音分成四组:音乐,汽车,会议,雨声,提取特征因子。实验结果表明:文中设计的分类器的精度达到93.75%以上,能很好地把各类型音频分开。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号