首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 112 毫秒
1.
基于PCA和CHMM的音频自动分类*   总被引:1,自引:0,他引:1  
针对DHMM分类器对音频特征进行向量量化引起的误差及特征维数过多导致计算复杂度过大的问题,提出了一种新的基于PCA和CHMM的音频自动分类方法。它先将音频特征组成一个高维向量,然后使用PCA对这些高维向量进行降维,再使用CHMM分类器对降维后的特征进行分类。实验证明了PCA和CHMM音频分类的有效性。  相似文献   

2.
基于内容的音频分类是基于内容的音频检索技术中的重要研究内容。先简单介绍音频分类的理论基础,然后介绍几种典型的音频分类方法,最后通过一个简单的SVM算法进行模拟实验。  相似文献   

3.
基于支持向量机的音频分类与分割   总被引:8,自引:0,他引:8  
音频分类与分割是提取音频结构和内容语义的重要手段,是基于内容的音频、视频检索和分析的基础。支持向量机(SVM)是一种有效的统计学习方法。本文提出了一种基于SVM的音频分类算法。将音频分为5类:静音、噪音、音乐、纯语音和带背景音的语音。在分类的基础上,采用3个平滑规则对分类结果进行平滑。分析了SVM分类嚣的分类性能,同时也评估了本文提出的新的音频特征在SVM分类嚣上的分类效果。实验结果显示,基于SVM的音频分类算法分类效果良好,平滑处理后的音频分割结果比较准确。  相似文献   

4.
音频分类是提取音频结构和内容语义的重要手段,是基于内容的音频检索和分析的基础.本文对几种常用的音频分类算法作了综述,介绍了最小距离法、神经网络、支持向量机、决策树方法、隐马尔可夫模型等典型算法的特征,并对它们的优缺点进行了比较.  相似文献   

5.
一种基于选择性集成SVM的新闻音频自动分类方法   总被引:1,自引:0,他引:1  
作为视频检索的一种重要线索,音频检测和分类受到广泛关注并已成为一个热门的研究方向.在新闻视频先验模型和结构的基础上,提出一种基于选择性集成SVM(SEN-SVM)的分类器设计方法.从而将新闻视频划分成静音、音乐、语音和带有背景音乐的语音这4种类型.用8 514s的真实新闻音频数据所作的仿真实验结果表明:所提出基于选择性集成SVM的新闻音频自动分类算法的平均准确率高达98.2%,远远高于单纯基于SVM的方法和传统的基于门限的方法.  相似文献   

6.
一种基于语义的图像数据库分类系统   总被引:3,自引:0,他引:3  
实现了一种分等级的图像数据库自动语义分类系统,其中主要涉及白天、夜晚、日出/日落、室内、室外、建筑物以及风景等几个典型的语义信息。通过对图像的信息以及现有底层特征的分析,针对各级分类提取了一些判别能力好的特征。采用支持向量机(SVM)作为分类器;同时为了提高分类准确率,将支持向量机的输出改为概率形式,引入拒绝机制来拒绝一些置信度较低的样本。将Coogle检索出来的图像作为系统的测试样本取得了很好的分类结果,实验表明本系统可以对Google检索系统的结果进行一定的改进。  相似文献   

7.
基于小波变换和支持向量机的音频分类   总被引:2,自引:0,他引:2       下载免费PDF全文
音频特征提取是音频分类的基础,而音频分类又是内容的音频检索的关键。综合分析了语音和音乐的区别性特征,提出一种基于小波变换和支持向量机的音频特征提取和分类的方法,用于纯语音、音乐、带背景音乐的语音以及环境音的分类,并且评估了新特征集合在SVM分类器上的分类效果。实验结果表明,提出的音频特征有效、合理,分类性能较好。  相似文献   

8.
基于SVM的图像分类研究   总被引:1,自引:0,他引:1  
图像分类技术有着重要的应用前景,而且对于基于内容的图像检索的发展会有积极的推动作用。多类图像分类是图像分类中的难点,对基于SVM的多类图像分类方法进行了研究,提出在二类支持向量机的基础上构造多类分类器的方法,实验结果证明和传统方法相比,分类准确率有了较大的提高。  相似文献   

9.
基于隐马尔可夫模型的音频自动分类   总被引:27,自引:0,他引:27  
卢坚  陈毅松  孙正兴  张福炎 《软件学报》2002,13(8):1593-1597
音频的自动分类,尤其是语音和音乐的分类,是提取音频结构和内容语义的重要手段之一,它在基于内容的音频检索、视频的检索和摘要以及语音文档检索等领域都有重大的应用价值.由于隐马尔可夫模型能够很好地刻画音频信号的时间统计特性,因此,提出一种基于隐马尔可夫模型的音频分类算法,用于语音、音乐以及它们的混合声音的分类.实验结果表明,隐马尔可夫模型的音频分类性能较好,最优分类精度达到90.28%.  相似文献   

10.
音频分类在多媒体应用中十分广泛,主要有时域分析和频域分析方法.文中提出了一种基于自适应间距比(APR)算法和支持向量机(SVM)算法的音频分类方法,先用APR算法区分语音与非语音;对于非语音,再通过SVM进行音频分类. APR算法是比较PR参数和阈值来区分语音和非语音,它和信噪比密切相关;而将非语音分成四组:音乐,汽车,会议,雨声,提取特征因子.实验结果表明:文中设计的分类器的精度达到93.75%以上,能很好地把各类型音频分开.  相似文献   

11.
Automatic Feature Extraction for Classifying Audio Data   总被引:1,自引:0,他引:1  
Today, many private households as well as broadcasting or film companies own large collections of digital music plays. These are time series that differ from, e.g., weather reports or stocks market data. The task is normally that of classification, not prediction of the next value or recognizing a shape or motif. New methods for extracting features that allow to classify audio data have been developed. However, the development of appropriate feature extraction methods is a tedious effort, particularly because every new classification task requires tailoring the feature set anew.This paper presents a unifying framework for feature extraction from value series. Operators of this framework can be combined to feature extraction methods automatically, using a genetic programming approach. The construction of features is guided by the performance of the learning classifier which uses the features. Our approach to automatic feature extraction requires a balance between the completeness of the methods on one side and the tractability of searching for appropriate methods on the other side. In this paper, some theoretical considerations illustrate the trade-off. After the feature extraction, a second process learns a classifier from the transformed data. The practical use of the methods is shown by two types of experiments: classification of genres and classification according to user preferences.  相似文献   

12.
通过提取基音频率、明亮度、带宽、过零率、响度、均方根、相邻点之间距离的均值和方差及Mel倒谱系数这8个特征构造特征集,在此基础上提出一种基于最近特征线的音频分类算法,对其进行枪声、鞭炮声、喇叭声及说话声的分类实验中,结果表明,该算法的分类效果较好,错误率可低至11.76%。  相似文献   

13.
文章处理的是中国民族乐器的识别分类问题.提出了一种基于合适的音频特征值选择方法,该方法在基于MPEG_7标准的声学特征,在特征值的时间特性上进行改造,并加入改进后的特征值.从提取的音频特征值数据集选择K-最近邻算法.特别是对没有加入新特征值和加入新特征值后生成分类器模型的性能进行了比较.实验结果证明新特征值的加入提高了分类器的F1度量值.  相似文献   

14.
语音/音乐自动分类中的特征分析   总被引:16,自引:0,他引:16  
综合分析了语音和音乐的区别性特征,包括音调,亮度,谐度等感觉特征与MFCC(Mel-Frequency Cepstral Coefficients)系数等,提出一种left-right DHMM(Discrete Hidden Markov Model)的分类器,以极大似然作为判别规则,用于语音,音乐以及它们的混合声音的分类,并且考察了上述特征集合在该分类器中的分类性能,实验结果表明,文中提出的音频特征有效,合理,分类性能较好。  相似文献   

15.
李晨  ;周明全 《微机发展》2008,(8):215-218
结合音频检索发展现状,描述了当前相关研究的进展,介绍了现在最常用到的音频检索方法,讨论了与音频检索相关的关键技术:音频特征提取、音频分割和分类。基于内容的音乐检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义。分析并总结出音乐内容及其检索的概念,给出音乐检索的系统结构,综述了基于内容的音乐检索方法,最后指出了音频检索发展的前景。  相似文献   

16.
李洁  刘鹏 《计算机与现代化》2007,(9):123-125,128
设计了一个对压缩音频进行基于内容分类的系统,并对系统各个模块的实现方法和原理进行了深入的分析和探讨.充分考虑到了人耳的听觉特性,利用编码器的计算结果和心理声学的研究成果,对从压缩音频中提取参数的含义做了透彻的分析,并通过实验检验了方法的有效性,从而在理论和实践两方面验证了方法的正确性和可行性.  相似文献   

17.
王晓峰  蒋先涛 《微机发展》2012,(10):59-61,65
音频分类在多媒体应用中十分广泛,主要有时域分析和频域分析方法。文中提出了一种基于自适应间距比(APR)算法和支持向量机(svrd)算法的音频分类方法,先用APR算法区分语音与非语音;对于非语音,再通过SVM进行音频分类。APR算法是比较PR参数和阈值来区分语音和非语音,它和信噪比密切相关;而将非语音分成四组:音乐,汽车,会议,雨声,提取特征因子。实验结果表明:文中设计的分类器的精度达到93.75%以上,能很好地把各类型音频分开。  相似文献   

18.
基于小波分析和DCT的人脸特征提取   总被引:3,自引:0,他引:3  
人脸特征提取是人脸识别中重要的一个环节。本文提出利用小波分析,对人脸图像进行压缩,然后对压缩后的图像进行离散余弦变换,将提取到的系数作为特征向量。把特征向量用支持向量机进行分类。本文以matlab7.0为开发平台在ORL和YALE人脸图像库中对该方法的可行性进行了测试。实验表明,该方法与传统的KLT方法相比可以减少运算时间,并提高识别率5%-10%左右。它在准确率和计算速度上都取得了良好效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号