首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
音频自动分类中的特征分析和抽取   总被引:8,自引:1,他引:8  
音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频”流”特征-High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.  相似文献   

2.
3.
文章处理的是中国民族乐器的识别分类问题.提出了一种基于合适的音频特征值选择方法,该方法在基于MPEG_7标准的声学特征,在特征值的时间特性上进行改造,并加入改进后的特征值.从提取的音频特征值数据集选择K-最近邻算法.特别是对没有加入新特征值和加入新特征值后生成分类器模型的性能进行了比较.实验结果证明新特征值的加入提高了分类器的F1度量值.  相似文献   

4.
事件挖掘就是从大量的、不完全的、人们事先不知道的,但同时又是潜在有用的信息中提取有用信息并概括为事件的过程。由于事件挖掘相对于话题检测与跟踪、信息检索、信息抽取等自然语言处理具备许多共性,并且具备预测事件发展的优越性,因此逐渐成为当前事件识别领域的研究热点。本文介绍事件挖掘相关研究的历史发展与应用背景,全新定义事件挖掘的概念与任务,并详细介绍事件挖掘任务相关的各种关键算法,尤其是语义链算法。指出事件挖掘的重要意义及其未来的发展趋势。  相似文献   

5.
提出了一种利用训练数据的类别信息改善分类效果的音频特征提取方法.与传统的利用独立分量分析进行特征提取的方法相比,在计算训练向量空间的基函数组时,特征向量各分量之间的互信息不是直接在全体训练向量上计算的,而是分别在各个不同类的训练向量上计算,然后求其统计平均值.实验结果表明,用这种方法得到的基函数组,能够进一步减小同一类音频的特征向量各分量之间的互信息.从而提高分类的成功率.  相似文献   

6.
暴力镜头检测是近年来的研究热点之一。早期的暴力镜头检测主要依赖视频特征,由于音频信息具有良好的稳定性和在不同文化和人群之间的一致性,现在人们越来越多地关注音频信息的使用。为此研究使用音频特征对电影镜头中的暴力音频事件进行检测。为此提出了一种基于多尺度时长的特征提取方法。提取了除MFCC、LPC、能量等短时特征以外,还提取了能量均值方差、子带能量均值和方差、帧间差分等长时特征。暴力镜头中出现较多且具有代表性的音频事件有爆炸、尖叫、枪击三种。本文以电影的镜头为识别单位,使用支持向量机分类算法实现了一个检测系统。通过在15部好莱坞电影上的实验,表明本文基于多尺度时长的音频特征在暴力音频事件检测工作中,能够取得较好的结果。  相似文献   

7.
音频分类是提取音频结构和内容语义的重要手段,是基于内容的音频检索和分析的基础.本文对几种常用的音频分类算法作了综述,介绍了最小距离法、神经网络、支持向量机、决策树方法、隐马尔可夫模型等典型算法的特征,并对它们的优缺点进行了比较.  相似文献   

8.
为提高SSD算法检测目标的能力,提出了一种对多尺度特征图进行分类再提取的目标检测算法.该算法将SSD特征金字塔中多个不同尺度的特征图分为低层和高层两类特征图.针对低层特征图所处位置网络深度不够导致的特征表示能力不足,设计了SFE(Shallow Feature Enhancement)模块提取特征从而增加网络深度,最终...  相似文献   

9.
Automatic Feature Extraction for Classifying Audio Data   总被引:1,自引:0,他引:1  
Today, many private households as well as broadcasting or film companies own large collections of digital music plays. These are time series that differ from, e.g., weather reports or stocks market data. The task is normally that of classification, not prediction of the next value or recognizing a shape or motif. New methods for extracting features that allow to classify audio data have been developed. However, the development of appropriate feature extraction methods is a tedious effort, particularly because every new classification task requires tailoring the feature set anew.This paper presents a unifying framework for feature extraction from value series. Operators of this framework can be combined to feature extraction methods automatically, using a genetic programming approach. The construction of features is guided by the performance of the learning classifier which uses the features. Our approach to automatic feature extraction requires a balance between the completeness of the methods on one side and the tractability of searching for appropriate methods on the other side. In this paper, some theoretical considerations illustrate the trade-off. After the feature extraction, a second process learns a classifier from the transformed data. The practical use of the methods is shown by two types of experiments: classification of genres and classification according to user preferences.  相似文献   

10.
11.
Classification and Feature Extraction by Simplexization   总被引:3,自引:0,他引:3  
Techniques for classification and feature extraction are often intertwined. In this paper, we contribute to these two aspects via the shared philosophy of simplexizing the sample set. For general classification, we present a new criteria based on the concept of -nearest-neighbor simplex (), which is constructed by the nearest neighbors, to determine the class label of a new datum. For feature extraction, we develop a novel subspace learning algorithm, called discriminant simplex analysis (DSA), in which the intraclass compactness and interclass separability are both measured by distances. Comprehensive experiments on face recognition and lipreading validate the effectiveness of the DSA as well as the -based classification approach.  相似文献   

12.
医学图像分类是图像挖掘的一个重要研究领域.图像特征提取的质量直接影响分类的结果.针对着这种情况,提出了一种基于兴趣点的图像特征提取方法,首先通过滑动窗口区域的灰度变化提取图像的兴趣点,然后通过计算兴趣点邻域的方向测度提取特征数据,并用支持向量机(SVM)进行分类.实验结果显示,该特征在医学图像分类实验中取得了很好的效果.  相似文献   

13.
深度学习已经在视觉、语音等领域取得了巨大的成功,随着深度学习性能不断的提升,模型的参数也在不断增加.针对如何在保证模型准确度的同时降低模型大小,使其能够部署在物联网设备上的问题,提出了一种异常声音检测模型与模型压缩算法.异常声音检测模型主要包括端点检测、特征提取、卷积检测模型.针对卷积模型较大的问题,提出了一种模型压缩算法,通过计算节点的输入输出权重之和,裁剪对模型影响较小的节点.实验表明,该异常声音检测模型与压缩算法在保持模型准确度的同时,可以一定程度上降低模型的大小.  相似文献   

14.
本文提出了一种基于支持向量机分类器的水平集方法的图像特征提取方法,在提取图像特征的水平集方法应用中,通过改进水平集能量函数,引入区域信息,能够同时提取图像目标的内外边界,并且收敛速度快。提取图像特征之后通过支持向量机非线性分类器对待处理图像进行分类。  相似文献   

15.
实蝇图像识别中的形态特征提取研究   总被引:1,自引:0,他引:1  
研究特征提取是图像识别中的重要环节,为更加准确地对云南省常见的有害果蔬实蝇进行分类,针对实蝇昆虫的特点,对形态学特征的提取、测量和选择进行了研究.分别对实蝇整体和躯干部分提取了16种形态特征作为原始特征,包括新提出的描述昆虫斑点面积比例的空心度和描述昆虫体型比例的质心距离比的定义.采用一种改进的基于支持向量机(SVM)的特征选择方法并应用此方法对原始特征进行筛选,根据各维特征的贡献大小最终得到9个最优特征.进行仿真的结果显示,对实蝇识别分类取得了良好的效果,有利于后期昆虫分类.  相似文献   

16.
随着物联网、大数据和人工智能等技术研究和应用的蓬勃发展,各类时间序列数据不断涌现.时间序列数据特征是表象,内在蕴含着丰富的领域知识,如何高效分析时间序列特征模式,提取可辨识的时间序列特征,挖掘数据蕴含的规律,正成为业界研究的热点.本文首先介绍时间序列概念,综述了时间序列分类、聚类和预测三方面研究的最新进展;然后从时间序...  相似文献   

17.
为了实现对环境音频信号及其相关数据的自动分析,提出了一种环境音频数据分类方法。分类过程中,首先用短时平均幅度对音频数据进行有效分段;然后,计算分段音频数据的长度和平均过零率;最后,计算并生成一个分段音频数据的Mel频率倒谱系数(MFCC)和一阶差分Mel频率倒谱系数(△MFCC)特征参数。分类操作上,根据有效分段的长度和平均过零率确定分类搜索的范围,并在局部范围内采用DTW(Dynamic Time Warping,动态时间规整)分类算法。实验结果验证了该方法对各种环境音频数据分类的有效性。  相似文献   

18.
This paper seeks to present an algorithm for the prediction of frontal spatial fidelity and surround spatial fidelity of multichannel audio, which are two attributes of the subjective parameter called basic audio quality. A number of features chosen to represent spectral and spatial changes were extracted from a set of recordings and used in a regression model as independent variables for the prediction of spatial fidelities. The calibration of the model was done by ridge regression using a database of scores obtained from a series of formal listening tests. The statistically significant features based on interaural cross correlation and spectral features found from an initial model were employed to build a simplified model and these selected features were validated. The results obtained from the validation experiment were highly correlated with the listening test scores and had a low standard error comparable to that encountered in typical listening tests. The applicability of the developed algorithm is limited to predicting the basic audio quality of low-pass filtered and down-mixed recordings (as obtained in listening tests based on a multistimulus test paradigm with reference and two anchors: a 3.5-kHz low-pass filtered signal and a mono signal).  相似文献   

19.
基于句法结构特征分析及分类技术的答案提取算法   总被引:1,自引:0,他引:1  
由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该方法将答案提取问题看成是候选答案的分类问题,即将候选答案分类为正确和错误两类.首先,该方法根据与问题类型所对应的候选答案的类型信息,从文本片断中提取出候选答案及其在句子中的简单特征和句法结构特征;然后利用这些特征训练分类器;最后用训练得到的分类器判别候选答案是否为正确答案.针对中文事实性问题,该方法与目前典型的基于模式匹配的中文答案提取算法相比,准确率提升6.2%,MRR提升9.7%.  相似文献   

20.
Automatic identification of humans based on their fingers is still one of the most reliable identification methods in criminal and forensic applications. Identification by fingerprint involves two processes: fingerprint feature extraction and feature classification. The basic idea of fingerprint feature extraction algorithms proposed is to locate the coarse features of fingerprints called singular-points using directional fields of the fingerprint image. The features are then classified by different types of neural networks. The five-class classification problem is addressed on the NIST-4 database of fingerprints. A maximum classification accuracy of 93.75% was achieved and the result shows a performance comparable to previous studies using either coarse features or the finer features called minutiae.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号