首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
音频自动分类中的特征分析和抽取   总被引:8,自引:1,他引:8  
音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频”流”特征-High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.  相似文献   

2.
图像纹理特征提取方法综述   总被引:58,自引:6,他引:58       下载免费PDF全文
纹理是一种重要的视觉线索,是图像中普遍存在而又难以描述的特征。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出不穷。在广泛文献调研的基础上,回顾了纹理特征提取方法的发展历程,分析了其研究现状,对纹理特征提取方法进行了较为全面的综述,对其进行分类和比较,最后给出了纹理研究领域的主要发展趋势。  相似文献   

3.
4.
事件关系检测是一项面向文本信息流进行事件关系判定的自然语言处理技术。事件关系检测的核心任务是以事件为基本语义单元,通过分析事件之间的语义关联特征,实现事件逻辑关系的识别与判定,包括关系识别(即识别有无逻辑关系)和关系判定(即判定逻辑关系类型,如“因果”关系)。目前,专门面向事件的逻辑关系分析与处理,尚未形成一套完整的研究体系。针对这一问题,该文借助篇章分析、事件抽取和场景理解等相关领域中的概念与数据资源,尝试建立一套事件关系检测的任务和研究体系,包括任务定义、关系体系划分、语料采集与标注、评价方法等。同时,该文着重分析和对比了事件关系检测与篇章关系检测的差异,并给出了事件关系检测任务的难点与挑战。  相似文献   

5.
文章处理的是中国民族乐器的识别分类问题.提出了一种基于合适的音频特征值选择方法,该方法在基于MPEG_7标准的声学特征,在特征值的时间特性上进行改造,并加入改进后的特征值.从提取的音频特征值数据集选择K-最近邻算法.特别是对没有加入新特征值和加入新特征值后生成分类器模型的性能进行了比较.实验结果证明新特征值的加入提高了分类器的F1度量值.  相似文献   

6.
事件挖掘就是从大量的、不完全的、人们事先不知道的,但同时又是潜在有用的信息中提取有用信息并概括为事件的过程。由于事件挖掘相对于话题检测与跟踪、信息检索、信息抽取等自然语言处理具备许多共性,并且具备预测事件发展的优越性,因此逐渐成为当前事件识别领域的研究热点。本文介绍事件挖掘相关研究的历史发展与应用背景,全新定义事件挖掘的概念与任务,并详细介绍事件挖掘任务相关的各种关键算法,尤其是语义链算法。指出事件挖掘的重要意义及其未来的发展趋势。  相似文献   

7.
数字音频作为网络空间中广泛应用的媒体,是承载秘密信息的良好载体,常被用来构建实时性强、复杂度低、不可感知性好的隐蔽通信。音频隐写作为确保网络信息安全和数据保密通信的关键技术手段之一,正受到越来越多学者的关注。本文对音频隐写方法的发展脉络进行了系统性梳理。首先,介绍了音频隐写的基本内容,对问题描述、常用数据格式、工具和评价指标等进行总结。其次,按照嵌入域的不同,将传统音频隐写方法分为时域方法、变换域方法和压缩域方法,并分析其优缺点;根据隐写载体的不同,将基于深度学习的隐写方法划分为嵌入载体式、生成载体式和无载体式音频隐写,并对这3种音频隐写方法进行了对比分析。最后,指出了当前音频隐写进一步的研究方向。  相似文献   

8.
提出了一种利用训练数据的类别信息改善分类效果的音频特征提取方法.与传统的利用独立分量分析进行特征提取的方法相比,在计算训练向量空间的基函数组时,特征向量各分量之间的互信息不是直接在全体训练向量上计算的,而是分别在各个不同类的训练向量上计算,然后求其统计平均值.实验结果表明,用这种方法得到的基函数组,能够进一步减小同一类音频的特征向量各分量之间的互信息.从而提高分类的成功率.  相似文献   

9.
暴力镜头检测是近年来的研究热点之一。早期的暴力镜头检测主要依赖视频特征,由于音频信息具有良好的稳定性和在不同文化和人群之间的一致性,现在人们越来越多地关注音频信息的使用。为此研究使用音频特征对电影镜头中的暴力音频事件进行检测。为此提出了一种基于多尺度时长的特征提取方法。提取了除MFCC、LPC、能量等短时特征以外,还提取了能量均值方差、子带能量均值和方差、帧间差分等长时特征。暴力镜头中出现较多且具有代表性的音频事件有爆炸、尖叫、枪击三种。本文以电影的镜头为识别单位,使用支持向量机分类算法实现了一个检测系统。通过在15部好莱坞电影上的实验,表明本文基于多尺度时长的音频特征在暴力音频事件检测工作中,能够取得较好的结果。  相似文献   

10.
地物的"同物异谱"或"异物同谱"问题,使得仅仅依据高光谱影像的光谱信息较难得到理想的分类精度.纹理特征是地物空间分布的重要结构信息,能够一定程度上弥补光谱特征在高光谱遥感影像分类中的不足.纹理特征提取在高光谱遥感影像分类中得到了诸多发展,然而当前的纹理特征方法缺乏较为全面的对比分析.因此,选取旋转不变局部二值模式、简单...  相似文献   

11.
音频分类是提取音频结构和内容语义的重要手段,是基于内容的音频检索和分析的基础.本文对几种常用的音频分类算法作了综述,介绍了最小距离法、神经网络、支持向量机、决策树方法、隐马尔可夫模型等典型算法的特征,并对它们的优缺点进行了比较.  相似文献   

12.
为提高SSD算法检测目标的能力,提出了一种对多尺度特征图进行分类再提取的目标检测算法.该算法将SSD特征金字塔中多个不同尺度的特征图分为低层和高层两类特征图.针对低层特征图所处位置网络深度不够导致的特征表示能力不足,设计了SFE(Shallow Feature Enhancement)模块提取特征从而增加网络深度,最终...  相似文献   

13.
通过提取基音频率、明亮度、带宽、过零率、响度、均方根、相邻点之间距离的均值和方差及Mel倒谱系数这8个特征构造特征集,在此基础上提出一种基于最近特征线的音频分类算法,对其进行枪声、鞭炮声、喇叭声及说话声的分类实验中,结果表明,该算法的分类效果较好,错误率可低至11.76%。  相似文献   

14.
Automatic Feature Extraction for Classifying Audio Data   总被引:1,自引:0,他引:1  
Today, many private households as well as broadcasting or film companies own large collections of digital music plays. These are time series that differ from, e.g., weather reports or stocks market data. The task is normally that of classification, not prediction of the next value or recognizing a shape or motif. New methods for extracting features that allow to classify audio data have been developed. However, the development of appropriate feature extraction methods is a tedious effort, particularly because every new classification task requires tailoring the feature set anew.This paper presents a unifying framework for feature extraction from value series. Operators of this framework can be combined to feature extraction methods automatically, using a genetic programming approach. The construction of features is guided by the performance of the learning classifier which uses the features. Our approach to automatic feature extraction requires a balance between the completeness of the methods on one side and the tractability of searching for appropriate methods on the other side. In this paper, some theoretical considerations illustrate the trade-off. After the feature extraction, a second process learns a classifier from the transformed data. The practical use of the methods is shown by two types of experiments: classification of genres and classification according to user preferences.  相似文献   

15.
16.
医学图像分类是图像挖掘的一个重要研究领域.图像特征提取的质量直接影响分类的结果.针对着这种情况,提出了一种基于兴趣点的图像特征提取方法,首先通过滑动窗口区域的灰度变化提取图像的兴趣点,然后通过计算兴趣点邻域的方向测度提取特征数据,并用支持向量机(SVM)进行分类.实验结果显示,该特征在医学图像分类实验中取得了很好的效果.  相似文献   

17.
Classification and Feature Extraction by Simplexization   总被引:3,自引:0,他引:3  
Techniques for classification and feature extraction are often intertwined. In this paper, we contribute to these two aspects via the shared philosophy of simplexizing the sample set. For general classification, we present a new criteria based on the concept of -nearest-neighbor simplex (), which is constructed by the nearest neighbors, to determine the class label of a new datum. For feature extraction, we develop a novel subspace learning algorithm, called discriminant simplex analysis (DSA), in which the intraclass compactness and interclass separability are both measured by distances. Comprehensive experiments on face recognition and lipreading validate the effectiveness of the DSA as well as the -based classification approach.  相似文献   

18.
深度学习已经在视觉、语音等领域取得了巨大的成功,随着深度学习性能不断的提升,模型的参数也在不断增加.针对如何在保证模型准确度的同时降低模型大小,使其能够部署在物联网设备上的问题,提出了一种异常声音检测模型与模型压缩算法.异常声音检测模型主要包括端点检测、特征提取、卷积检测模型.针对卷积模型较大的问题,提出了一种模型压缩算法,通过计算节点的输入输出权重之和,裁剪对模型影响较小的节点.实验表明,该异常声音检测模型与压缩算法在保持模型准确度的同时,可以一定程度上降低模型的大小.  相似文献   

19.
本文提出了一种基于支持向量机分类器的水平集方法的图像特征提取方法,在提取图像特征的水平集方法应用中,通过改进水平集能量函数,引入区域信息,能够同时提取图像目标的内外边界,并且收敛速度快。提取图像特征之后通过支持向量机非线性分类器对待处理图像进行分类。  相似文献   

20.
为了实现对环境音频信号及其相关数据的自动分析,提出了一种环境音频数据分类方法。分类过程中,首先用短时平均幅度对音频数据进行有效分段;然后,计算分段音频数据的长度和平均过零率;最后,计算并生成一个分段音频数据的Mel频率倒谱系数(MFCC)和一阶差分Mel频率倒谱系数(△MFCC)特征参数。分类操作上,根据有效分段的长度和平均过零率确定分类搜索的范围,并在局部范围内采用DTW(Dynamic Time Warping,动态时间规整)分类算法。实验结果验证了该方法对各种环境音频数据分类的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号