首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于PCA和CHMM的音频自动分类*   总被引:1,自引:0,他引:1  
针对DHMM分类器对音频特征进行向量量化引起的误差及特征维数过多导致计算复杂度过大的问题,提出了一种新的基于PCA和CHMM的音频自动分类方法。它先将音频特征组成一个高维向量,然后使用PCA对这些高维向量进行降维,再使用CHMM分类器对降维后的特征进行分类。实验证明了PCA和CHMM音频分类的有效性。  相似文献   

2.
音乐类型(Genre)是应用最普遍的管理数字音乐数据库的方式,提出一种基于隐马尔可夫模型(Hidden Markov Models,HMMs)的音乐自动分类方案。在考虑传统的音色特征(Timbre)的同时,将另一重要特征节奏(Tempo)也加以考虑,并通过bagging训练两组HMM进行分类,达到了良好的效果。从结构、状态数和混合高斯模型数三个方面进行了参数优化,找到了最佳的HMM参数。在音乐数据集GTZAN上对传统模型和新模型分类效果进行了测试,结果表明考虑了节奏特征的HMM分类效果更佳。  相似文献   

3.
指纹分类是针对大型指纹库的一个重要的索引方式,可以有效地提高指纹匹配的效率.指纹类型的不同表现为指纹纹理结构的差异,而指纹的方向场则可以有效地描述纹理结构的差异.同一类型指纹不同区域上方向角结构的差异以及相邻区域间方向角结构的联系可以视作一个马尔可夫随机场.本文利用嵌入式隐马尔可夫模型对指纹方向场进行建模分析,通过合理地抽取指纹的类型特征,构造观察向量、进行建模训练,然后利用训练好的马尔可夫模型进行匹配,最终提出并实现了一种新的鲁棒性强且精度较高的指纹分类方法.  相似文献   

4.
作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略.为了弥补这一不足,本文介绍了一个音频语义检索原型系统,在这个系统中,音频信号被分层次处理:首先分析音频信息中的短时能量、过零率和基本频率能量比等特征,音频信息流被按层次粗分为静音、和谐音乐、对话和环境背景音四类;由于环境背景音蕴涵了大量语义,环境背景音被继续细分,并用训练好的隐马尔可夫链表示每类环境背景音以进行语义检索.实验数据表明,这样的音频查询处理方式取得了良好效果.  相似文献   

5.
基于内容的音频分类是基于内容的音频检索技术中的重要研究内容。先简单介绍音频分类的理论基础,然后介绍几种典型的音频分类方法,最后通过一个简单的SVM算法进行模拟实验。  相似文献   

6.
移动互联网技术的快速发展,对移动终端定位方法提出了新的要求.针对传统方法在功耗、精度、通用性方面往往不能兼顾的问题,在充分挖掘个人行为习惯的基础上,提出了一种基于隐马尔可夫模型的定位算法.该算法根据地图信息对基站覆盖区域进行路段划分,通过记录个人的行走轨迹,利用其统计规律来辅助建立GSM信号的隐马尔可夫模型,通过测量基站的信号强度序列,完成对当前位置给出较为精确的估计.实验结果表明该算法在保证低功耗的同时有效提高了定位精度.  相似文献   

7.
经典的隐马尔可夫模型(HMM)是一种基于统计信号的模型,它在基于内容的音频检索系统中具有重要的作用。根据音频分类重类型轻内容的特性,将单状态的HMM用于音频分类,克服了多状态HMM在模型初始化时状态初始概率和转移概率赋值带有假设不准确的缺点。实验结果表明基于单状态的HMM模型音频分类方法能有效地减少误识率,提高音频分类的精确度。  相似文献   

8.
音频自动分类中的特征分析和抽取   总被引:8,自引:1,他引:8  
音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频”流”特征-High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.  相似文献   

9.
基于隐马尔可夫链的广播新闻分割分类   总被引:4,自引:2,他引:4  
提出了使用具有模拟随机时序数据良好能力的隐马尔可夫链来完成广播新闻分割分类的算法,首先使用含隐藏语义状态的隐马尔可夫链把原始广播新闻粗略分类成开始/结束和语音两部分,其次应用3个隐马尔可夫链,按照最大似然概率法把语音片段预识别为主持人介绍、广告和天气预报,最后由语义变化速率识别出新闻现场报道,完成广播新闻的精细分割分类任务。  相似文献   

10.
一种改进的基于说话者的语音分割算法   总被引:13,自引:1,他引:13  
卢坚  毛兵  孙正兴  张福炎 《软件学报》2002,13(2):274-279
语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的阈值选取方法;(2) 引入BIC可测度概念来度量其适用范围;(3) BIC信息准则校准非冗余的候选分割点的偏差.实验结果表明,此改进算法优于原算法.  相似文献   

11.
隐马尔可夫模型是对DNA序列建模的一种简单且有效的模型, 实际应用中通常采用一阶隐马尔可夫模型. 然而, 由于其一阶无后效性的特点, 一阶隐马尔科夫模型无法表示非相邻碱基间的依赖关系, 从而导致序列中一些有用统计特征的丢失. 本文在分析DNA序列特有的生物学构造的基础上, 提出一种用于DNA序列分类的二阶隐马尔可夫模型, 该模型继承了一阶隐马尔可夫模型的优点, 充分表达了蕴涵在DNA序列中的生物学统计特征, 使得新模型具有明确的生物学意义. 基于新模型, 提出一种DNA序列的贝叶斯分类新方法, 并在实际DNA序列上进行了实验验证. 实验结果表明, 由于二阶隐马尔可夫模型充分反映了DNA序列碱基间的结构信息, 新方法有效地提高了序列的分类精度.  相似文献   

12.
基于SVM-HMM混合模型的说话人确认   总被引:8,自引:0,他引:8  
提出一个文本无关的说话人确认的算法。该算法将支持向量机(SVM)的输出通过Sigmoid函数和高斯模型转化为概率,并作为隐式马尔可夫模型(HMM)中各个隐状态的输出概率。由于HMM适于处理连续信号,SVM适于处理分类问题;同时,HMM更多地表达了类别内部的相似性,而SVM则很大程度上反映了类别间的差异,因而根据两者不同的侧重点,使其组合获得了很好的效果。  相似文献   

13.
计算机系统入侵检测的隐马尔可夫模型   总被引:32,自引:0,他引:32  
入侵检测技术作为计算机安全技术的一个重要组成部分,现在受到越来越广泛的关注,首先建立了一个计算机系统运行状况的隐马尔可夫模型(HMM),然后在此模型的基础上提出了一个用于计算机系统实时异常检测的算法,以及该模型的训练算法。这个算法的优点是准确率高,算法简单,占用的存储空间很小,适合用于在计算机系统上进行实时检测。  相似文献   

14.
基于隐马尔科夫模型的DNA序列分类方法   总被引:1,自引:0,他引:1  
DNA序列分类是生物信息学的一项基础任务,目的是根据结构或功能的相似性预测DNA序列所属的类别。为进行有效分类,如何将序列映射到特征向量空间并最大程度地保留序列中蕴含的碱基间顺序关系是一项困难的任务。为克服现有方法容易导致因DNA序列碱基残缺而影响分类精度等问题,提出一种新的DNA序列特征表示方法。新方法首先为每条序列训练一个隐马尔科夫模型(HMM),然后将DNA序列投影到由HMM状态转移概率矩阵的特征向量构成的向量空间中。基于这种新的特征表示法,构造了一种 K-NN分类器对DNA序列进行分类。实验结果表明,新型特征表示方法可以较为完整地保留 DNA 序列中不同碱基间的关系,充分反映序列的结构信息,从而有效提高了序列的分类精度。  相似文献   

15.
In this paper, we first introduce the use of an interactive hidden Markov model (IHMM) for modeling and analyzing default data in a sector. Under the IHMM, transitions of the hidden risk states of the sector depend on the observed number of bonds in the sector that default in the current time period. This incorporates the feedback effect of the number of defaults on the transitions of the hidden risk states. This feature seems to be more realistic and does not enjoy by the traditional HMMs. We then develop a “dynamic” version of the binomial expansion technique (BET) modulated by the IHMM for modeling the occurrence of defaults of bonds issued by firms in the same sector. Under the BET modulated by the IHMM, the number of bonds defaulting in each time period follows a Markov-modulated binomial distribution with the probability of defaulting of each bond depending on the states of the IHMM, which represent the hidden risk states of the sector. Efficient method will be presented for estimating the model parameters in the BET modulated by the IHMM. We shall compare the hidden risk state process extracted from the IHMM-modulated BET with that extracted from the BET modulated by HMM in order to illustrate the significance of the feedback effect using real data. We shall also present the estimation results for the BET modulated by the IHMM and compare them with those for the BET modulated by the HMM.  相似文献   

16.
简单介绍了GBS(全球广播业务)系统, 对其承载的业务进行分析, 提出了基于隐马尔可夫模型的业务流量建模方法. 在Qualnet中搭建了GBS仿真场景, 生成并测量了业务流量. 并在Matlab中实现了对GBS系统中四种业务流量的建模. 结果表明, 该模型只选用数据包大小和数据包间隔等受加密技术影响不大的流量特征进行建模, 更能真实地反映GBS系统的业务流量特征. 采用离散型的随机变量, 降低了建模的计算复杂度, 减少了建模时间, 提高了实时性.  相似文献   

17.
语音/音乐自动分类中的特征分析   总被引:16,自引:0,他引:16  
综合分析了语音和音乐的区别性特征,包括音调,亮度,谐度等感觉特征与MFCC(Mel-Frequency Cepstral Coefficients)系数等,提出一种left-right DHMM(Discrete Hidden Markov Model)的分类器,以极大似然作为判别规则,用于语音,音乐以及它们的混合声音的分类,并且考察了上述特征集合在该分类器中的分类性能,实验结果表明,文中提出的音频特征有效,合理,分类性能较好。  相似文献   

18.
图像轮廓波变换及变换域隐马尔可夫模型的应用   总被引:1,自引:1,他引:0       下载免费PDF全文
鉴于2维张量积小波已被证实不能为分片光滑图像提供理想表达,从而促使了近年来各种“超越小波”的变换理论和方法的出现。其中轮廓波变换因其理论新颖、技术思想先进、实效显著而具有深入研究的前景和潜力。为了使人们对轮廓波变换有一概略了解,首先以轮廓波变换原理及变换域隐马尔可夫模型为主线,并对关键点给出了详细论述;然后从宏观角度对轮廓波变换进行了深入浅出的综述;最后通过与小波变换的应用对比、分析,指出了轮廓波的应用潜力之所在,以及更进一步的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号