共查询到20条相似文献,搜索用时 109 毫秒
1.
基于变分贝叶斯学习的音频水印盲检测方法 总被引:1,自引:0,他引:1
为了提高音频水印的检测性能,基于音频帧MFCC特征的统计特性,提出了一种音频水印盲检测方法。在音频帧的DCT系数上嵌入扩频水印,对嵌入水印的音频帧和原始音频帧分别提取MFCC特征进行训练,分别建立高斯混合模型,并通过变分贝叶斯学习方法估计出高斯混合模型的参数,检测时依据最大似然的原则。实验结果显示提出的方法在音频信号受到噪声干扰和恶意攻击的情况下,相对基于EM算法的方法在误检率上有明显降低,在小样本训练情况下具有更好的效果并且可以有效避免过拟合的问题。 相似文献
2.
基于内容的音乐语义特征描述方法 总被引:1,自引:0,他引:1
提出了一种基于内容的音乐语义特征描述方法。该方法通过提取音乐文件的低层音频特征参数,使用通俗易懂的关键词来描述音乐的高层语义特征,利用混合高斯模型(GMM)对每一个关键词进行训练来生成该类歌曲的模板,完成低层音频特征参数到高层语义特征的映射,最终完成音乐语义特征的关键词描述。本方法能够应用于基于内容的音乐检索、音乐推荐等领域,具有很强的通用性。 相似文献
3.
高斯混合模型采用固定混合数结构的建模方法并不符合说话人语音特征分布的多样性,从而出现过拟合或者欠拟合的情况并影响系统的识别性能。提出一种混合数可变的自适应高斯混合模型并将其应用于说话人识别。模型训练中根据说话人语音特征参数分布的聚类特性,采用吸收合并与分裂机制动态调整混合数以获得更加精确的拟合性能,提高系统识别率。实验结果显示,在特征参数MFCC和BFCC(Bilinear Frequency Cepstrum Coefficients)下相对误识率分别下降了41.41%和22.21%。 相似文献
4.
为了提高语音信号的识别率。提出了一种改进的LPCC参数提取方法。该方法先对语音信号进行预加重、分帧加窗处理。然后进行小波分解,在此基础上提取LPCC参数,从而构成新向量作为每帧信号的特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。 相似文献
5.
音频自动分类是解决音频结构化问题和提取音频内容语义的重要手段之一,是当前基于内容的音频检索领域的一个研究热点。在考察音频数据特征的基础上,针对左-右密度隐马尔可夫模型(left-right DHMM)不能很好反映音频中状态反复的缺点,提出了一种基于各态历经混合高斯密度隐马尔可夫模型(EMGD_HMM)的分类器,并应用于语音、音乐和它们的混合声音的分类。实验结果表明,EMGD_HMM的分类精度要优于left-right DHMM。 相似文献
6.
基于分类特征空间高斯混合模型和神经网络融合的说话人识别 总被引:2,自引:0,他引:2
该文提出了一种基于分类高斯混合模型和神经网络融合(FS-GMM/NN)的说话人识别方法,通过对特征矢量进行聚类分析,将说话人的训练语音分成若干类。然后根据各个类中含特征矢量的多少采用不同的模型混合度,训练建立分类高斯混合模型。并采用神经网络实现各个分类高斯混合模型输出的融合。在100个男性话者的与文本无关的说话人识别实验中,基于分类高斯混合模型和神经网络融合的方法在识别性能及噪声鲁棒性上都优于不分类的GMM识别系统,并具有较高的模型训练效率,且可以有效地降低话者模型的混合度和测试语音长度。 相似文献
7.
8.
为了更有效地提取滚动轴承各状态振动信号的特征,该文提出了一种基于集合经验模态分解(EEMD)的敏感固有模态函数(IMF)选择算法。该算法对振动信号经EEMD分解后得到的固有模态函数采用峭度值、相关系数相结合的方法自动提取其敏感分量,以此获得振动信号的初始特征。再运用奇异值分解和自回归(AR)模型方法得到滚动轴承各状态振动信号的特征向量,并将其输入到改进的超球多类支持向量机中进行智能识别,从而实现滚动轴承的正常状态,不同故障类型及不同性能退化程度的各状态识别。实验结果表明,相比基于经验模态分解结合自回归模型或奇异值分解的特征提取方法,该方法可更有效地提取滚动轴承故障特征信息,且识别精度更高。 相似文献
9.
10.
针对传统方法忽略时序信息的问题,提出了一种基于张量模型的暴力音频分类技术.该方法首先对音频样本提出矩阵特征,然后把同一类型的样本特征组成一个张量特征.采用ALS算法对张量进行分解,然后提出一个基于张量模型的分类器.实验结果表明,张量模型的特征对暴力音频分类问题具有一定提高效果,证明了保留时间维度上的信息是有意义的. 相似文献
11.
提出了一种把音频片段分类成语音或音乐的新系统。系统能自动选取在相应的信噪比下具有最高分类精度的特征参数。将从音频片段提取的特征参数值与门限值相比较进行语音/音乐的分类,其中的门限值与一定的信噪比相适应。介绍了一种新特征参数,即低频带能量率方差,在低信噪比环境下,它对分类精度有很大地提高。考察了系统在不同的信噪比环境下的分类性能。实验结果表明,所提系统分类性能良好。 相似文献
12.
提出了一种把音频片段分类成语音或音乐的新系统.系统能自动选取在相应的信噪比下具有最高分类精度的特征参数.将从音频片段提取的特征参数值与门限值相比较进行语音/音乐的分类,其中的门限值与一定的信噪比相适应.介绍了一种新特征参数,即低频带能量率方差,在低信噪比环境下,它对分类精度有很大地提高.考察了系统在不同的信噪比环境下的分类性能.实验结果表明,所提系统分类性能良好. 相似文献
13.
14.
宽带音频通信系统对传输信号有效带宽的限制会降低重建音频的主观质量和自然程度.本文提出了一种基于回声状态网络的宽带向超宽带音频盲目式频带扩展方法.该方法借助回声状态网络来模拟音频信号高低频频谱参数间的映射关系,并依据网络模型中的时延递归结构连续更新系统状态来近似描述音频特征的时域演变过程,有效地估计了高频成分的频谱包络.同时,结合频谱复制方法得到的高频频谱细节,该方法实现了宽带向超宽带音频的有效扩展.测试结果表明,本文所提方法提升了宽带音频的听觉质量;对于多数测试数据,该方法在静态和动态失真方面获得了优于高斯混合模型扩展方法的扩展性能. 相似文献
15.
针对合成孔径雷达(Synthetic Aperture Radar,SAR)图像目标识别问题,提出结合多源特征和高斯过程模型的方法。分别利用主成分分析(Principal Component Analysis,PCA)、非负矩阵分解(Non-negative Matrix Factorization,NMF)以及单演信号提取SAR图像的特征矢量,并将它们串接为单一矢量。三类特征从不同角度描述SAR图像目标特性,从而为目标识别提供更为有效的信息。决策分类过程采用高斯过程模型进行多元分类,基于融合特征矢量获得概率意义上的最佳决策。实验中,采用MSTAR数据集设置3类目标、10类目标、型号差异以及俯仰角差异识别问题,结果验证了提出方法的优越性能。 相似文献
16.
17.
陆上集群无线电(Terrestrial Trunked Radio,TETRA)数字集群通信系统因其开放性易受到内外部电磁干扰。干扰信号的类型多种多样,针对不同的干扰样式,采取的抗干扰措施也各不相同,因此干扰信号的识别具有重大意义。基于此,提出了一种干扰信号智能识别技术。该技术首先对受到不同干扰后的TETRA音频数据进行特征提取,并筛选出具有分类能力的特征,其次使用决策树、支持向量机和随机森林3种分类模型对特征提取后的待测试信号进行智能分类识别。实验结果表明,使用的这3种模型能够有效判断TETRA系统中的信号是否受到干扰,以及受到何种样式的干扰,可为后续TETRA系统中的信号干扰识别提供参考。 相似文献
18.
数字音频指纹技术在音频信号分析和处理中起着重要作用。针对传统基于时频分析的音频指纹提取算法中仅使用信号能量作为特征参数,而无法全面表征出信号的复杂度和不规则性问题,提出了基于小波包分解与重构,将小波包系数的奇异值熵和样本熵相结合,作为音频信号的特征参数提取指纹。实验证明,该算法提取的指纹提高了音频识别的准确率,在常见信号处理下能保持较强的鲁棒性,并具有明显的区分音频和定位音频篡改位置的能力。 相似文献
19.
基于内容的音频分类是一个有趣并有重要意义的问题。音频分类技术包括音频特征抽取和分类器两个基本部分。如今,基于内容的音频自动分类技术已经有了很大的发展。然而,现有的基于内容的音频自动分类方法在分类的准确性、有效性和算法复杂度等诸多方面存在一定的不足,探索性能更佳的方法就成为了该领域的研究热点。提取了基于内容的音频分类所使用的音频特征,得到了基于帧的音频特征和基于片段的音频特征两个层次的特征,并提出了一种基于MFCC的简化的特征;选取了最小距离分类器中的最近邻分类器和K近邻分类器,对这几种典型的音频分类器进行研究,进行仿真实验,分析了实验结果;最后设计并仿真了经过改进的最小距离音频分类器,它的性能相对于原有的最近邻和K近邻分类器有一定的提高,并具有很低的系统复杂度和很短的分类时间。 相似文献
20.
提出了一种基于Gabor变换、KPCA和神经网络的图像分类方法。首先对图像进行Gabor滤波,获得不同方向的特征参数;然后提取图像的KPCA作为图像的特征,最后利用神经网络进行分类。通过对实验分类结果的定量分析可知,该方法可以获得精度比最小分类模型方法以及最大似然分布模型方法高的分类结果。 相似文献