首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 265 毫秒
1.
杨立东  王晶  谢湘  匡镜明 《信号处理》2015,31(2):221-225
提出一种利用Tucker分解获得鲁棒性较强的音频信号不同属性的特征,在高斯混合模型上测试音频信号分类性能的方法。音频信号经过预处理后,提取其不同类型特征集合,包括常规声学特征参数集合、听觉感知特征参数集合、心理声学特征参数集合;然后由三种特征集合构建三阶特征张量,通过Tucker分解得到每一类特征阶投影矩阵并进行主分量分析;最后使用包括音乐、语音、噪声3种类型的300条音频数据测试不同特征集合的分类效果,在此过程中使用了有监督学习的高斯混合模型作为分类器。实验中比较了不同特征集合使用高斯混合模型的分类正确率。实验结果表明,Tucker分解获得的特征集合实现了较好的分类,说明该方法性能优于传统特征集合。   相似文献   

2.
容宝华 《电声技术》2012,36(11):46-51,65
基于内容的音频分类是一个有趣并有重要意义的问题。音频分类技术包括音频特征抽取和分类器两个基本部分。如今,基于内容的音频自动分类技术已经有了很大的发展。然而,现有的基于内容的音频自动分类方法在分类的准确性、有效性和算法复杂度等诸多方面存在一定的不足,探索性能更佳的方法就成为了该领域的研究热点。提取了基于内容的音频分类所使用的音频特征,得到了基于帧的音频特征和基于片段的音频特征两个层次的特征,并提出了一种基于MFCC的简化的特征;选取了最小距离分类器中的最近邻分类器和K近邻分类器,对这几种典型的音频分类器进行研究,进行仿真实验,分析了实验结果;最后设计并仿真了经过改进的最小距离音频分类器,它的性能相对于原有的最近邻和K近邻分类器有一定的提高,并具有很低的系统复杂度和很短的分类时间。  相似文献   

3.
提出了一种把音频片段分类成语音或音乐的新系统.系统能自动选取在相应的信噪比下具有最高分类精度的特征参数.将从音频片段提取的特征参数值与门限值相比较进行语音/音乐的分类,其中的门限值与一定的信噪比相适应.介绍了一种新特征参数,即低频带能量率方差,在低信噪比环境下,它对分类精度有很大地提高.考察了系统在不同的信噪比环境下的分类性能.实验结果表明,所提系统分类性能良好.  相似文献   

4.
提出了一种把音频片段分类成语音或音乐的新系统。系统能自动选取在相应的信噪比下具有最高分类精度的特征参数。将从音频片段提取的特征参数值与门限值相比较进行语音/音乐的分类,其中的门限值与一定的信噪比相适应。介绍了一种新特征参数,即低频带能量率方差,在低信噪比环境下,它对分类精度有很大地提高。考察了系统在不同的信噪比环境下的分类性能。实验结果表明,所提系统分类性能良好。  相似文献   

5.
针对目前对于音频信息情感的研究较少以及对音频情感进行智能分析识别缺乏成熟技术的问题,文中提出了一种基于VGGish网络的音频信息情感智能识别算法.该算法通过VGGish网络提取音频信息的特征,利用降维可视化的方法不断调整不同情感音乐数据集分布,通过SVM和LSTM模型实现了音乐情感分类.算法测试结果表明,两种分类模型均...  相似文献   

6.
杨浩聪  史创  李会勇 《信号处理》2020,36(6):871-878
针对立体声音频采集设备逐渐普及的趋势,本文提出了一种保留立体声相位信息的声音场景分类算法。在预处理阶段,根据左右通道的相位信息对音频样本进行源环境提取,生成一种全新的四通道特征。在此基础上,通过集成多个卷积神经网络,搭建一个针对立体声音频样本的声音场景分类系统。区别于现有声音场景分类系统只使用时频谱幅度信息,本文所提出的方法保留了立体声音频的相位信息。这使得声学特征中所包含的空间方位信息更丰富,立体声音频的优势得到发挥。实验结果证明保留立体声相位信息的声音场景分类系统具有更好的性能,在2019年IEEE声学信号处理技术委员会举办的声音场景分类赛事中相比于基线系统的识别准确率提升了18.3%。   相似文献   

7.
为解决单一语音、音乐音频及其两者的混合音频进行语音/音乐分类时分类结果不准确的问题,提出一种基于音频分割的音频分类算法.利用能熵比特征进行音频分割,分割出的音乐段较为准确,而利用幅度均方根特征进行音频分割,分割出的语音段较为准确,避免了对语音段的过度分割.将两种分割方法分割所得音频段的起点和终点升序排列并两两组合形成新...  相似文献   

8.
汝学民  庄越挺  吴飞 《通信学报》2006,27(4):101-106
基于对同一隐写工具在同一音频载体中嵌入不同加密数据时载体特征量的统计观察,发现隐写工具存在自相关性。由此,提出了一种采用支持向量机对音频信号及其线性预测误差的统计特征进行分类来检测音频隐写的新方法。这种方法不仅能可靠地确定音频文档中秘密信息的存在性,同时还可以确定其所用的隐写工具。针对Hide4PGP、Stegowav和Steghide三种隐写工具的实验结果表明,这种音频隐写分析技术具有良好的性能。  相似文献   

9.
针对传统方法忽略时序信息的问题,提出了一种基于张量模型的暴力音频分类技术.该方法首先对音频样本提出矩阵特征,然后把同一类型的样本特征组成一个张量特征.采用ALS算法对张量进行分解,然后提出一个基于张量模型的分类器.实验结果表明,张量模型的特征对暴力音频分类问题具有一定提高效果,证明了保留时间维度上的信息是有意义的.  相似文献   

10.
传统音频分类任务仅仅是从单层次音频提取特征向量进行分类,即便使用过大的模型,其过多的参数也会造成特征之间的耦合,不符合特征提取“高聚类,低耦合”的原则。由于注意到一些与情绪相关的协变量并没有得到充分利用,本文在模型中加入性别先验知识;将多层次音频特征分类问题转化为多任务问题进行处理,从而对多层次特征进行解耦再进行分类;针对特征分布的再优化方面设计了一个中心损失模块。通过在IEMOCAP数据集上的实验结果表明,本文提出模型的加权精度(WA)和未加权精度(UA)分别达到了71.94%和73.37%,与原本的多层次模型相比,WA和UA分别提升了1.38%和2.35%。此外,还根据Nlinear和Dlinear算法设计了两个单层次音频特征提取器,在单层次音频特征分类实验中取得了较好的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号