共查询到19条相似文献,搜索用时 156 毫秒
1.
基于分形布朗运动和Ada Boosting的多类音频例子识别 总被引:2,自引:0,他引:2
提出了一种基于分形布朗运动的音频特征提取和识别方法.这种方法使用分形布朗运动模型计算出音频例子的分形维数,并作为其分形特征.针对音频分形特征符合高斯分布的特点,使用Ada Boosting算法进行特征约减.然后分别使用Ada-加权高斯分类器和支持向量机对约减特征后的音频分类,并在两类分类的基础上构造多类分类的模型.实验表明,经过特征约减后的音频分形特征在音乐和语音的分类中都优于其他音频特征. 相似文献
2.
音频具有数据量大、维数高等特点,直接进行音频检索会造成“特征维数灾难”,因此有必要从音频提取最能表现音频特征的音频帧。提出一种基于模糊粗糙集模型(Fuzzy Rough Set Model,FRSM)的音频数据约简算法,根据隶属度对音频数据进行模糊离散,基于知识表达能力约简属性,以等价划分计算具有等同分类能力的知识核。实验结果表明,该算法能够得到最小约简,并且最大程度地保持音频特征,提高检索效率。 相似文献
3.
肝癌分类检测以区分正常肝脏与病变肝脏及确定肝脏病变的类别为主要目的。k-近邻算法是一种基于统计的经典分类方法,具有简单、有效的特点。该文针对k-近邻算法的具体分类过程,结合肝癌分类检测过程中的常用特征(纹理特征、形状特征),将纹理与形状特征分别应用于k-近邻算法分类过程中,获得了较好的实验效果。 相似文献
4.
文本自动分类中特征权重算法的改进研究 总被引:28,自引:3,他引:25
文章研究并改进了文本自动分类中的特征权重算法。传统的特征权重算法着重于考虑频率和反文档频率等因素,而未考虑特征的类间、类内分布与低频高权信息。该文重点研究了特征的类间、类内分布,以及低频高权特征对分类的影响,并在此基础上提出了低频高权特征集的构造方法及特征权重的新算法,同时将该算法推广到多层次分类体系。实验证明该算法能有效提高分类的精确度,而且在多级分类中也能取得很好的效果。 相似文献
5.
6.
7.
不平衡分类问题广泛存在于医疗、经济等领域,对于不平衡数据集分类,特别是高维数据分类时,有效的特征选择算法至关重要。然而多数特征选择算法未考虑特征协同的影响,导致分类性能下降。对FAST特征选择算法进行改进,并考虑特征的协同作用,提出一种新的特征选择算法FSBS。运用AUC对特征进行评估,以相互增益衡量协同作用大小,选出有效特征,进而对不平衡数据进行分类。实验结果表明,该算法能有效地选择特征,尤其在特征数量较少的情况下可保持较高的分类准确率。 相似文献
8.
9.
基于特征加权的KNNFP改进算法及在故障诊断中的应用 总被引:2,自引:1,他引:1
针对传统K最近邻特征投影(KNNFP)算法中假设各维特征对分类的贡献相同而导致分类性能下降的问题,提出一种基于特征加权的KNNFP改进算法(WKNNFP).改进算法利用ReliefF算法确定特征的权值,使样本的分类效果更好,同时还可以分析各特征对分类的贡献程度,并利用改进算法对轴承故障进行诊断.结果表明,改进算法的诊断... 相似文献
10.
以高脂血症文献分类为背景,通过对传统特征选择算法的研究,结合特征出现概率、特征与类别的相关度,提出一种基于二类信息差值的特征选择方法。使用该算法及k近邻距离分类法在高脂血症文献数据集上进行分类,实验显示该算法优于文档频率和信息增益,可提高文本分类的查准率。 相似文献
11.
针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法。该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化,最后输出分类结果。在TIMIT和Voicebank数据库上,所提算法的检测准确率最高可达100%,错误接收率最低仅为1.37%。在现实场景下检测由多种不同录音设备录制的带有设备本底噪声以及原始场景声音频,该算法的检测准确率最高可达99.27%。实验结果表明,在合适的模型下利用音频的CQCC特征来检测音频的场景替换痕迹是有效的。 相似文献
12.
13.
14.
语音/音乐自动分类中的特征分析 总被引:16,自引:0,他引:16
综合分析了语音和音乐的区别性特征,包括音调,亮度,谐度等感觉特征与MFCC(Mel-Frequency Cepstral Coefficients)系数等,提出一种left-right DHMM(Discrete Hidden Markov Model)的分类器,以极大似然作为判别规则,用于语音,音乐以及它们的混合声音的分类,并且考察了上述特征集合在该分类器中的分类性能,实验结果表明,文中提出的音频特征有效,合理,分类性能较好。 相似文献
15.
针对传统的二分类音频隐写分析方法对未知隐写方法的适应性较差的问题,提出了一种基于模糊C均值(FCM)聚类与单类支持向量机(OC-SVM)的音频隐写分析方法。在训练过程中,首先对训练音频进行特征提取,包括短时傅里叶变换(STFT)频谱的统计特征和基于音频质量测度的特征,然后对所提取的特征进行FCM聚类得到C个聚类,最后送入多个超球面的OC-SVM分类器进行训练;检测过程中,对测试音频进行特征提取,根据多个超球面OC-SVM分类器的边界对待测音频进行检测。实验结果表明,该隐写分析方法对于几种典型的音频隐写方法能够较为正确地检测,满容量嵌入时,测试音频的总体检测率达到85.1%,与K-means聚类方法相比,所提方法的检测正确率提高了至少2%。该隐写分析方法比二分类的隐写分析方法更具有通用性,更适用于隐写方法事先未知情况下的隐写音频的检测。 相似文献
16.
17.
基于内容的自适应小波域数字音频水印算法研究 总被引:2,自引:0,他引:2
以整型提升小波变换、静态图像压缩编码、人类听觉系统(HAS)为基础,提出了一种将灰度图像(即二维数字水印)嵌入到数字音频信号的新水印算法.该算法具有以下特点:(1)应用静态图像压缩编码技术,实现了以灰度图像作为水印信号的数字音频水印算法;(2)充分利用人类听觉系统(HAS),实现了二维数字水印的自适应嵌入,增强了算法的透明性和鲁棒性,(3)二维数字水印的提取不需要原始音频信号.仿真实验表明:该自适应数字音频水印算法不仅具有较好的透明性,而且对诸如叠加噪声、有损压缩、低通滤波、重新采样、重新量化等攻击均具有较好的鲁棒性. 相似文献
18.
为了更好地描述非平稳音频信号的特征,提出了一种基于Gabor字典和稀疏表示权重张量的时-频音频特征提取方法。该方法基于Gabor字典将音频信号编码为稀疏的权重向量,并进一步将权重向量中的元素重新排列为张量形式,该张量各阶分别刻画了信号的时间、频率以及时长特性,为信号的联合时-频-长表示。通过对该张量进行因子分解,将分解后得到的频率因子和时长因子拼接为音频特征。针对稀疏张量分解时容易产生过拟合的问题,提出一种自调整惩罚参数分解算法并进行了改进。实验结果显示,所提出的特征相对于传统梅尔倒谱系数(MFCC)特征、MFCC特征及匹配追踪算法(MP)求解的特征联合拼接得到的MFCC+MP特征和非均匀尺度-频率图特征对15类音效分类效果分别提升了28.0%、19.8%和6.7%。 相似文献
19.
基于离散余弦变换的自适应数字音频水印技术研究 总被引:9,自引:1,他引:9
提出了一种将灰度图像嵌入到音频信号的数字水印算法 .该算法以包含丰富信息的灰度图像作为数字水印 ,首先利用 DCT静态图像压缩技术 ,将二维数字水印 (灰度图像 )编码成一维二进制序列并进行随机置乱 ,再对数字音频信号进行分段处理并依据人类听觉系统 (HAS)择段做离散余弦变换 (DCT) ,最后在离散余弦变换域内通过修改中高频 DCT系数完成水印信息的自适应嵌入 .实验结果表明 :该自适应数字音频水印算法不仅具有较好的透明性 ,而且对诸如叠加噪声、有损压缩、低通滤波、重新采样、重新量化等攻击均具有较好的鲁棒性 相似文献