首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
提出了一种基于小波包分解和多类支持向量机分类的音频隐秘检测算法,该算法首先对音频文件进行小波包分解,然后根据小波分解系数绝对值和绝对值线性预测的误差生成特征向量,并采用多类支持向量机进行模式分类。在不同嵌入率下对几种常见的隐秘软件生成的隐秘音频进行仿真试验,结果表明,该算法具有较强的通用性,对于隐密音频文件具有较高的识别率。  相似文献   

2.
为了对音频信号进行有效地分类,提出了基于模糊综合和最优小波包分解的信号多类分类算法。首先,对音频信号进行窗化处理;其次,基于模糊集对信号进行最优小波包分解,并用最优小波包和信号感知特性来提取音频信号特征,在每一个小波子空间用支持向量机对信号进行多类分类;最后,用模糊积分将分类结果进行综合,得出最终类。试验采用不同的核函数和算法参数验证了本文算法的效果,结果表明本算法速度较快、精确度高。  相似文献   

3.
提出一种新型的基于小波的指纹特征点提取算法.该算法利用haar小波基对指纹图像进行小波变换,提取小波系数并对其进行分析,经观察发现不同指纹细节特征点的分布与小波系数的分布存在一定的关系,根据小波系数分布的变化,可以确定细节特征点的具体位置及其类型.实验结果表明该算法对指纹特征点提取效果良好.  相似文献   

4.
不同的音频指纹提取算法需要不同的音频指纹搜索。针对某些特定(例如:foosic算法)的音频指纹提取算法,在数据预处理方面提出并实现了两种新的音频指纹搜索算法:PCA(Principle Component Analysis)主成分分析算法、不同帧之间相应的数据求和算法。实验结果表明:应用PCA算法,在搜索正确率为94.98%的情况下,搜索时间缩短为8.42%;应用求和算法,在搜索正确率为95.92%的情况下,搜索时间缩短为3.72%。  相似文献   

5.
李应 《计算机应用》2008,28(4):1012-1015
提出一种用小波包最好基结构系数和多分辨塔型算法检索音频数据的方法。这种方法首先对音频数据文件进行预处理,即把音频原数据文件变换成小波包最好基结构系数和小波不同级多分辨分析系数;最后用最好基结构系数对这些文件进行初步分类;最后再用塔型算法进行不同层次的检索。把这种方法与使用不同级小波逼近系数算法比较,结果表明这种方法对音频数据文件检索是有效的。  相似文献   

6.
基于单类支持向量机的音频分类   总被引:1,自引:0,他引:1  
研究一种基于单类支持向量机的音频分类方法,能够使每一类样本都独立地获得一个决策函数,通过决策函数的最大值来判断样本所属的类。通过使用小波包变换提取语音特征向量,并融合多特征向量,将音频分为5类:纯语音、音乐、环境音、含背景音语音和静音。实验结果表明这种方法具有较好的分类精度,性能优于贝叶斯、隐马尔可夫模型和神经网络分类器。  相似文献   

7.
基于听觉感知模型的自适应音频数字水印算法   总被引:1,自引:0,他引:1  
提出了一种基于听觉感知模型的自适应音频数字水印算法。该算法采用了适合于时变信号分析的小波包来分解音频信号。小波包分解满足心理声学模型所需的频率分辨率,可直接在小波域中计算掩蔽阈值,而不需像MEGP等算法那样进行FFT运算,从而大大降低了计算的复杂程度。实验结果表明,水印系统对MP3压缩、噪声干扰、重量化、低通滤波攻击有一定的鲁棒性。  相似文献   

8.
一种抗剪切的DWT域多重音频数字水印算法   总被引:1,自引:1,他引:1  
提出了一种能够抵抗剪切攻击的鲁棒性DWT域多重音频数字水印算法。该算法结合音频分帧技术及小波变换理论,将置乱、降维处理后的不同彩色数字图像信息嵌入到宿主音频信号的低频小波系数中,实现了多重彩色图像水印在宿主音频中的嵌入与提取。实验结果表明,该算法不仅能够较好地抵抗常规攻击,对剪切攻击也具有较强的鲁棒性,即使是在受到强剪切攻击后仍然能够提取出较清晰的(多重)水印信号。  相似文献   

9.
一种基于小波变换的音频脆弱水印算法   总被引:1,自引:0,他引:1  
数字音频水印算法是水印技术中重要的组成部分,而近年来对音频水印的研究远远少于图像水印,脆弱水印的研究则更加少。提出了一种基于小波变换的音频脆弱水印算法,在音频信号的小波变换域嵌入二值图像水印,采用量化嵌入方法,实现了盲提取。仿真实验结果表明,此算法具有较好的不可闻性、敏感性和安全性。  相似文献   

10.
针对以往双水印算法鲁棒性不高和定位不准确的问题,提出一种基于小波包分析的数字音频双水印算法。算法对原始音频信号进行小波包分解,在得到的低频系数和中低频系数中嵌入零水印和半脆弱水印。改进的零水印算法鲁棒性有了很大的提高,能更好地完成音频信号的版权保护;对中低频系数采用量化的方法嵌入二值水印图像,有别于以往算法需将二维图像转换为一维序列,不会对零水印的提取产生影响。该方法对一系列常规处理和幅度缩放都有较好的鲁棒性,不但能确定水印图像遭恶意篡改的位置,而且能够定位原始载体音频的篡改位置,真正实现了对音频信号的内容认证。  相似文献   

11.
基于小波变换和支持向量机的音频分类   总被引:2,自引:0,他引:2       下载免费PDF全文
音频特征提取是音频分类的基础,而音频分类又是内容的音频检索的关键。综合分析了语音和音乐的区别性特征,提出一种基于小波变换和支持向量机的音频特征提取和分类的方法,用于纯语音、音乐、带背景音乐的语音以及环境音的分类,并且评估了新特征集合在SVM分类器上的分类效果。实验结果表明,提出的音频特征有效、合理,分类性能较好。  相似文献   

12.
Speech and speaker recognition is an important topic to be performed by a computer system. In this paper, an expert speaker recognition system based on optimum wavelet packet entropy is proposed for speaker recognition by using real speech/voice signal. This study contains both the combination of the new feature extraction and classification approach by using optimum wavelet packet entropy parameter values. These optimum wavelet packet entropy values are obtained from measured real English language speech/voice signal waveforms using speech experimental set. A genetic-wavelet packet-neural network (GWPNN) model is developed in this study. GWPNN includes three layers which are genetic algorithm, wavelet packet and multi-layer perception. The genetic algorithm layer of GWPNN is used for selecting the feature extraction method and obtaining the optimum wavelet entropy parameter values. In this study, one of the four different feature extraction methods is selected by using genetic algorithm. Alternative feature extraction methods are wavelet packet decomposition, wavelet packet decomposition – short-time Fourier transform, wavelet packet decomposition – Born–Jordan time–frequency representation, wavelet packet decomposition – Choi–Williams time–frequency representation. The wavelet packet layer is used for optimum feature extraction in the time–frequency domain and is composed of wavelet packet decomposition and wavelet packet entropies. The multi-layer perceptron of GWPNN, which is a feed-forward neural network, is used for evaluating the fitness function of the genetic algorithm and for classification speakers. The performance of the developed system has been evaluated by using noisy English speech/voice signals. The test results showed that this system was effective in detecting real speech signals. The correct classification rate was about 85% for speaker classification.  相似文献   

13.
该文对基于小波变换的数字音频水印算法做了概要性的介绍,由于其良好的局部性时频分析特性和多分辨率分析,小波变换在数字音频版权保护领域有很好的应用效果。对基于小波变换的数字水印技术的相关概念和现有方法进行了描述与分析,另外,对基于小波变换的数字音频水印技术的未来发展方向和前景进行了预测。  相似文献   

14.
多基频估计被广泛应用于音乐结构分析、乐音辅助教育、信息检索等各个领域.为了满足准确识别乐曲中随机和弦的需求,提出了基于生成对抗网络去影像的多基频估计算法.首先将完整音频切分成音符段,提出了一种谐音指纹图提取音符段频谱特征;然后通过卷积神经网络识别谐音指纹图当前的主导基频,将已识别出的主导基频作为干扰下一个基频识别的影像...  相似文献   

15.
本文介绍了如何应用提升小波包变换对信号进行特征提取,并在此基础上提出了四条定量的评价标准,能够全面地对此类特征提取方法的有效性进行评价。通过这四个标准,就能更科学地选取合适的特征小波包,从而进一步提高原方法的效率,减少不必要的计算复杂度,使之更加适用于压缩机信号的实时监测。  相似文献   

16.
基于小波包和心理声学模型的音频编码算法   总被引:5,自引:1,他引:5  
文中提出了一种新的适用于实时多媒体应用领域的音频编码算法.该算法首先对音频信号进行小波包分解,然后在小波域中计算掩蔽阈值,最后根据从心理声学模型得到的信号-掩蔽比来对各子带小波系数进行动态比特分配、量化和编码.实验结果表明该算法将 CD 音频信号压缩到 64 Kbps 时,恢复信号的分段信噪比为 32.32 dB,主观上感觉无失真.该算法计算简单,可在不需任何附加硬件的 Pentium 133 MHz 个人计算机上实现实时音频编码.  相似文献   

17.
An audio fingerprint is a compact yet very robust representation of the perceptually relevant parts of an audio signal. It can be used for content-based audio identification, even when the audio is severely distorted. Audio compression changes the fingerprint slightly. We show that these small fingerprint differences due to compression can be used to estimate the signal-to-noise ratio (SNR) of the compressed audio file compared to the original. This is a useful content-based distortion estimate, when the original, uncompressed audio file is unavailable. The method uses the audio fingerprints only. For stochastic signals distorted by additive noise, an analytical expression is obtained for the average fingerprint difference as function of the SNR level. This model is based on an analysis of the Philips robust hash (PRH) algorithm. We show that for uncorrelated signals, the bit error rate (BER) is approximately inversely proportional to the square root of the SNR of the signal. This model is extended to correlated signals and music. For an experimental verification of our proposed model, we divide the field of audio fingerprinting algorithms into three categories. From each category, we select an algorithm that is representative for that category. Experiments show that the behavior predicted by the stochastic model for the PRH also holds for the two other algorithms.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号