共查询到19条相似文献,搜索用时 93 毫秒
1.
根据多媒体音频数据的特点,提出一种适用于快速音频数据检索的局部搜索数据结构,即局部搜索树(local search tree,LS-tree).在局部搜索树中,分别以音频数据小波变换系数的过零率和平均幅度作为主、次关键码,基于局部范围对作为索引的其他系数进行组织.其次,基于局部搜索树,提出采用小波包最好基小波塔型算法实现音频数据检索.最后,把采用局部搜索树的小波包最好基—小波塔型算法的搜索和基于小波不同级系数的检索方法相比较,结果表明,这种方法对音频数据检索的快速和有效性. 相似文献
2.
提出一种用小波包最好基结构系数和多分辨塔型算法检索音频数据的方法。这种方法首先对音频数据文件进行预处理,即把音频原数据文件变换成小波包最好基结构系数和小波不同级多分辨分析系数;最后用最好基结构系数对这些文件进行初步分类;最后再用塔型算法进行不同层次的检索。把这种方法与使用不同级小波逼近系数算法比较,结果表明这种方法对音频数据文件检索是有效的。 相似文献
3.
音频认证可以分为硬认证、基于质量和基于内容的软认证等三种.硬认证只允许格式转换和无损压缩,基于质量和内容的软认证则分别允许一些保持听觉质量或语义的音频处理.在绝大多数应用环境下,需要对音频进行与人类听觉感知系统特性相符合的基于内容(语义)的软认证.音频认证可采用数字水印或数字签名,提出一种基于小波包最优基分解的数字签名算法,利用与音频内容密切相关的小波包系数作为特征进行语义级的认证.实验结果表明该算法对常见的信号处理MP3、WMA、RM等中等强度的有损压缩、添加噪声、重采样等保持内容操作具有很强的鲁棒性,而对局部替换、修改、删除、复制音频等恶意操作脆弱,并能准确定位被篡改的位置. 相似文献
4.
詹祯浩 《计算机光盘软件与应用》2013,(6):78-79
本文主要阐述使用音频作为搜索源的音频搜索的主要过程以及技术要点,包括音频特征码的提取,音频特征在数据库中的储存形式,特征匹配方法。 相似文献
5.
音频降噪是音频处理前期的必要步骤,小波域降噪是其中一个重要的研究方向,为了使人们对小波域音频降噪有概括了解,在对小波域音频降噪相关文献进行分析和理解的前提下,首先介绍了小波变换及其特性,同时阐述了小波降噪的最优选取和处理准则,及对音频进行小波变换时小波基的选取原则;然后评述了用于音频降噪的阈值,多小波、小波包、模极大值和尺度相关法等5类方法及各自的发展;接着介绍在前人基础上,提出新的基于模极大值和尺度理论的降噪算法;最后探讨了小波域音频降噪的发展方向。 相似文献
6.
不同的音频指纹提取算法需要不同的音频指纹搜索。针对某些特定(例如:foosic算法)的音频指纹提取算法,在数据预处理方面提出并实现了两种新的音频指纹搜索算法:PCA(Principle Component Analysis)主成分分析算法、不同帧之间相应的数据求和算法。实验结果表明:应用PCA算法,在搜索正确率为94.98%的情况下,搜索时间缩短为8.42%;应用求和算法,在搜索正确率为95.92%的情况下,搜索时间缩短为3.72%。 相似文献
7.
特征提取是信号识别与分类中的重要一环,对提高系统的准确、改善系统性能起着关键的作用。利用小波包变换对信号进行特征提取是近年来发展起来的一种新的特征表示手段,在许多领域中已获得了成功的应用。论文首先回顾了采用小波包变换对信号进行分解的过程,并在此基础上研究了基于小波包变换的特征表示与提取方法。 相似文献
8.
9.
运用神经网络对音频数据索引的最优基的选择 总被引:1,自引:0,他引:1
在详细探讨了反向传播训练算法之后,提出了用神经网络选择音频数据索引最优基的方法.该方法用小波变换抽取音频信号的关键系数,根据四层小波包二分树确定输出神经元的数量与含义,用Levenberg—Marquardt修正反向传播算法构造与训练了一个32—8—8人工神经网络.试验表明,可以用该神经网络代替复杂的代价函数方法来选择音频数据索引的最优基. 相似文献
10.
基于心理声学模型的多码率零树小波音频压缩方法 总被引:3,自引:0,他引:3
MPEG-4音频编码标准不仅对码率和音质提出了更高的要求,而且还要求编码器具有多种功能以满足各种不同应用的需要,该文利用不同尺度小波系数的自相似特性和人耳的掩蔽效应,提出了一种基于心理声学模型的零树小波音频编码算法。该算法不仅可在低码率(56kb/s)上得到透明质量的CD音频信号,而且可产生嵌入式码流,在最优意义上支持多码率的可分级编码,是一种很有前途的适用一多媒体通信等领域的编码方案。 相似文献
11.
严宏 《计算机与数字工程》1999,27(4):27-31
本文将炼油生产中油品贮运的数据处理问题抽象成带权有向图的搜索问题,通过有向图的权值搜索及权值求和完成油品贮运数据的处理。文中给出了处理方法及其实现。 相似文献
12.
13.
戚斌 《计算机测量与控制》2017,25(8):218-220, 225
为了提高对混合架构下ORACLE数据的挖掘和查找速度,提出一种基于频繁项目集关联规则挖掘的数据快速查找方法;构建ORACLE数据的内部关联属性映射关系模型,在异质网络混合构架模式下,采用Graph OLAP数据仓库模型进行数据库检索的关系维度表,提取表达ORACLE数据属性信息的特征参量,通过同态标签检索方法,实现对目标数据的快速查找定位;仿真结果表明,采用该方法进行ORACLE数据查找的查准率和查全率较高,计算速度较快,性能优于传统方法。 相似文献
14.
15.
一种基于MFCC的音频数据检索方法 总被引:3,自引:1,他引:2
以LPC倒谱系数(LPCC)为特征参数的音频数据检索是人们常用的一种方法,但这种方法没有充分考虑到人耳听觉的非线性特性.因此,提出了一种采用MFCC及其差分倒谱系数相结合作为特征参数来做音频数据检索的方法.通过实验对比分析结果表明,这种音频数据检索方法比LPCC的检索具有更高的识别率. 相似文献
16.
本文针对数字图书馆系统中图像与视频检索的难点,重点讨论构建分布式多媒体数据库的关键技术。 相似文献
17.
为了实现对环境音频信号及其相关数据的自动分析,提出了一种环境音频数据分类方法。分类过程中,首先用短时平均幅度对音频数据进行有效分段;然后,计算分段音频数据的长度和平均过零率;最后,计算并生成一个分段音频数据的Mel频率倒谱系数(MFCC)和一阶差分Mel频率倒谱系数(△MFCC)特征参数。分类操作上,根据有效分段的长度和平均过零率确定分类搜索的范围,并在局部范围内采用DTW(Dynamic Time Warping,动态时间规整)分类算法。实验结果验证了该方法对各种环境音频数据分类的有效性。 相似文献
18.
语音回声信息隐藏技术研究 总被引:1,自引:0,他引:1
回声信息隐藏是通过在语音媒体中加入不同延时的回声来实现信息隐藏的一种技术。采用易于检测的前向一后向回声核构建了回声信息隐藏系统。介绍了前向一后向回声核的构成原理和倒谱检测方法,仿真并分析了系统关键参数对隐藏信息恢复率的影响,如延迟时间、分段长度、回声的衰减系数等。通过引入8个延时的回声实现了8进制信息隐藏,使隐藏信息的容量提高了3倍,在采样频率为8kHz的条件下达到150bit/s,恢复率大于99%。20人的非正式试听表明,隐藏信息后的语音和原始语音没有明显的差别且优于单回声的语音质量,得到了较好的隐藏效果。 相似文献
19.
针对互联网音频大数据的高速检索问题,结合音频指纹技术与过滤-提纯思想,提出一种面向音频大数据的鲁棒高效检索方法.在经典的Philips音频指纹基础上,提出了一种基于bag-of-features(BoF)的音频中间过滤指纹用于快速缩小检索范围,与Fibonacci Hashing检索相比提高检索速度约130倍;并设计了一种基于阈值的固定间隔抽样匹配方法,大幅减少匹配计算量,进一步提高检索速度可达140倍.实验结果显示:使用该方法在约10万首音频中对不同时长的音频片段进行批量检索,平均检索时间均小于1s;对音频进行MP3转换、重采样、随机剪切后再检索,召回率均在99.47%以上,理论准确率接近100%. 相似文献