首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
提出了一种基于过零率和音频指纹的两步固定音频检索算法.在基于过零率直方图的初步检索中,采用直方图的迭代计算和动态的观测窗滑动步长来减少计算量并加快搜索速度,快速筛选出相似度较高的候选音频片段;接着基于降维Philips音频指纹对候选音频进行精检索,进一步提高检索精度.实验结果表明,该音频检索算法在保证较好的检索准确性基础上,大幅度提高了检索速度,且具有较好的鲁棒性.  相似文献   

2.
基于帧数据量波动特性的压缩域视频快速检索方法   总被引:1,自引:0,他引:1  
为实现压缩域视频快速检索,提出基于帧数据量波动特性的检索方法。该方法首先计算压缩域各图像帧的数据量,得出查询片段和目标视频等长内的数据量曲线,然后在I帧对齐的基础上将查询片段在目标视频上进行滑动,滑动窗长为单个图组长度。再在每次滑动后计算查询片段与目标视频数据量曲线波动的差异程度,同时每次滑动后要更新目标视频的数据量曲线。最后结合设定门限进行相似判决并返回结果。该方法不需要为每一帧抽取高维特征向量,用一个向量而不是一组高维向量来表述一段视频。实验结果表明,相比现有快速检索算法,该方法使检索速度得到提高,同时也能达到较高的准确率。 另外,该方法既可用于基于压缩域视频库的快速检索,也可用于在线的视频片段匹配,实时发现与设定目标相似的视频。  相似文献   

3.
首先对基于内容的多媒体检索的相关概念、特征进行介绍,提出一种基于压缩域特征的音频检索方法,该算法在压缩域上直接对音频信号进行分析,达到多媒体实时检索的目的,实验结果证明,该算法有较好的检索结果。  相似文献   

4.
《计算机工程》2018,(1):280-284
在Philips音频指纹检索算法中,构造一个查询表作为索引,由于内存消耗过大限制其广泛应用。为此,基于Philips音频指纹检索原型,提出一种改进算法。结合斐波那契数列和右移运算,构造新的哈希函数,通过斐波那契优化哈希值分布,并执行右移运算调整哈希表的长度。实验结果表明,改进算法能减少内存消耗,提高系统的实用性。  相似文献   

5.
介绍一种基于倒谱分析的快速音频检索方法。该算法以倒谱特征参数为基础,在特征空间上采用距离测度的检索方法。在对CCTV1频道100h音频库的测试中,该方法搜索均长为12.5s的模板音频时的时速达到0.0014倍实时,而等错误率(Equal Error Rate,EER)仅为1.5%。实验结果表明,在保证了搜索速度的前提下,该方法有较低的误识率。文章最后针对所提出算法的不足之处提出了改进意见。  相似文献   

6.
音频数据的一种空间特征模型   总被引:3,自引:0,他引:3  
程凯  李应  黄樟钦 《计算机应用》2004,24(1):143-146
音频是多媒体中一种典型的媒体,音频检索也自然成为多媒体检索的重要内容。本文针对波形声音,提出一种用于产生音频数据索引的空间特征模型,并给出该模型中各个元素的获取算法,举例说明了该空间特征模型的应用。  相似文献   

7.
李坚  毛先领  文贵华 《计算机工程》2008,34(11):211-213
提出利用分形几何抽取音频特征的全局化音频检索,将其学习阶段计算音频数据库中每个音频的分维作为特征向量,保存在音频特征数据库中,并建立索引。其检索阶段则首先计算查询音频的分维,然后从音频数据库中快速找出分维最相似的若干音频对象。分维刻画了音频的内在属性如自相似性,使其具有片段检索对匹配的起点不敏感、抗噪音、检索速度快等优点。用FRACTAL, MFCC和SOLAR 3种方法对数据集分别检索,实验结果表明基于分维的音频检索在性能和时间复杂度上有显著优势。  相似文献   

8.
基音检测是音频分析和基于内容的音乐检索中的关键技术,是基于内容音乐检索中实现哼唱检索的基础。提出一种改进的自相关函数(autocorrelation function,ACF)方法进行基音检测。从对音频信号进行去噪预处理、清浊音判断及后处理等方面对ACF进行改进,使之能够生成规整的音高变化曲线。在音乐检索的实现中,提出一种有限长度的最长公共子序列(Local Longest Common String,LLCS)方法,该方法可有效解决传统方法存在的误检问题。开发实现了一个通过哼唱/歌唱进行歌曲检索的原型系统。对大量的歌曲哼唱的实验表明,提出的改进ACF算法和LLCS算法对于提高检索正确率是正确有效的。  相似文献   

9.
针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题, 本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法. 在音频检索的训练阶段, 首先, 对样本音频信号进行稀疏化处理, 并通过压缩感知算法对稀疏化后的音频数据进行压缩; 其次, 提取压缩信号的音频指纹; 再次, 引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维, 最终得到检索特征库. 在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论. 实验结果表明, 所提音频检索方法在确保较好的检索准确率的基础上, 大幅度减小了样本音频数据库的存储量, 提高了音频的检索速率.  相似文献   

10.
由于数字音频数据量极大的特点,采用传统音频检索方法会导致等待时间过长。为加快音频检索时间,提出一种基于GPU加速的数字音频检索方法。利用数字音频的特征将连续的音频划分成等长的多个短时音频段,采用GPU加速算法计算每个短时音频段的特征值,将各段的特征值构成特征矩阵。使用后缀数组的变形算法找出2个特征值序列的公共特征段落集合,并将公共特征段落集合进行精化和整体匹配,从而得出检索结果。实验结果表明,该检索方法的准确率可以达到95%以上,与已有方法相比,可以大幅度地提高检索速度,加速比可以达到10倍以上。  相似文献   

11.
乔丽 《计算机工程》2012,38(6):201-203
在基于K-means的案例检索算法中,目标案例初次映射的失败会导致案例检索成功率降低。针对该问题,提出一种基于滑动窗口的案例检索算法。分析滑动窗口维护策略,利用滑动窗口收集案例库中权重较高且最近常使用的案例,增加案例采样数量。实验结果表明,该算法能提高检索成功率,检索时间较短且案例映射次数较少。  相似文献   

12.
基于索引结构的高效运动视频检索   总被引:1,自引:1,他引:0  
视频片断检索是视频领域的研究热点,为了提高查询效率,利用高维索引结构Vector-Approximation File(VA-File)来组织视频子片段,并采用新的相似度模型和基于限定性滑动窗口的高效视频检索算法进行视频片段检索.提出的子片段的分割算法能够较好地区分运动的细节动作,且相似度模型充分考虑了对应子片段之间的视觉相似性以及时间顺序关系,因此对于运动视频的检索十分有效.实验证明,对于运动视频片段检索不仅具有较高的查询效率,而且能够得到较高的查全率和准确率.  相似文献   

13.
为了实现对环境音频信号及其相关数据的自动分析,提出了一种环境音频数据分类方法。分类过程中,首先用短时平均幅度对音频数据进行有效分段;然后,计算分段音频数据的长度和平均过零率;最后,计算并生成一个分段音频数据的Mel频率倒谱系数(MFCC)和一阶差分Mel频率倒谱系数(△MFCC)特征参数。分类操作上,根据有效分段的长度和平均过零率确定分类搜索的范围,并在局部范围内采用DTW(Dynamic Time Warping,动态时间规整)分类算法。实验结果验证了该方法对各种环境音频数据分类的有效性。  相似文献   

14.
基于加权MFCC的音频检索   总被引:1,自引:0,他引:1  
通过研究音频特征值提取和特征匹配算法,给出了一个完整的音频数据检索系统框架。该系统框架主要分析了音频特征提取和特征匹配。在音频特征提取部分对经典的MFCC系数进行了分析,提出了基于熵值法加权的MFCC系数,提高了检索的识别率。音频匹配部分根据特征参数矩阵表征音频信息的性质,引入了矩阵相似度的匹配方法,提高了检索效率。实验结果表明系统识别效率提高1.2%,用时降低22%,系统的性能得到明显改善。  相似文献   

15.
在前后向双核回声隐藏思想的基础上, 提出了一种基于回声隐藏的改进算法. 根据设定的水印的嵌入率来确定音频段的能量阈值,选择短时能量高于此阈值的音频段嵌入水印信息, 并且引入功率倒谱检测法来检测水印信息. 仿真结果表明改进后的算法具有不可感知性更高, 隐藏效果好并且显著降低了水印信息检测的误码率.  相似文献   

16.
目的 视觉检索需要准确、高效地从大型图像或者视频数据集中检索出最相关的视觉内容,但是由于数据集中图像数据量大、特征维度高的特点,现有方法很难同时保证快速的检索速度和较好的检索效果。方法 对于面向图像视频数据的高维数据视觉检索任务,提出加权语义局部敏感哈希算法(weighted semantic locality-sensitive hashing, WSLSH)。该算法利用两层视觉词典对参考特征空间进行二次空间划分,在每个子空间里使用加权语义局部敏感哈希对特征进行精确索引。其次,设计动态变长哈希码,在保证检索性能的基础上减少哈希表数量。此外,针对局部敏感哈希(locality sensitive hashing, LSH)的随机不稳定性,在LSH函数中加入反映参考特征空间语义的统计性数据,设计了一个简单投影语义哈希函数以确保算法检索性能的稳定性。结果 在Holidays、Oxford5k和DataSetB数据集上的实验表明,WSLSH在DataSetB上取得最短平均检索时间0.034 25 s;在编码长度为64位的情况下,WSLSH算法在3个数据集上的平均精确度均值(mean average precision,mAP)分别提高了1.2%32.6%、1.7%19.1%和2.6%28.6%,与几种较新的无监督哈希方法相比有一定的优势。结论 通过进行二次空间划分、对参考特征的哈希索引次数进行加权、动态使用变长哈希码以及提出简单投影语义哈希函数来对LSH算法进行改进。由此提出的加权语义局部敏感哈希(WSLSH)算法相比现有工作有更快的检索速度,同时,在长编码的情况下,取得了更为优异的性能。  相似文献   

17.
针对面向深空探测任务的多星任务规划问题,综合考虑卫星对目标时间窗口、卫星姿态机动以及工作能耗等约束条件,建立了面向深空探测任务的多星任务规划问题模型,针对常规01编码在进行大规模卫星任务规划时,存在的编码长度过长等问题,提出了一种基于实数编码方式的遗传算法,以求解面向深空探测的多星任务规划问题.该算法采用了一种以目标为染色体的实数编码方式,相比传统的以时间窗口为染色体的01编码方式,缩短了染色体长度,可有效提高算法的求解效率.通过仿真算例分析,验证了基于实数编码的遗传算法对求解多星任务规划问题的正确性、合理性和有效性,并将其与基于传统01编码方式的遗传算法进行对比分析,其结果表明基于实数编码方式的遗传算法在寻优能力和计算速度上具有明显优势,这为求解面向深空探测任务的多星任务规划问题提供了一种新的思路和方法.  相似文献   

18.
提出了一种融合下界估计和分段动态时间规整的语音样例快速检索方法。该方法针对缺乏合适的训练数据等语音资源较为有限的语言进行快速检索所设计。此方法首先提取查询样例和测试集的音素后验概率;然后,根据限制条件在测试语句中选定候选分段,并计算查询样例和每个候选分段之间实际动态时间规整得分的下界估计,再运用K最近邻搜索算法搜索与查询样例相似度最高的分段;最后,使用虚拟相关反馈技术对检索结果进行修正。实验结果表明:尽管此方法的检索精度略低于直接运用动态时间规整进行检索的检索精度,但其检索速度大大优于后者,且检索结果经过虚拟相关反馈技术修正后,其检索精度也得到有效提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号