首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 62 毫秒
1.
针对音频检索应用,提出一种使用提升小波变换和非负矩阵分解的稳健音频指纹方案。原始音频按固定长度分帧,对每帧进行小波提升变换得到低频近似分量和高频细节分量;对细节分量作非负矩阵分解得到可近似表示音频子帧的基矩阵和系数矩阵;将系数矩阵各列元素累加,对各列累加和进行量化得到表示分帧音频指纹序列的1 bit信息。实验结果表明该方案对常见音频处理操作具有良好的稳健性,对音频的局部变化不敏感,能较好地区分不同音频,可用于面向对象的音频检索。  相似文献   

2.
聂华  欧阳建权 《计算机工程》2011,37(10):207-209
利用音频特征检测电视广告具有处理速度快、准确率高等优点,为此提出一种快速鲁棒的广告音频指纹提取方法。该方法将优化后的频域分为33个频带,分别计算当前帧相邻2个子带频域幅值的差异值与前一帧对应的相邻2个子带频域幅值的差异值,并将2帧的差异值之和相应设为0或1,每帧提取32个0/1值作为指纹。实验结果表明,该方法在保证快速提取指纹的同时,对常见的音频信号处理具有较强鲁棒性。  相似文献   

3.
提出了一种基于过零率和音频指纹的两步固定音频检索算法.在基于过零率直方图的初步检索中,采用直方图的迭代计算和动态的观测窗滑动步长来减少计算量并加快搜索速度,快速筛选出相似度较高的候选音频片段;接着基于降维Philips音频指纹对候选音频进行精检索,进一步提高检索精度.实验结果表明,该音频检索算法在保证较好的检索准确性基础上,大幅度提高了检索速度,且具有较好的鲁棒性.  相似文献   

4.
针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题,本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法.在音频检索的训练阶段,首先,对样本音频信号进行稀疏化处理,并通过压缩感知算法对稀疏化后的音频数据进行压缩;其次,提取压缩信号的音频指纹;再次,引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维,最终得到检索特征库.在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论.实验结果表明,所提音频检索方法在确保较好的检索准确率的基础上,大幅度减小了样本音频数据库的存储量,提高了音频的检索速率.  相似文献   

5.
《计算机工程》2018,(1):280-284
在Philips音频指纹检索算法中,构造一个查询表作为索引,由于内存消耗过大限制其广泛应用。为此,基于Philips音频指纹检索原型,提出一种改进算法。结合斐波那契数列和右移运算,构造新的哈希函数,通过斐波那契优化哈希值分布,并执行右移运算调整哈希表的长度。实验结果表明,改进算法能减少内存消耗,提高系统的实用性。  相似文献   

6.
针对当前音频哈希指纹方法不足以满足特定音频(如广告)的实时监测问题,提出一种快速的特定音频指纹提取方法,通过提取每帧感知最相关的频域信息,将其分为33个频带,并提取相邻2帧相邻频带的差异作为指纹值,每帧提32个0/1值。实验表明,与现有方法相比,该方法在保证音频检测准确性的同时,能实现指纹的快速提取。  相似文献   

7.
基于内容的音频检索关键技术研究   总被引:4,自引:0,他引:4  
朱爱红  李连 《现代计算机》2003,(11):37-40,51
音频是一种重要的媒体,包含丰富的听觉特征。本文根据当前音频检索研究的进展,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。  相似文献   

8.
理想的音频检索方法可以准确、高效地从大规模音频数据库中识别所有音频.但是,目前还没有一种方法可以对所有噪声干扰鲁棒.基于Philips指纹的采样计数音频检索方法是目前最高效的方法之一,如果能解决其无法抵抗线性变换(时间缩放、频率变换)的缺点,则整个采样计数音频检索方法将进一步趋于理想.针对其中的频率变换问题,提出抗频率...  相似文献   

9.
一种基于大型指纹数据库的检索方法   总被引:2,自引:0,他引:2  
随着指纹识别应用范围的逐渐扩大,人们对大型指纹数据库的实时性要求也越来越高,因此迫切需要一种有效的索引和检索技术。该文根据指纹数据库自身的特点,提出了一种检索和索引大型指纹数据库的方法。该方法利用了指纹图的全局特征———指纹类别和纹脊密度来建立多级索引,采用集成多级匹配检索方法缩小搜索空间,提高检索速度,取得了很好的效果。  相似文献   

10.
一种基于XML文档关键字检索的结构索引   总被引:2,自引:0,他引:2  
娄颖  李战怀  郭文琪  陈群  韩萌 《计算机科学》2010,37(12):120-124
XML数据索引对其检索效率有较大的影响。在深入分析现有XMI、结构索引之后,结合XML文档特点,提出了一种基于关键字检索的结构索引--LSS(Level Structure Summary) . LSS采用了把具有相同标签路径的结点进行合并的策略,具有高效判断结点之间同构异构关系的能力。实现了LSS索引生成算法CSCAN,并在LSS索引的基础上设计了XML关键字检索算法LSSearch。该算法依据LSS索引,将各个关键字的原始倒排表集合分拆成不同类型的子集合,最后在所有子集合上进行查询。实验结果表明,LSS可以帮助减少XML文档中关键字倒排表的规模,提高检索效率。  相似文献   

11.
针对互联网音频大数据的高速检索问题,结合音频指纹技术与过滤-提纯思想,提出一种面向音频大数据的鲁棒高效检索方法.在经典的Philips音频指纹基础上,提出了一种基于bag-of-features(BoF)的音频中间过滤指纹用于快速缩小检索范围,与Fibonacci Hashing检索相比提高检索速度约130倍;并设计了一种基于阈值的固定间隔抽样匹配方法,大幅减少匹配计算量,进一步提高检索速度可达140倍.实验结果显示:使用该方法在约10万首音频中对不同时长的音频片段进行批量检索,平均检索时间均小于1s;对音频进行MP3转换、重采样、随机剪切后再检索,召回率均在99.47%以上,理论准确率接近100%.  相似文献   

12.
基于视频指纹的视频片段检索方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种基于视频指纹的视频片段检索方法,通过视频指纹的相似性匹配对视频片段进行检索。通过改进的Harris检测计算DC图像的角点信息,去掉视频图像边缘提取视频运动特征,根据图像特征相似度和运动特征相似度的调和因子得到视频片段总的相似度。实验结果表明,与现有方法相比,该方法能准确检测视频片段,具有较强的鲁棒性,满足视频检索的实时要求。  相似文献   

13.
李坚  毛先领  文贵华 《计算机工程》2008,34(11):211-213
提出利用分形几何抽取音频特征的全局化音频检索,将其学习阶段计算音频数据库中每个音频的分维作为特征向量,保存在音频特征数据库中,并建立索引。其检索阶段则首先计算查询音频的分维,然后从音频数据库中快速找出分维最相似的若干音频对象。分维刻画了音频的内在属性如自相似性,使其具有片段检索对匹配的起点不敏感、抗噪音、检索速度快等优点。用FRACTAL, MFCC和SOLAR 3种方法对数据集分别检索,实验结果表明基于分维的音频检索在性能和时间复杂度上有显著优势。  相似文献   

14.
基于LPCMCC的音频数据检索方法   总被引:1,自引:0,他引:1       下载免费PDF全文
江基华  李应 《计算机工程》2009,35(11):246-247
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号