共查询到18条相似文献,搜索用时 93 毫秒
1.
首先对基于内容的多媒体检索的相关概念、特征进行介绍,提出一种基于压缩域特征的音频检索方法,该算法在压缩域上直接对音频信号进行分析,达到多媒体实时检索的目的,实验结果证明,该算法有较好的检索结果。 相似文献
2.
基于内容的音频检索关键技术研究 总被引:4,自引:0,他引:4
音频是一种重要的媒体,包含丰富的听觉特征。本文根据当前音频检索研究的进展,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。 相似文献
3.
音频具有数据量大、维数高等特点,直接进行音频检索会造成“特征维数灾难”,因此有必要从音频提取最能表现音频特征的音频帧。提出一种基于模糊粗糙集模型(Fuzzy Rough Set Model,FRSM)的音频数据约简算法,根据隶属度对音频数据进行模糊离散,基于知识表达能力约简属性,以等价划分计算具有等同分类能力的知识核。实验结果表明,该算法能够得到最小约简,并且最大程度地保持音频特征,提高检索效率。 相似文献
4.
5.
基于内容的音频检索是多媒体检索技术中一个重要的组成部分,而其检索技术却相对滞后.基于内容的音频检索已成为多媒体检索技术的研究热点.本文分析并总结了音频检索的概念,综述了基于内容的音频检索方法和相关技术,最后通过一个简单的系统对基于内容的音频检索方法进行了测试. 相似文献
6.
针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题, 本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法. 在音频检索的训练阶段, 首先, 对样本音频信号进行稀疏化处理, 并通过压缩感知算法对稀疏化后的音频数据进行压缩; 其次, 提取压缩信号的音频指纹; 再次, 引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维, 最终得到检索特征库. 在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论. 实验结果表明, 所提音频检索方法在确保较好的检索准确率的基础上, 大幅度减小了样本音频数据库的存储量, 提高了音频的检索速率. 相似文献
7.
基于内容的音频检索:概念和方法 总被引:38,自引:1,他引:37
F过去对视觉媒体的检索,如图象和视频,进行了大量的研究。但是我们注意到音频也是多媒体中的一种典型媒体,是信息的一种常用载体。常规的自理是把数字音频当成非结构化流媒体。然而音频是语音的载体、包含丰富的听觉特征,并且具有结构信息。因此需要并且可以基于这些内容对音频进行存取。本文根据当前相关研究的进展,综述基于内容的音频检索方法,包括面向语音、音乐和音频分析的检索、音频分割等;分析并总结出音频内容及其检 相似文献
8.
9.
10.
11.
Indexing and Retrieval of Audio: A Survey 总被引:3,自引:0,他引:3
With more and more audio being captured and stored, there is a growing need for automatic audio indexing and retrieval techniques that can retrieve relevant audio pieces quickly on demand. This paper provides a comprehensive survey of audio indexing and retrieval techniques. We first describe main audio characteristics and features and discuss techniques for classifying audio into speech and music based on these features. Indexing and retrieval of speech and music is then described separately. Finally, significance of audio in multimedia indexing and retrieval is discussed. 相似文献
12.
音频信息检索的研究及实现 总被引:9,自引:0,他引:9
介绍了常见的基于内容的音频检索的关键技术和音频特征提取的一般方法,讨论了其中基于隐马尔科夫(HMM)模型识别音频例子的关键问题,并在此基础上给出了一个基于内容的音频信息检索系统的框架和实例。 相似文献
13.
14.
提出一种用小波包最好基结构系数和多分辨塔型算法检索音频数据的方法。这种方法首先对音频数据文件进行预处理,即把音频原数据文件变换成小波包最好基结构系数和小波不同级多分辨分析系数;最后用最好基结构系数对这些文件进行初步分类;最后再用塔型算法进行不同层次的检索。把这种方法与使用不同级小波逼近系数算法比较,结果表明这种方法对音频数据文件检索是有效的。 相似文献
15.
GAN Li-jun 《数字社区&智能家居》2008,(12)
音频处理技术是多媒体课件制作中的重要环节。对数字音频处理的硬件、音频提取、音频转录、音频动态处理和音频降噪技术的掌握,有助于增强对音频材料加工处理的手段,制作出高质量的音频,从而提高音频在多媒体课件中的渲染力。 相似文献
16.
根据多媒体音频数据的特点,提出一种适用于快速音频数据检索的局部搜索数据结构,即局部搜索树(local search tree,LS-tree).在局部搜索树中,分别以音频数据小波变换系数的过零率和平均幅度作为主、次关键码,基于局部范围对作为索引的其他系数进行组织.其次,基于局部搜索树,提出采用小波包最好基小波塔型算法实现音频数据检索.最后,把采用局部搜索树的小波包最好基—小波塔型算法的搜索和基于小波不同级系数的检索方法相比较,结果表明,这种方法对音频数据检索的快速和有效性. 相似文献
17.
18.