首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
基于内容的音频检索与分类   总被引:6,自引:0,他引:6  
音频信息检索技术是多媒体检索技术中的一个重要组成部分。该文在分析国内外现行的音频信息检索方法的基础上,总结出了基于内容的音频检索的一般方法,提出了一种基于内容的音频信息检索与分类方法,并通过已研制的ARS音频检索系统进行了性能测试。此方法具有较高的准确性和灵活性,可适用于不同的系统和应用。  相似文献   

2.
在网络和多媒体技术快速发展的今天,如何在众多以图像、音频、视频等信息为代表的多媒体数据中有效的对其进行组织、存取、查询、提取是当前面临的一个重要问题。通过分析目前的多媒体信息检索技术,介绍了用于多媒体内容描述的国际标准MPEG-7;从图像、音频、视频三方面讨论当前广泛使用的一些信息检索技术并对这些技术的实际应用作了分析;最后,给出了一个视频应用模型;  相似文献   

3.
一种有效的音频信息检索技术   总被引:2,自引:0,他引:2  
音频数据检索是数字化信息检索的迫切需要,但国际上对音频检索技术的研究尚远未尽人意。提出了一种新的音频检索机制,利用小波变换来产生音频数据的特征向量,通过关联规则挖掘发现音频数据特征元素向量与音频数据所属类别之间的联系,从而进行音频的分类和检索。实验表明,这种方法具有较高的检索效率,能大大缩短计算时间,具有良好的检索性能。  相似文献   

4.
音频数据的一种空间特征模型   总被引:3,自引:0,他引:3  
程凯  李应  黄樟钦 《计算机应用》2004,24(1):143-146
音频是多媒体中一种典型的媒体,音频检索也自然成为多媒体检索的重要内容。本文针对波形声音,提出一种用于产生音频数据索引的空间特征模型,并给出该模型中各个元素的获取算法,举例说明了该空间特征模型的应用。  相似文献   

5.
吴春辉  陈洪生 《福建电脑》2010,26(12):37-38
基于内容的音频检索是多媒体检索技术中一个重要的组成部分,而其检索技术却相对滞后.基于内容的音频检索已成为多媒体检索技术的研究热点.本文分析并总结了音频检索的概念,综述了基于内容的音频检索方法和相关技术,最后通过一个简单的系统对基于内容的音频检索方法进行了测试.  相似文献   

6.
音频是多媒体的重要组成元素,恰当、灵活地运用音频往往是多媒体作品的成败关键。 Flash作为人们喜爱的多媒体工具,其音频的使用方式也丰富多样。本文探讨了在Flash中对音频的设置,包括音频的导入、属性设置,编辑等。  相似文献   

7.
在网络和多媒体技术快速发展的今天,如何在众多以图像、音频、视频等信息为代表的多媒体数据中有效的对其进行组织、存取、查询、提取是当前面临的一个重要问题。通过分析目前的多媒体信息检索技术,介绍了用于多媒体内容描述的国际标准MPEG-7;从图像、音频、视频三方面讨论当前广泛使用的一些信息检索技术并对这些技术的实际应用作了分析;最后,给出了一个视频应用模型。  相似文献   

8.
文中探讨了在delphi环境下实现多通道音频采集与播放技术,重点讨论了使用多媒体底层函数对声音进行采集和播放技术、双缓冲区技术、多线程技术以及音频数据缓存的分配和管理技术。  相似文献   

9.
音频信息检索的研究及实现   总被引:9,自引:0,他引:9  
宋博  须德 《计算机应用》2003,23(12):52-54
介绍了常见的基于内容的音频检索的关键技术和音频特征提取的一般方法,讨论了其中基于隐马尔科夫(HMM)模型识别音频例子的关键问题,并在此基础上给出了一个基于内容的音频信息检索系统的框架和实例。  相似文献   

10.
l引言 在多媒体CAI制作中视频和音频是很重要的一部分,音频技术主要是在多媒体中提供各种声音的功能,包括主题音乐和背景音乐等,视频技术主要是提供动态图象信息,这些技术是制作形象生动的多媒体不可缺少的一部分,本文就在AuthorWare中如何合理高效利用音频和视频技术作一简要的介绍。2 Authorware中的音频控制 一般CAI制作中,对音频控制的要求是提供一个声音控制图标来实现声音的打开和关闭。由于在大型CAI软件制作中,涉及声音文件数量较多,故一般情况要求对声音文件进行了压缩,但Authorw…  相似文献   

11.
基于内容的音频检索:概念和方法   总被引:38,自引:1,他引:37  
F过去对视觉媒体的检索,如图象和视频,进行了大量的研究。但是我们注意到音频也是多媒体中的一种典型媒体,是信息的一种常用载体。常规的自理是把数字音频当成非结构化流媒体。然而音频是语音的载体、包含丰富的听觉特征,并且具有结构信息。因此需要并且可以基于这些内容对音频进行存取。本文根据当前相关研究的进展,综述基于内容的音频检索方法,包括面向语音、音乐和音频分析的检索、音频分割等;分析并总结出音频内容及其检  相似文献   

12.
音频信息检索   总被引:10,自引:0,他引:10  
回顾了国内外现行的音频信息检索方法,分析了常见的音频数据处理技术,包括语音识别技术和基于内容的音频检索技术,提出了基于内容的音频检索的一般方法,并指出了相应研究中的关键问题。  相似文献   

13.
1.引言面对日益庞大的信息量,如何有效地检索到感兴趣的内容是至关重要的。新闻视频、音频(包括电视、广播)与文字报道相比,更为生动,表达更为丰富,但也有数据量大、难以组织、索引、检索等缺点。这主要体现在两方面; 文本有标题、段等明显的辅助标记,而视频、音频则没有。一般的浏览工具只有播放、快进、快退、拖动定位等简单手段。这对于几十、几百小时,而且还在日益增长的视频、音频数据库,是远远不能满足要求的。  相似文献   

14.
Multimedia data include text,image,audio and video,etc.Recent developments and advances in the areas of mass storage technology and high speed networks make it feasible for multimedia computing systems to offer services such as multimedia e-mial,teleconferencing and various vivid games.The storage and retrieval of multimedia data are two of the most important technologies in the futre multimedia systems.This paper analyzes the synchronization requirements of the delay-sensitive media streams,classifies the synchronization hierarchically and proposes several effective strategies for the intra-media and inter-media data placement problems.  相似文献   

15.
首先对基于内容的多媒体检索的相关概念、特征进行介绍,提出一种基于压缩域特征的音频检索方法,该算法在压缩域上直接对音频信号进行分析,达到多媒体实时检索的目的,实验结果证明,该算法有较好的检索结果。  相似文献   

16.
Latent topic model such as Latent Dirichlet Allocation (LDA) has been designed for text processing and has also demonstrated success in the task of audio related processing. The main idea behind LDA assumes that the words of each document arise from a mixture of topics, each of which is a multinomial distribution over the vocabulary. When applying the original LDA to process continuous data, the word-like unit need be first generated by vector quantization (VQ). This data discretization usually results in information loss. To overcome this shortage, this paper introduces a new topic model named Gaussian-LDA for audio retrieval. In the proposed model, we consider continuous emission probability, Gaussian instead of multinomial distribution. This new topic model skips the vector quantization and directly models each topic as a Gaussian distribution over audio features. It avoids discretization by this way and integrates the procedure of clustering. The experiments of audio retrieval demonstrate that Gaussian-LDA achieves better performance than other compared methods.  相似文献   

17.
The Internet has become the global infrastructure supporting information acquisition and retrieval from many heterogeneous data sources containing high-speed text and rich multimedia images, audio, and video. AgentRAIDER is an ongoing research project at Texas Tech University designed to develop a comprehensive architecture for an intelligent information retrieval system with distributed heterogeneous data sources. The system is designed to support intelligent retrieval and integration of information from the Internet. Current systems of this nature focus only on specific aspects of the distributed heterogeneous problem such as database queries or information filtering. Consequently, these concepts and others have never been successfully integrated into a unified, cohesive architecture. This paper discusses the design and implementation of the AgentRAIDER system and identifies areas for applications of the system in various domains.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号