首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 54 毫秒
1.
基于内容的音频检索关键技术研究   总被引:4,自引:0,他引:4  
朱爱红  李连 《现代计算机》2003,(11):37-40,51
音频是一种重要的媒体,包含丰富的听觉特征。本文根据当前音频检索研究的进展,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。  相似文献   

2.
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索.为此,基于内容的音频检索技术应运而生.文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等.最后展望了音频检索技术的发展前景.  相似文献   

3.
音频信息检索   总被引:10,自引:0,他引:10  
回顾了国内外现行的音频信息检索方法,分析了常见的音频数据处理技术,包括语音识别技术和基于内容的音频检索技术,提出了基于内容的音频检索的一般方法,并指出了相应研究中的关键问题。  相似文献   

4.
吴春辉  陈洪生 《福建电脑》2010,26(12):37-38
基于内容的音频检索是多媒体检索技术中一个重要的组成部分,而其检索技术却相对滞后.基于内容的音频检索已成为多媒体检索技术的研究热点.本文分析并总结了音频检索的概念,综述了基于内容的音频检索方法和相关技术,最后通过一个简单的系统对基于内容的音频检索方法进行了测试.  相似文献   

5.
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且对于人们日趋复杂的信息检索需求无法满足,这就促使基于内容的音频检索技术出现和发展。文中根据基于内容的语音信息检索的研究现状,总结了基于内容的语音信息检索的基本特点,对语音信息检索技术、自然语言处理技术和语音识别技术分别进行了总结和讨论,最后探讨了基于内容的语音信息检索技术目前面临的挑战和发展。  相似文献   

6.
李晨  ;周明全 《微机发展》2008,(8):215-218
结合音频检索发展现状,描述了当前相关研究的进展,介绍了现在最常用到的音频检索方法,讨论了与音频检索相关的关键技术:音频特征提取、音频分割和分类。基于内容的音乐检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义。分析并总结出音乐内容及其检索的概念,给出音乐检索的系统结构,综述了基于内容的音乐检索方法,最后指出了音频检索发展的前景。  相似文献   

7.
音频检索技术研究   总被引:4,自引:2,他引:2  
结合音频检索发展现状,描述了当前相关研究的进展,介绍了现在最常用到的音频检索方法,讨论了与音频检索相关的关键技术:音频特征提取、音频分割和分类.基于内容的音乐检索研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的意义.分析并总结出音乐内容及其检索的概念,给出音乐检索的系统结构,综述了基于内容的音乐检索方法,最后指出了音频检索发展的前景.  相似文献   

8.
音频信息检索综述   总被引:2,自引:0,他引:2  
随着多媒体和Internet技术的广泛应用和深入普及,多媒体数据的数量正在飞速增长,音频数据作为多媒体数据的重要组成部分,其信息量也在不断膨胀。如何有效的对音频信息进行检索成为现代信息检索的一个重要的研究领域。然而,音频数据同传统的文本数据不同,文本检索中的相关技术不能简单地应用到音频信息检索中,因为后者往往是基于语义的,所以不可避免地要用到音频数据的特征提取和模式匹配等技术。本文将对音频数据检索相关技术和系统做一综述性的介绍。  相似文献   

9.
基于内容的音频分类是基于内容的音频检索技术中的重要研究内容。先简单介绍音频分类的理论基础,然后介绍几种典型的音频分类方法,最后通过一个简单的SVM算法进行模拟实验。  相似文献   

10.
音频信息检索的研究及实现   总被引:9,自引:0,他引:9  
宋博  须德 《计算机应用》2003,23(12):52-54
介绍了常见的基于内容的音频检索的关键技术和音频特征提取的一般方法,讨论了其中基于隐马尔科夫(HMM)模型识别音频例子的关键问题,并在此基础上给出了一个基于内容的音频信息检索系统的框架和实例。  相似文献   

11.
视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高.  相似文献   

12.
音频分类是提取音频结构和内容语义的重要手段,是基于内容的音频检索和分析的基础.本文对几种常用的音频分类算法作了综述,介绍了最小距离法、神经网络、支持向量机、决策树方法、隐马尔可夫模型等典型算法的特征,并对它们的优缺点进行了比较.  相似文献   

13.
The growing digitization of multimedia content must be supported by a set of tools to manipulate them, and especially to query them. This is one of the major goals of an audio DBMS. Yet, existing work related to audio documents, e.g., radio or television archives, often leave the DBMS question open. In this paper, we lay the foundations for integrating audio into a general purpose DBMS, in the form of an audio abstract data type, along with its properties and associated operators. This contribution is coupled with an unsupervised statistically-founded speaker-based partitioning technique. For each of these two aspects, the paper underlines the practical interest and some technical difficulties. Also, some query examples introduce the problem of the complexity of the querying expressions as well as of time complexity.  相似文献   

14.
基于实践,阐述了如何应用Delphi语言建立电台音频数据库,以及实现对音频文件播放的方法。  相似文献   

15.
通过AudioDirector软件在声音处理中的应用,包括音频管理、音频编缉、音频修复及音频混合功能,是一套功能强大、操作直觉化的专业声音处理软件。  相似文献   

16.
李坚  毛先领  文贵华 《计算机工程》2008,34(11):211-213
提出利用分形几何抽取音频特征的全局化音频检索,将其学习阶段计算音频数据库中每个音频的分维作为特征向量,保存在音频特征数据库中,并建立索引。其检索阶段则首先计算查询音频的分维,然后从音频数据库中快速找出分维最相似的若干音频对象。分维刻画了音频的内在属性如自相似性,使其具有片段检索对匹配的起点不敏感、抗噪音、检索速度快等优点。用FRACTAL, MFCC和SOLAR 3种方法对数据集分别检索,实验结果表明基于分维的音频检索在性能和时间复杂度上有显著优势。  相似文献   

17.
音频系统在嵌入式多媒体系统中占有很重要的地位。主要是利用双核心的Blackfin 561处理器的特点,设计了一种适合于此处理器的音频系统硬件解决方案。同时结合对嵌入式音频系统主要问题的分析,得到了一种针对此硬件架构的软件整体解决方案。在软件方面通过设置合理的缓冲区以及采取静音检测、同步等措施,实现了该应用在嵌入式μCLinux系统下的驱动程序,为嵌入式μCLinux系统下的芯片驱动开发提供了很好的借鉴。  相似文献   

18.
理想的音频检索方法可以准确、高效地从大规模音频数据库中识别所有音频。但是,目前还没有一种方法可以对所有噪声干扰鲁棒。基于Philips指纹的采样计数音频检索方法是目前最高效的方法之一,如果能解决其无法抵抗线性变换(时间缩放、频率变换)的缺点,则整个采样计数音频检索方法将进一步趋于理想。针对其中的频率变换问题,提出抗频率变换的采样计数音频检索方法,包括变频带间隔的查询指纹生成方法、多频率尺度的查询匹配方法,以及分步骤指纹提取和变过滤阈值两种加速策略。该方法可以抵抗70%到130%的频率变换,效果与目前最好的QUAD方法相当,并且可以扩展到任意使用Philips类的指纹的检索方法以增强其抵抗频率变换干扰的能力。  相似文献   

19.
Speaker indexing refers to the process of separating speakers within a recording and assigning indices to each unique speaker. This paper describes a new speaker indexing algorithm which dynamically generates and trains a neural network to model each postulated speaker found within a recording. Each neural network is trained to differentiate the vowel spectra of one specific speaker from all other speakers. A method for combining speaker indexing and other annotations of a recording in a general framework is also presented. The speaker indexing system is currently being incorporated into several application systems in the Speech Group at the MIT Media Lab.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号