共查询到19条相似文献,搜索用时 54 毫秒
1.
基于内容的音频检索关键技术研究 总被引:4,自引:0,他引:4
音频是一种重要的媒体,包含丰富的听觉特征。本文根据当前音频检索研究的进展,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。 相似文献
2.
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索.为此,基于内容的音频检索技术应运而生.文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等.最后展望了音频检索技术的发展前景. 相似文献
3.
4.
基于内容的音频检索是多媒体检索技术中一个重要的组成部分,而其检索技术却相对滞后.基于内容的音频检索已成为多媒体检索技术的研究热点.本文分析并总结了音频检索的概念,综述了基于内容的音频检索方法和相关技术,最后通过一个简单的系统对基于内容的音频检索方法进行了测试. 相似文献
5.
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且对于人们日趋复杂的信息检索需求无法满足,这就促使基于内容的音频检索技术出现和发展。文中根据基于内容的语音信息检索的研究现状,总结了基于内容的语音信息检索的基本特点,对语音信息检索技术、自然语言处理技术和语音识别技术分别进行了总结和讨论,最后探讨了基于内容的语音信息检索技术目前面临的挑战和发展。 相似文献
6.
7.
8.
9.
基于内容的音频分类是基于内容的音频检索技术中的重要研究内容。先简单介绍音频分类的理论基础,然后介绍几种典型的音频分类方法,最后通过一个简单的SVM算法进行模拟实验。 相似文献
10.
音频信息检索的研究及实现 总被引:9,自引:0,他引:9
介绍了常见的基于内容的音频检索的关键技术和音频特征提取的一般方法,讨论了其中基于隐马尔科夫(HMM)模型识别音频例子的关键问题,并在此基础上给出了一个基于内容的音频信息检索系统的框架和实例。 相似文献
11.
视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高. 相似文献
12.
13.
The growing digitization of multimedia content must be supported by a set of tools to manipulate them, and especially to query them. This is one of the major goals of an audio DBMS. Yet, existing work related to audio documents, e.g., radio or television archives, often leave the DBMS question open. In this paper, we lay the foundations for integrating audio into a general purpose DBMS, in the form of an audio abstract data type, along with its properties and associated operators. This contribution is coupled with an unsupervised statistically-founded speaker-based partitioning technique. For each of these two aspects, the paper underlines the practical interest and some technical difficulties. Also, some query examples introduce the problem of the complexity of the querying expressions as well as of time complexity. 相似文献
14.
15.
吴冬晨 《数字社区&智能家居》2014,(3):1559-1562
通过AudioDirector软件在声音处理中的应用,包括音频管理、音频编缉、音频修复及音频混合功能,是一套功能强大、操作直觉化的专业声音处理软件。 相似文献
16.
17.
音频系统在嵌入式多媒体系统中占有很重要的地位。主要是利用双核心的Blackfin 561处理器的特点,设计了一种适合于此处理器的音频系统硬件解决方案。同时结合对嵌入式音频系统主要问题的分析,得到了一种针对此硬件架构的软件整体解决方案。在软件方面通过设置合理的缓冲区以及采取静音检测、同步等措施,实现了该应用在嵌入式μCLinux系统下的驱动程序,为嵌入式μCLinux系统下的芯片驱动开发提供了很好的借鉴。 相似文献
18.
理想的音频检索方法可以准确、高效地从大规模音频数据库中识别所有音频。但是,目前还没有一种方法可以对所有噪声干扰鲁棒。基于Philips指纹的采样计数音频检索方法是目前最高效的方法之一,如果能解决其无法抵抗线性变换(时间缩放、频率变换)的缺点,则整个采样计数音频检索方法将进一步趋于理想。针对其中的频率变换问题,提出抗频率变换的采样计数音频检索方法,包括变频带间隔的查询指纹生成方法、多频率尺度的查询匹配方法,以及分步骤指纹提取和变过滤阈值两种加速策略。该方法可以抵抗70%到130%的频率变换,效果与目前最好的QUAD方法相当,并且可以扩展到任意使用Philips类的指纹的检索方法以增强其抵抗频率变换干扰的能力。 相似文献
19.
Deb K. Roy 《International Journal of Speech Technology》1997,1(2):143-149
Speaker indexing refers to the process of separating speakers within a recording and assigning indices to each unique speaker. This paper describes a new speaker indexing algorithm which dynamically generates and trains a neural network to model each postulated speaker found within a recording. Each neural network is trained to differentiate the vowel spectra of one specific speaker from all other speakers. A method for combining speaker indexing and other annotations of a recording in a general framework is also presented. The speaker indexing system is currently being incorporated into several application systems in the Speech Group at the MIT Media Lab. 相似文献