首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 33 毫秒
1.
基于内容的音频检索关键技术研究   总被引:4,自引:0,他引:4  
朱爱红  李连 《现代计算机》2003,(11):37-40,51
音频是一种重要的媒体,包含丰富的听觉特征。本文根据当前音频检索研究的进展,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。  相似文献   

2.
基于内容的音频检索综述   总被引:14,自引:0,他引:14  
朱爱红  李连 《微机发展》2003,13(12):58-60,64
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索。为此,基于内容的音频检索技术应运而生。文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。  相似文献   

3.
根据不同的应用背景和分类对象,分别概述了多媒体数据库中基于内容的音频分类的一些关键技术,如特征提取和分类器设计,并分析了各种基于内容的音频分类方法的优缺点,讨论了存在的问题,指出了未来的研究方向。  相似文献   

4.
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索.为此,基于内容的音频检索技术应运而生.文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等.最后展望了音频检索技术的发展前景.  相似文献   

5.
音频信息检索综述   总被引:2,自引:0,他引:2  
随着多媒体和Internet技术的广泛应用和深入普及,多媒体数据的数量正在飞速增长,音频数据作为多媒体数据的重要组成部分,其信息量也在不断膨胀。如何有效的对音频信息进行检索成为现代信息检索的一个重要的研究领域。然而,音频数据同传统的文本数据不同,文本检索中的相关技术不能简单地应用到音频信息检索中,因为后者往往是基于语义的,所以不可避免地要用到音频数据的特征提取和模式匹配等技术。本文将对音频数据检索相关技术和系统做一综述性的介绍。  相似文献   

6.
胡剑凌  徐盛  陈健 《计算机工程》2000,26(7):48-49,61
详细介绍了MPEG-4音频编码标准,对其内部就不同码率和质量要求所提供的3种编码技术即参数编码、CELP编码和时频编码进行了分析和比较。  相似文献   

7.
色情音频检测是互联网信息安全中的重要组成部分,为国内外色情音频检测研究者提供良好的数据支撑。论文介绍并公开了带有色情及非色情标签的1min或30s音频片段数据集,并提出了语音识别技术和文本分类技术相结合的检测方法,实现了对色情音频自动过滤或预警。实验中论文所提方法在真实音频数据集上最高可以达到97.3%的分类正确率。  相似文献   

8.
MPEG-7描述多媒体内容的方法   总被引:4,自引:0,他引:4  
随着多煤体技术和Web技术的发展,出现了大量的多煤体数据。为了更好地管理和检索多煤体数据,我们需要一种描述多煤体内容的标准。本文首先分析了MPEG-7标准多煤体内容的据述工具,然后从结构和内容两个方面提出了MPEG-7描述多煤体内容的方法。最后,我们还讨论了一些与MPEG-7描述相关的研究问题。  相似文献   

9.
基于FPGA的音频内容远程识别系统利用互连网,通过对音频音调特征等进行采集到本地集中处理、,实现了广播电视节目中播出广告的远程监测以及自动识别和分析统计.结果可以自动载入相关数据库.该系统主要为被广告公司提供投播信息、监播结果、决策依据.  相似文献   

10.
基于内容的音频与音乐分析综述   总被引:1,自引:0,他引:1  
机器听觉包括三大研究领域:语音信号处理与识别、一般音频信号分析、基于内容的音乐信号分析.其中,语音信号处理与识别早已成为一个传统的研究热点.随着信息科学与技术的迅速发展,基于内容的音频与音乐信号分析也逐渐成为一个新的研究热点,近几年来取得了大量研究成果.文章将对1990年以后该领域上所取得的研究成果进行综述,包括基于内容的音频或音乐信号自动分类、分割、检索以及音乐作品自动分析等内容.  相似文献   

11.
MPEG—7和MPEG—7实验模型参考软件   总被引:3,自引:0,他引:3  
  相似文献   

12.
用MPEG-7 DDL表示用户查询需求的方法   总被引:1,自引:0,他引:1  
富亮  薛向阳 《计算机科学》2005,32(2):100-105
随着ISO MPEG-7标准在多媒体信息检索领域的深入应用,如何描述用户的查询信息需求变得越来越重要,本文提出一种新的用户查询需求的表示方法。该方法的主要特点是充分考虑MPEG-7标准对多媒体内容的标准化描述特性,因此对用户提交的信息需求具有很强的表达能力和较好的通用性。  相似文献   

13.
介绍了多媒体搜索引擎的工作原理,叙述了搜索引擎的系统结构以及各模块的具体实现, 最后讨论了MPEG-7搜索引擎的特点和潜在应用价值。  相似文献   

14.
基于音频统计特性的数字水印嵌入算法   总被引:1,自引:0,他引:1  
结合数字音频时频域统计特性及同步码技术, 提出了一种可有效抵抗去同步攻击的混合域数字音频水印嵌入算法. 该算法首先结合数字水印与同步码(大小), 对原始音频载体进行分段处理, 并将每个音频数据段分割成两部分用于嵌入同步码与水印信息; 然后利用时间域音频样本统计特性, 将同步码信息嵌入到音频样本的统计均值上; 最后根据频率域小波系数统计特性, 将数字水印嵌入到低频小波系数的平均值内.  相似文献   

15.
在多媒体流中的音频部分基于内容的检索工作做得很少。本文将提供一种通过声学的相似性来检索音频文件的方法,该方法相似性的度量是基于出自一个矢量量化器的统计表,而不是匹配简单的基音或谱特点.  相似文献   

16.
17.
基于混沌映射的视频数字水印算法   总被引:1,自引:0,他引:1  
马洁  李建福 《计算机科学》2010,37(9):287-289
为了更好地保护视频数据的版权,提出了一种基于混沌映射的视频水印算法.在该算法中,原始视频数据被分割成等帧数的视频组,利用MPEG-7的轮廓编码计算每个视频帧的主要物体轮廓坐标点集合;然后通过傅立叶变换得到该帧轮廓点形状不变量,利用哈希的方法计算水印信号和这些不变量的有效值作为密钥之一;再对整个视频组的轮廓点进行傅立叶变换,得到其时间轴上的有效不变域,并将水印信号嵌入在这个不变域的中频部分,采用混沌技术,提高了水印的嵌入量和算法的鲁棒性.在水印提取阶段,通过对水印的多重校验,确保水印信号的可靠性.实验结果表明,该算法对大部分的视频攻击都具有良好的鲁棒性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号