共查询到17条相似文献,搜索用时 33 毫秒
1.
基于内容的音频检索关键技术研究 总被引:4,自引:0,他引:4
音频是一种重要的媒体,包含丰富的听觉特征。本文根据当前音频检索研究的进展,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。 相似文献
2.
基于内容的音频检索综述 总被引:14,自引:0,他引:14
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索。为此,基于内容的音频检索技术应运而生。文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。 相似文献
3.
常梦星 《电脑编程技巧与维护》2010,(14):92-94
根据不同的应用背景和分类对象,分别概述了多媒体数据库中基于内容的音频分类的一些关键技术,如特征提取和分类器设计,并分析了各种基于内容的音频分类方法的优缺点,讨论了存在的问题,指出了未来的研究方向。 相似文献
4.
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索.为此,基于内容的音频检索技术应运而生.文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等.最后展望了音频检索技术的发展前景. 相似文献
5.
6.
7.
司朋举 《计算机与数字工程》2023,(4):877-880+958
色情音频检测是互联网信息安全中的重要组成部分,为国内外色情音频检测研究者提供良好的数据支撑。论文介绍并公开了带有色情及非色情标签的1min或30s音频片段数据集,并提出了语音识别技术和文本分类技术相结合的检测方法,实现了对色情音频自动过滤或预警。实验中论文所提方法在真实音频数据集上最高可以达到97.3%的分类正确率。 相似文献
8.
9.
基于FPGA的音频内容远程识别系统利用互连网,通过对音频音调特征等进行采集到本地集中处理、,实现了广播电视节目中播出广告的远程监测以及自动识别和分析统计.结果可以自动载入相关数据库.该系统主要为被广告公司提供投播信息、监播结果、决策依据. 相似文献
10.
11.
12.
用MPEG-7 DDL表示用户查询需求的方法 总被引:1,自引:0,他引:1
随着ISO MPEG-7标准在多媒体信息检索领域的深入应用,如何描述用户的查询信息需求变得越来越重要,本文提出一种新的用户查询需求的表示方法。该方法的主要特点是充分考虑MPEG-7标准对多媒体内容的标准化描述特性,因此对用户提交的信息需求具有很强的表达能力和较好的通用性。 相似文献
13.
14.
基于音频统计特性的数字水印嵌入算法 总被引:1,自引:0,他引:1
结合数字音频时频域统计特性及同步码技术, 提出了一种可有效抵抗去同步攻击的混合域数字音频水印嵌入算法. 该算法首先结合数字水印与同步码(大小), 对原始音频载体进行分段处理, 并将每个音频数据段分割成两部分用于嵌入同步码与水印信息; 然后利用时间域音频样本统计特性, 将同步码信息嵌入到音频样本的统计均值上; 最后根据频率域小波系数统计特性, 将数字水印嵌入到低频小波系数的平均值内. 相似文献
15.
16.
17.
基于混沌映射的视频数字水印算法 总被引:1,自引:0,他引:1
为了更好地保护视频数据的版权,提出了一种基于混沌映射的视频水印算法.在该算法中,原始视频数据被分割成等帧数的视频组,利用MPEG-7的轮廓编码计算每个视频帧的主要物体轮廓坐标点集合;然后通过傅立叶变换得到该帧轮廓点形状不变量,利用哈希的方法计算水印信号和这些不变量的有效值作为密钥之一;再对整个视频组的轮廓点进行傅立叶变换,得到其时间轴上的有效不变域,并将水印信号嵌入在这个不变域的中频部分,采用混沌技术,提高了水印的嵌入量和算法的鲁棒性.在水印提取阶段,通过对水印的多重校验,确保水印信号的可靠性.实验结果表明,该算法对大部分的视频攻击都具有良好的鲁棒性. 相似文献