首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
视频技术的广泛应用带来海量的视频数据,仅依靠人力对监控视频中的异常进行检测是不太可能的。异常行为的自动化检测在公共安全等领域的地位极其重要。提出一种综合考虑目标特性和时空上下文的异常检测方法,该方法利用光流纹理图描述移动物体的刚性特征,建立基于隐马尔可夫模型HMM的时间上下文异常检测模型。在此基础上,提取异常目标的Radon特征,以支持向量机SVM的异常预分类结果为基础,通过HMM建立异常场景的空间上下文分类模型。该模型在公共数据集UCSD PED2上进行了实验验证,结果表明,本算法不仅在异常检测方面优于已有算法,而且还能给出异常分类。  相似文献   

2.
王琢  范九伦 《计算机应用研究》2009,26(10):3933-3937
提出了一种基于隐马尔可夫模型的入侵场景构建方法,实现自动地从大量低级的入侵检测告警信息中构建出更高层次的入侵场景的目的。为了简化处理过程,对数据流采用两次抽象描述和一次回溯处理过程完成对入侵场景的构建,在DARPA2000测试数据集上的实验表明该方法是有效的。  相似文献   

3.
视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高.  相似文献   

4.
音频场景分析技术对机器自动感知环境特征具有重要的意义。考虑到Mel频率倒谱系数MFCC(Melfrequen-cycepstralcoefficient)在一定程度上可以模拟人耳的听觉感知特性,因此,提出用MFCC作为音频识别特征,通过隐马尔可夫模型进行音频场景分析的方法,该方法对7种典型场景的识别率在90%以上。  相似文献   

5.
经典的隐马尔可夫模型(HMM)是一种基于统计信号的模型,它在基于内容的音频检索系统中具有重要的作用。根据音频分类重类型轻内容的特性,将单状态的HMM用于音频分类,克服了多状态HMM在模型初始化时状态初始概率和转移概率赋值带有假设不准确的缺点。实验结果表明基于单状态的HMM模型音频分类方法能有效地减少误识率,提高音频分类的精确度。  相似文献   

6.
针对智能监控系统中的行为分析与识别,将隐马尔可夫模型(Hidden Markov model,HMM)应用到智能视频监控系统的异常事件检测中。首先应用背景差法将运动目标提取出来。其次将运动目标的形状、颜色和帧间变化度等特征编码,生成特征向量。训练时将特征向量送入HMM训练得到隐马尔可夫模型需要的参数[WTHX]A和B[WTBZ],检测时将特征向量送入HMM检测系统检测是否有异常事件发生。最后的实验结果表明,该方法能快速有效地检测监控视频中的异常事件的发生。  相似文献   

7.
提出了一个兼具实时性和鲁棒性的短视频拷贝检测框架,并以长视频中的广告检测为应用进行研究.框架主要分为两个部分:1.基于音频匹配的短视频拷贝检测;2.基于图像的边界精确定位.第一阶段从原始视频中获得声谱图,并进一步地提取出音频特征并在音频库中寻找匹配;在第二阶段,对检测到的视频片段进行合并,然后利用视频片段在边界处附近的图像特征,对边界片段进行精确定位.实验结果显示,准确率高达99%,取得了很好的效果.  相似文献   

8.
基于PCA和CHMM的音频自动分类*   总被引:1,自引:0,他引:1  
针对DHMM分类器对音频特征进行向量量化引起的误差及特征维数过多导致计算复杂度过大的问题,提出了一种新的基于PCA和CHMM的音频自动分类方法。它先将音频特征组成一个高维向量,然后使用PCA对这些高维向量进行降维,再使用CHMM分类器对降维后的特征进行分类。实验证明了PCA和CHMM音频分类的有效性。  相似文献   

9.
提出了一种规则和隐马尔可夫模型相结合的音频分层分类算法,首先利用规则将新闻节目中的音频分为静音、语音和音乐三类,然后采用隐马尔可夫模型进一步将语音和音乐细分为男主持人语音、女主持人语音、交替报道、独白语音、现场语音和音乐六类。实验结果表明,男主持人语音、女主持人语音以及音乐的分类效果最好,查准率和查全率均可达90%以上;交替报道的分类性能最差,查准率为57.5%,查全率为79.3%;其他类别的分类性能居中,在70%~90%左右。与同类算法相比,该算法分类性能较高。  相似文献   

10.
董明宇  严迪群 《计算机应用》2022,42(6):1724-1728
针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法。该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化,最后输出分类结果。在TIMIT和Voicebank数据库上,所提算法的检测准确率最高可达100%,错误接收率最低仅为1.37%。在现实场景下检测由多种不同录音设备录制的带有设备本底噪声以及原始场景声音频,该算法的检测准确率最高可达99.27%。实验结果表明,在合适的模型下利用音频的CQCC特征来检测音频的场景替换痕迹是有效的。  相似文献   

11.
Determining automatically what constitutes a scene in a video is a challenging task, particularly since there is no precise definition of the term scene. It is left to the individual to set attributes shared by consecutive shots which group them into scenes. Certain basic attributes such as dialogs, settings and continuing sounds are consistent indicators. We have therefore developed a scheme for identifying scenes which clusters shots according to detected dialogs, settings and similar audio. Results from experiments show automatic identification of these types of scenes to be reliable.  相似文献   

12.
音频分割是音频分析与检测应用的基础,也是多媒体数据分析领域中的一个十分重要和困难的问题。目前大多数传统的音频流分割方法普遍存在虚假分割点过多、运算量太大、误检与漏检率过高等缺点。为了提高分割性能,有效降低误检率和漏检率,提出关于定长窗分层检测的音频分割算法,采用定长窗滑动遍历音频流,窗内自顶向下分层次地计算检测跳变点,最后用局部极值判定方法验证检测到的候选跳变点。实验结果证明,同传统的混合分割算法相比,处理速度得到大幅提高的同时,跳变点的召回率提高7.1%,准确率达92%。  相似文献   

13.
基于Vega Prime的视景仿真技术研究与应用   总被引:9,自引:4,他引:9  
文章针对Vega Prime视景仿真技术相对于Vega的改进之处,设计了基于Vega Prime的视景仿真框架,重点研究了四个方面内容:运动模型和仿真对象的特点及两者之间的驱动关系、坐标系统和不同坐标系之间的转换机制、碰撞检测器的原理和碰撞检测的方法、用于模拟环境效果的”天历表模型”和模拟特殊效果的粒子系统等等。论文解决了基于Vega Prime的视景仿真技术涉及的诸多关键技术,为Vega Prime在实践中的有效应用打下良好基础。最后,论文还分析了基于Vega Prime的场景漫游过程,并把文章研究的相关理论应用到实践。  相似文献   

14.
该文阐述了在Linux下,利用V4L以及ALSA,在普通PC上组建视频音频采集系统以及远程传输的方法。  相似文献   

15.
该文阐述了在Linux下,利用V4L以及ALSA,在普通PC上组建视频音频采集系统以及远程传输的方法。  相似文献   

16.
音、视频数据捕捉方法   总被引:2,自引:0,他引:2  
查锦发  陈莘萌 《计算机工程》2003,29(12):128-129
在阐明适用于大容量动态图像的AVI文件扩展格式和目前流行的COM技术的基础上,给出了一种将捕捉的音、视频数据保存为大容量动态图像文件的方法。  相似文献   

17.
基于语义信息提取的新闻视频场景分割方法   总被引:3,自引:1,他引:3  
随着数字视频的广泛应用,视频数据库系统已成为多媒体领域的一个研究热点。在建立视频数据库的过程中,视频场景的分割是一个重要而又难以解决的问题。文章从分析新闻视频场景所特有的结构特征入手,提出了一种基于语义信息提取的新闻视频场景分割新方法,该方法通过对音频流和视频流中的镜头变换、主持人镜头、主题字幕和静音区间等语义信息的提取和分析来实现新闻视频场景的分割。实验表明,采用该文提出的方法,场景分割正确率可达86.9%,较好地解决了新闻视频场景分割问题。  相似文献   

18.
以往基于离散小波变换的音频数字水印算法鲁棒性不强,无法对数字音频信号的版权进行真正地保护,因此改进了算法,利用心理声学模型,控制水印信号的嵌入,通过计算音频信号的掩蔽阀值,在保证水印嵌入不可察觉的前提下,增大水印的嵌入强度。仿真实验证明,该算法具有较强的鲁棒性和不可感知性,能有效抵御各种常见攻击,并且能实现盲检测。  相似文献   

19.
基于Oracle的音像租赁管理系统数据库设计   总被引:1,自引:0,他引:1  
给出了小型音像租赁店的业务需求、信息需求和业务规则,用Oracle数据库设计的思想分析了本系统中的实体和关系,进行了数据库概念模型设计,并用ERD图表进行数据库设计,给出了数据库逻辑设计结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号