排序方式: 共有38条查询结果,搜索用时 15 毫秒
1.
视频流的数据量大,又是一种非结构性的数据,因此视频分类一直是视频分析工作中的一个难点。本文采用视频分割技术,将视频分割成一系列的镜头,利用这些镜头在时间上的序列特征,使用序列模式对镜头序列进行分析,并提出一个基于序列模式挖掘的视频分类系统模型。该系统中主要利用cSPADE算法来实现对镜头序列的分类,以形成分类规则库,通过该规则库匹配待分类视频的镜头序列,从而实现视频的分类。 相似文献
2.
基于内容的体育视频分类是高效管理大量体育视频数据的关键步骤之一,为提高体育视频分类方法的正确率及泛化能力,提出一种基于类型标志镜头与视觉词袋模型相结合的体育视频分类方法.首先给出类型标志镜头的定义,并通过类型标志镜头构建该镜头视频帧训练库;然后构建基于视频帧训练库的金字塔视觉词袋模型,将视频帧标志为归一化的词频向量,使用SVM对视频帧进行分类;再通过分析视频帧分类错误的原因及表现形式提出基于时序连续性孤立帧去除算法,以消除视频帧的错误归类.由于体育视频按组合类型可分为单一体育视频与混合体育视频,因此分别提出了单一体育视频及混合体育视频2种分类算法.实验结果表明,文中算法具有实现简单、处理速度快和准确度高的优点. 相似文献
3.
4.
迅雷7肯定是大家比较常用的下载软件了,它可以设置下载完成的文件按影视、音乐、游戏等分类存放,如何让迅雷7下载的文件分类与Win7库中的音乐、视频分类同步呢?其实通过简单几步设置就能让迅雷7下载完成的文件直接同步到Win7库中,不需要手工移动,这会让习惯使用Win7的库来进行文件操作的用户感到非常方便。 相似文献
5.
转炉炼钢的状态判别对成品钢材质量的好坏有直接影响。根据人工经验的状态判别需要持续观察炉口的火焰变化,存在主观性强、成本高等问题。为了提升转炉炼钢状态判别的准确率,提出一种基于注意力机制的3D残差卷积神经网络模型。改进的通道注意力将平均池化和最大池化进行特征融合,可以推断出更精细的通道特征,空间注意力能提取到空间上的重点信息。实验结果表明,改进的模型效果好于SE、CBAM和ECA注意力模块,与未加注意力机制的3D残差模型相比,F1分数提高了1.03个百分点,准确度提高了1.06个百分点。最后通过消融实验,分析通道注意力和空间注意力对于网络模型的影响。 相似文献
6.
针对三维卷积神经网络无法高效地提取时空特征,提出了一种基于SR3D网络的人体行为识别算法。首先,将三维残差模块的BN层和Relu激活函数放置在三维卷积层之前,更好地提取时空特征;然后,将改进的三维残差块和SE模块组合成SR3D模块,增加重要通道的利用率,提高了网络的识别率。在UCF-101和自制异常行为数据集上进行了大量实验结果表明,SR3D算法分别达到了47.7%和83.6%的识别率(top-1精度),与三维卷积网络(C3D)相比分别提高了4.6和17.3个百分点。 相似文献
7.
8.
9.
应国家对视频网站加强有序管理的迫切要求,文中应用一种基于多模态特征的网络视频分类方法,实现对网络视频的安全监管。该方法对从网络视频中提取三大类的视频特征,分别针对音频特征、运动和颜色以及空间和时间特征,递进地对视频进行过滤。通过对视频中不良场景的定义,包括恐怖、暴力和色情语义,以检测网络视频内容中潜在的不良信息,实验证明该方法有效地提高了不良视频检测和分类的准确率。 相似文献
10.
随着智能手机和5G网络的普及,短视频已经成为人们碎片时间获取知识的主要途径。针对现实生活场景短视频数据集不足及分类精度较低等问题,提出融合深度学习技术的双流程短视频分类方法。在主流程中,构建A-VGG-3D网络模型,利用带有注意力机制的VGG网络提取特征,采用优化的3D卷积神经网络进行短视频分类,提升短视频在时间维度上的连续性、平衡性和鲁棒性。在辅助流程中,使用帧差法判断镜头切换抽取出短视频中的若干帧,通过滑动窗口机制与级联分类器融合的方式对其进行多尺度人脸检测,进一步提高短视频分类准确性。实验结果表明,该方法在UCF101数据集和自建的生活场景短视频数据集上对于非剧情类与非访谈类短视频的查准率和查全率最高达到98.9%和98.6%,并且相比基于C3D网络的短视频分类方法,在UCF101数据集上的分类准确率提升了9.7个百分点,具有更强的普适性。 相似文献