期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王华伟施智平史忠植胡宏《计算机工程与应用》2005,41(27):157-159

情节代表帧选取方法是视频语义分析和基于内容的视频检索的很重要的方法。代表帧的使用大大减少了视频索引的数据量,同时也为视频摘要和检索提供了一种快捷的方法。该文在子镜头的关键帧提取方法基础上,利用模糊C-均值聚类算法,实现了一种基于子镜头聚类的情节代表帧选取方法。实验证明该方法计算简单,可以较好地代表视频情节。相似文献

2.

在线聚类算法用于基于内容的镜头检索

周之昊王士同《数据采集与处理》2008,23(1):84-88

视频数据具有一定的隐舍层次性,因此在对视频进行镜头分割后,可以利用模糊聚类算法依据相似度提取关键帧和关键镜头,对视频内容进行抽象概括,并以此时镜头进行检索.本文用非监督学习方法中的在线聚类算法自动提取镜头的关键帧,以相似方法对关键帧进行聚类以自动提取关键镜头,并对分类结果进行自我调整.将上述方法实现并用于镜头检索,获得了良好的检索结果,并减少了经验对聚类的影响,而且较好地表示了视频内容的层次性. 相似文献

3.

模糊聚类在镜头检索中的应用与研究

周之昊王士同周燡《微计算机信息》2008,24(3):217-219

视频数据具有隐含层次性,可以利用模糊聚类算法依据相似度提取关键帧和关键镜头,对视频内容进行抽象概括,并以此对镜头进行检索.我们将上述方法实现并用于镜头检索,获得了良好的检索结果,并减少了经验对聚类的影响,而且较好地表示了视频内容的层次性. 相似文献

4.

结合互信息量与模糊聚类的关键帧提取方法 总被引：1，自引：0，他引：1

蔡家楣陈洋陈铁明张旭东《计算机系统应用》2010,19(4):73-76

关键帧是描述一个镜头的关键图像帧,它通常反映一个镜头的主要内容,因此,关键帧提取技术是视频分析和基于内容的视频检索的基础。提出了一种结合互信息量与模糊聚类的关键帧提取方法,一方面通过互信息量算法对视频片段进行镜头检测可以保持视频的时间序列和动态信息,另一方面通过模糊聚类使镜头中的关键帧能很好的反映视频镜头的主要内容。最后构建了一套针对MPEG-4视频的关键帧提取系统,通过实验证明该系统提取的关键帧,可以较好地代表视频内容,并且有利于实现视频分析和检索。相似文献

5.

一种基于核聚类的关键帧提取方法 总被引：4，自引：0，他引：4

潘晓英王昊《微机发展》2005,15(3):29-31,53

为了在视频数据库中提供有效的视频检索和浏览功能，必须用简明的方式表示视频的内容。关键帧是对视频镜头的简洁表示，关键帧提取已成为视频检索的一个重要研究方向。文中提出了一种基于核聚类的视频关键帧提取方法，它通过对视频提取颜色特征．并将这些特征作为样本映射到高维特征空间之后，在特征空间中进行聚类，使原来没有显现的特征突现出来，自动将内容相似的样本归为同类，每一类可取一个样本代表其内容，这样的样本即为关键帧。实验结果表明这种方法可以较好地概括视频内容。相似文献

6.

一种基于核聚类的关键帧提取方法

潘晓英王昊《计算机技术与发展》2005,15(3)

为了在视频数据库中提供有效的视频检索和浏览功能,必须用简明的方式表示视频的内容.关键帧是对视频镜头的简洁表示,关键帧提取已成为视频检索的一个重要研究方向.文中提出了一种基于核聚类的视频关键帧提取方法,它通过对视频提取颜色特征,并将这些特征作为样本映射到高维特征空间之后,在特征空间中进行聚类,使原来没有显现的特征突现出来,自动将内容相似的样本归为同类,每一类可取一个样本代表其内容,这样的样本即为关键帧.实验结果表明这种方法可以较好地概括视频内容. 相似文献

7.

一种基于多特征的视频人物聚类方法

蒋鹏秦小麟《计算机科学》2008,35(5):240-242

检索一段视频中出现的人物并进行人物归类具有重要的研究意义和实用价值.本文提出一种基于多特征的视频人物检索聚类算法:先用一种结合人脸检测和物体跟踪的算法检测镜头人物,并提取人物衣服区域颜色以及声音作为人物特征,再用一种无监督模糊聚类方法对人物进行聚类,最后利用声音特征对聚类结果进行修正.该方法适用于人物数未知的条件下进行无监督的人物聚类.不同类型视频的试验证明该方法有效而实用. 相似文献

8.

一种基于纹理特征的教案视频镜头分割方法

孙琳张同珍《计算机仿真》2006,23(6):279-281

该文分析了现有的对帧间特征差进行阈值比较的镜头分割方法,以及通过颜色空间和可调时间阈值进行视频聚类方法的不准确性,针对教案视频中大量文字内容体现出的特有的纹理特征,提出了使用基于灰度级共生矩阵纹理特征的C均值模糊聚类算法进行教案视频镜头分割.算法选取灰度级共生矩阵统计量之一的惯性矩作为度量帧间相似性的特征值,并根据教案视频中手写操作的特点调整特征向量,以此作为样本数据点进行模糊聚类.实验结果显示这种方法对于教案视频镜头的分割具有较好效果. 相似文献

9.

基于镜头关键帧集的视频场景聚类的研究 总被引：3，自引：0，他引：3

蔡波周洞汝《计算机工程与应用》2003,39(28):32-35

在数字视频的分析、浏览、检索中,镜头已难以满足现有的需要。场景是一组包含有内容相关的若干镜头的集合,在一定程度上满足了数字视频的分析、浏览、检索的需要。文章首先使用了X2直方图匹配的计算方法,结合直方图的两次判断法,进行突变和渐变镜头边界的检测;然后对镜头内非相邻帧间距离经过阈值判断提取关键帧集;文章提出了基于镜头关键帧计算两个关键帧集之间距离的最小值作为所计算镜头之间的距离的算法;最后运用镜头之间的距离进行镜头的聚类产生场景,给出了典型的实验结果,表明该算法对视频场景的聚类有较好的性能。相似文献

10.

一种层次视频摘要生成方法

程文刚须德《中国图象图形学报》2004,9(1):118-123

视频摘要是视频内容的一种压缩表示方式。为了能够更好地浏览视频，提出了一种根据浏览或检索的粒度不同来建立两种层次视频摘要(镜头级和场景级)的思想，并给出了一种视频摘要生成方法：首先用一种根据内容变化自动提取镜头内关键帧的方法来实现关键帧的提取；继而用一种改进的时间自适应算法通过镜头的组合来得到场景；最后在场景级用最小生成树方法提取代表帧。由于关键帧和代表帧分别代表了它们所在镜头和场景的主要内容，因此它们的序列就构成了视频总结。一些电影视频片段检验的实验结果表明，这种生成方法能够较好地提供粗细两种粒度的视频内容总结。相似文献

11.

基于镜头和情节的视频非线性组织 总被引：9，自引：0，他引：9

陆海斌章毓晋杨卫平《计算机学报》2000,23(5):548-552

提出了一种新的基于视频单元的视频非线性组织方案,该方案通过将视频分为情节,镜头,视频流三层,以支持视频的高效摘要、存储和浏览。视频组织采取由下而上的方法,首先通过对镜头单元的检测和镜头关键帧的提取,将视频流按镜头进行组织;然后对情节单元划分的基础上,根据所提出的镜头代表性准则,确定情报的代表帧,达到了将镜头按情节组织的目的。文中着重介绍了所提出的采用分级聚类和模糊和分类选取情节代表帧的算法。根据上相似文献

12.

基于聚类的间隔帧分割算法

申永军张峰郭阿弟田喜伟《微计算机信息》2010,(3)

镜头分割是基于内容的视频检索首先要解决的关键技术。一般聚类算法可能导致帧序不连续或分割错误,并且现有的分割算法基本上都是对镜头中连续帧依次进行比较,效率比较低;为了解决以上问题,提出了一种改进的镜头分割算法-基于聚类的间隔帧分割算法,在此算法引入了参考变量,镜头中的很多帧不需进行比较。实验表明本算法(采用颜色直方图作为切变判别依据)在镜头分割中提高了效率,并且提高了分割的准确率。相似文献

13.

Long-term prediction for hierarchical-B-picture-based coding of video with repeated shots

Xu-guang Zuo Lu Yu 《浙江大学学报:C卷英文版》2018,19(3):459-470

The latest video coding standard High Efficiency Video Coding (HEVC) can achieve much higher coding efficiency than previous video coding standards. Particularly, by exploiting the hierarchical B-picture prediction structure, temporal redundancy among neighbor frames is eliminated remarkably well. In practice, videos available to consumers usually contain many repeated shots, such as TV series, movies, and talk shows. According to our observations, when these videos are encoded by HEVC with the hierarchical B-picture structure, the temporal correlation in each shot is well exploited. However, the long-term correlation between repeated shots has not been used. We propose a long-term prediction (LTP) scheme to use the long-term temporal correlation between correlated shots in a video. The long-term reference (LTR) frames of a source video are chosen by clustering similar shots and extracting the representative frames, and a modified hierarchical B-picture coding structure based on an LTR frame is introduced to support long-term temporal prediction. An adaptive quantization method is further designed for LTR frames to improve the overall video coding efficiency. Experimental results show that up to 22.86% coding gain can be achieved using the new coding scheme. 相似文献

14.

Video segmentation using a histogram-based fuzzy c-means clustering algorithm 总被引：4，自引：0，他引：4

Chi-Chun Shuenn-Jyi 《Computer Standards & Interfaces》2001,23(5):429-438

The purpose of video segmentation is to segment video sequence into shots where each shot represents a sequence of frames having the same contents, and then select key frames from each shot for indexing. Existing video segmentation methods can be classified into two groups: the shot change detection (SCD) approach for which thresholds have to be pre-assigned, and the clustering approach for which a prior knowledge of the number of clusters is required. In this paper, we propose a video segmentation method using a histogram-based fuzzy c-means (HBFCM) clustering algorithm. This algorithm is a hybrid of the two approaches aforementioned, and is designed to overcome the drawbacks of both approaches. The HBFCM clustering algorithm is composed of three phases: the feature extraction phase, the clustering phase, and the key-frame selection phase. In the first phase, differences between color histogram are extracted as features. In the second phase, the fuzzy c-means (FCM) is used to group features into three clusters: the shot change (SC) cluster, the suspected shot change (SSC) cluster, and the no shot change (NSC) cluster. In the last phase, shot change frames are identified from the SC and the SSC, and then used to segment video sequences into shots. Finally, key frames are selected from each shot. Simulation results indicate that the HBFCM clustering algorithm is robust and applicable to various types of video sequences. 相似文献

15.

基于K均值聚类的视频关键帧提取技术研究

张一凡李家辰旷远有刘盼赵子元《电脑与信息技术》2021,29(1):13-16

文章提出了一种基于k均值聚类的视频关键帧提取算法.该算法在视频的镜头分割算法之上,通过层次聚类对视频内容进行初步划分,之后结合k均值聚类算法对初步提取的关键帧进行直方图特征对比去掉冗余帧,最终确定视频的关键帧序列.经过大量的实验数据证明,该算法能够提取出冗余度较低、代表性较强的关键帧,一定程度上为视频关键帧提取提供了有... 相似文献

16.

基于时序结构图的视频流描述方法 总被引：1，自引：0，他引：1

王东辉朱淼良吴春明《计算机学报》2001,24(9):944-950

通过对视频流的分解可以获得基于关键帧集的视频流表示,但这种表示方法不能反映出视频流中隐藏的故事发展关系,为揭示这种关系,提出了一种视频流的快速聚类算法,用于对视频流分解单元进行相关性分析,该算法通过检测视频镜头间的相似性和连续性,实现把来自同一摄像机的视频镜头归并入同一视频类,并帱此得到而且为矿山频流的快速浏览和检索提供了新的思路。相似文献

17.

视频语义场景聚类算法研究

叶军李建良《小型微型计算机系统》2008,29(10)

视频聚类是视频索引和检索的重要组成部分.本文针对镜头已分割好的视频如何提取更高语义层次的场景,考虑帧图像间以帧分块的局部似然比特征和小波变换的全局边缘特征相结合的综合相似性度量,利用视频编辑的一种常用特征及代表性镜头的选取原则,给出了一种新的语义场景的提取算法.数值实验表明该算法对基于对话类的视频类型有很好的场景提取效果,与WBS(Window-based Sweep Algorithm)算法相比,查全率和查准率分别提高了8.7%和28.4%. 相似文献