排序方式: 共有62条查询结果,搜索用时 0 毫秒
1.
为了更好地满足用户浏览和检索视频的需要,提出一种融合文本的足球视频事件分析框架.分别从文本和视频中提取事件信息,采用动态规划的算法对2种信息进行全局匹配,对于未匹配的文本事件信息.采用一个全局概率模型估计其在视频中的事件边界.通过寻找文本与视频事件信息的最优全局匹配,有效地避免了局部匹配方法造成的漏检和误检.实验结果表明,文中方法能够快速、准确地检测事件,获得详尽的事件内容信息,性能优于局部匹配算法. 相似文献
2.
3.
针对在同一场景下获取的体育运动视频,提出了一种基于全局运动补偿及运动前景区域信息的体育运动视频合成方法。首先,对待合成视频,通过全局运动估计与补偿,将相邻帧在空间上对齐到当前帧。通过计算帧差,得到当前帧中的运动前景区域信息。然后根据两段待合成视频之间背景的相似性,计算并修正全局运动参数,确定待合成对应帧之间的位置关系。最后,依据已经获得的运动前景区域信息,生成合成帧。实验结果表明,该方法可自动合成在同一场景中获得的有相似动态背景的体育视频,保持了前景与背景的清晰度,能清晰地显示运动员动作的差异。 相似文献
4.
目的 传统的基于浮点型向量表示的图像局部特征描述子(如SIFT、SURF等)已经成为计算机视觉研究和应用领域的重要工具,然而传统的高维特征向量在基于内容的大规模视觉检索应用中存在着维度灾难的问题,这使得传统浮点型视觉特征在大规模多媒体数据应用中面临严峻挑战。为了解决浮点型特征的计算复杂度高以及存储空间开销大的问题,越来越多的计算机视觉研究团队开始关注和研究基于二进制表达的局部特征并取得了重要进展。方法 首先介绍了二进制特征的相关工作,并对这些方法进行了分类研究,在此基础上提出了基于亮度差量化的特征描述算法。有别于传统二进制特征描述算法,本文算法首先对图像局部进行随机像素点对采样,并计算像素点对之间的亮度差,通过对亮度差值作二进制量化得到图像的局部二进制特征。结果 本文算法在公共数据集上与目前主流的几种二进制特征提取算法进行了比较评价,实验结果表明,本文二进制特征在特征匹配准确率和召回率上超过目前主流的几种二进制描述子,并且同样具有极高的计算速度和存储效率。结论 通过实验结果验证,本文二进制特征在图像条件发生变化时仍然能保持一定的鲁棒性。 相似文献
5.
基于多特征匹配的视频拷贝检测算法 总被引:3,自引:0,他引:3
针对已有的视频拷贝检测算法仅使用单一特征进行视频内容匹配,难以应对多种不同形式的拷贝变化的问题,提出一种基于多种视觉特征的视频拷贝检测算法.该算法采用级联式检测过滤框架,在提取视频帧图像的全局特征用于检测画面轻微变化的重复视频片段后,使用更精准的局部特征等来检测各种复杂变化后的拷贝内容.为在大规模数据库中实现快速检测,使用kd树型索引结构实现特征近邻检索.在标准评测数据集上的实验结果表明,文中算法对多种拷贝变化具有鲁棒性,并具有较高的检测效率. 相似文献
6.
高性能三维小波视频编码方法 总被引:2,自引:0,他引:2
讨论并实现了基于3D-SPIHT算法的三维小波视频编码方法。该方法建立在真三维小波分解基础上,通过定义一种新的时空方向树结构,实现了静止图像SPIHT算法的三维扩展。该方法不涉及运动估计,具有较低的计算负荷和时间延迟,所产生的视频流是完全嵌入的。实验结果表明该方法能够快速地、高质量地压缩视频图像,是一种很有潜力的视频编码方法。 相似文献
7.
基于3D-SPIHT的立体视频图像压缩编码 总被引:3,自引:0,他引:3
该文提出一种新的立体视频编码方案:在辅助序列中进行视差补偿预测和三维等级数集合分区(3D-SPIHT)编码,3D-SPIHT算法建立在真三维小波分解基础上,通过定义一种新的时空方向树结构,实现了静止图像SPIHT算法的三维扩展,实验结果表明该方案的编码性能略高于传统方案,具有较低的计算复杂度,所产生的嵌入式辅助序列码流,可根据通道带宽自适应调整输出码率,最大限度地提高辅助序列的质量。 相似文献
8.
易错视频传输中基于带宽-失真代价最小化准则的部分重传算法 总被引:1,自引:0,他引:1
针对视频传输系统主要关注的两个因素:传输所用的总体带宽和终端最终的解码失真,提出带宽-失真(B D)代价函数的概念,给出B-D关系定理及其证明.利用视频数据本身存在的时空相关的特点,进一步提出了基于最小化B D代价的部分重传机制.实验结果及分析表明,相对于尽力而为ARQ机制,所提出的算法有如下几个特点:(1)在保持终端接收质量基本不变的前提下,能有效减少带宽(可达20%以上);(2)在低比特率情形下性能比高比特率下的性能要好,所以更适合于低比特应用;(3)对运动平缓和纹理平滑的视频序列更为有效. 相似文献
9.
问题生成任务是指根据给定的文本段落和答案来自动生成对应的问题。针对现有问题生成方法存在的误差累积现象以及问题生成任务固有的“一对多”情况,提出一种带有关键词感知功能的问题生成方法。在预训练语言模型的基础上,实现关键词分类模型与问题生成模型的网络结构设计。输入文本段落中蕴含关键词,为使所生成的问题中包含同样的关键词以保证问题与段落的语义一致性,利用关键词分类模型提取出文本段落中的关键词,将关键词与非关键词的区分特征融入问题生成模型的输入中,该特征作为问题生成过程的全局信息,用以消除问题生成模型仅依赖局部最优解的弊端,减少误差累积与“一对多”情况的发生。在SQuAD数据集上的实验结果表明,该方法能够提升问题生成的质量,其BLEU-4指标值可达24,优于带有复制机制、带有语义监督的问题生成模型,目前已经借助百度百科数据平台实现了大规模工业应用。 相似文献
10.
体育视频全景图合成技术 总被引:4,自引:0,他引:4
研究了面向体育视频的全景图合成技术,提出了通过计算前景区域模板和α混合进行前景合成的方法.首先采用MPEG-4校验模型中的Konrad算法和基于Fisher线性判别准则的外点过滤算法进行全局运动参数估计,并用中值法合成背景全景图;然后将前景帧进行仿射投影后与背景求差值,并用中值滤波和形态学方法处理差值图像,得到前景区域模板;最后采用α混合生成前景序列的全景图,并叠加到背景上.由此得到的全景图能同时展现运动的场景和运动员的动作过程. 相似文献