期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

程松盛潘金山《计算机科学》2021,48(7):184-189

视频复原的目标是从给定的退化视频序列中把潜在的高质量视频复原出来.现有的视频复原方法主要集中在如何有效地找到相邻帧之间的运动信息,然后利用运动信息建立相邻帧之间的匹配.与这些方法不同,文中提出了基于深度学习特征匹配的方法来解决视频超分辨率问题.首先,通过深度卷积神经网络计算出相邻帧之间的运动信息;然后,采用一个浅层深度卷积神经网络从输入的视频帧中提取特征,基于估计到的运动信息,将浅层深度卷积神经网络提取到的特征匹配到中间视频帧对应的特征中,并将得到的特征进行有效融合;最后,采用一个深度卷积神经网络重建视频帧.大量的实验结果验证了基于深度学习特征匹配的方法能有效地解决视频超分辨率问题.与现有的基于视频帧匹配的方法相比,所提方法在现有的公开视频超分辨率数据集上取得了较好的效果. 相似文献

2.

轻量级注意力约束对齐网络的视频超分重建

下载免费PDF全文

靳雨桐宋慧慧刘青山《中国图象图形学报》2022,27(10):2984-2993

目的深度学习在视频超分辨率重建领域表现出优异的性能,本文提出了一种轻量级注意力约束的可变形对齐网络,旨在用一个模型参数少的网络重建出逼真的高分辨率视频帧。方法本文网络由特征提取模块、注意力约束对齐子网络和动态融合分支3部分组成。1）共享权重的特征提取模块在不增加参数量的前提下充分提取输入帧的多尺度语义信息。2）将提取到的特征送入注意力约束对齐子网络中生成具有精准匹配关系的对齐特征。3）将拼接好的对齐特征作为共享条件输入动态融合分支,融合前向神经网络中参考帧的时域对齐特征和原始低分辨率（low-resolution,LR）帧在不同阶段的空间特征。4）通过上采样重建高分辨率（high-resolution,HR）帧。结果实验在两个基准测试数据集（Vid4（Vimeo-90k）和REDS4（realistic and diverse scenes dataset））上进行了定量评估,与较先进的视频超分辨率网络相比,本文方法在图像质量指标峰值信噪比（peak signal to noise ratio,PSNR）和结构相似性（structural similarity,SSIM）方面获得了更好的结果,进一步提高了超分辨率的细节特征。本文网络在获得相同的PSNR指标的情况下,模型参数减少了近50%。结论通过极轴约束使得注意力对齐网络模型参数量大大减少,并能够充分捕获远距离信息来进行特征对齐,产生高效的时空特征,还通过设计动态融合机制,实现了高质量的重建结果。相似文献

3.

基于注意力融合网络的视频超分辨率重建

卞鹏程郑忠龙李明禄何依然王天翔张大伟陈丽媛《计算机应用》2021,41(4):1012-1019

基于深度学习的视频超分辨率方法主要关注视频帧内和帧间的时空关系,但以往的方法在视频帧的特征对齐和融合方面存在运动信息估计不精确、特征融合不充分等问题。针对这些问题,采用反向投影原理并结合多种注意力机制和融合策略构建了一个基于注意力融合网络（AFN）的视频超分辨率模型。首先,在特征提取阶段,为了处理相邻帧和参考帧之间的多种运动,采用反向投影结构来获取运动信息的误差反馈;然后,使用时间、空间和通道注意力融合模块来进行多维度的特征挖掘和融合;最后,在重建阶段,将得到的高维特征经过卷积重建出高分辨率的视频帧。通过学习视频帧内和帧间特征的不同权重,充分挖掘了视频帧之间的相关关系,并利用迭代网络结构采取渐进的方式由粗到精地处理提取到的特征。在两个公开的基准数据集上的实验结果表明,AFN能够有效处理包含多种运动和遮挡的视频,与一些主流方法相比在量化指标上提升较大,如对于4倍重建任务,AFN产生的视频帧的峰值信噪比（PSNR）在Vid4数据集上比帧循环视频超分辨率网络（FRVSR）产生的视频帧的PSNR提高了13.2%,在SPMCS数据集上比动态上采样滤波视频超分辨率网络（VSR-DUF）产生的视频帧的PSNR提高了15.3%。相似文献

4.

基于运动估计与时空结合的多帧融合去雨网络

孟祥玉薛昕惟李汶霖王祎《计算机科学》2021,48(5):170-176

降雨天气会导致视觉质量下降,从而影响目标识别和追踪等视觉任务的处理效果。为了减小雨的影响,完成对运动视频背景细节的有效恢复,近年来相关研究者在视频去雨方向提出了很多方法。其中基于卷积神经网络的视频去雨方法使用最为广泛,它们大多采用单帧增强后多帧融合去雨的方式。但由于直接单帧增强使相邻帧之间部分像素的移动无法完成时间维度上的对齐,不能有效实现端到端的训练,因此丢失了大量细节信息,使得最终得到的去雨效果不尽人意。为有效解决上述问题,文中提出了一个基于运动估计与时空结合的多帧融合去雨网络(ME-Derain)。首先通过光流估计算法将相邻帧对齐到当前帧来有效利用时间信息;然后引入基于残差连接的编码器-解码器结构,结合与时间相关的注意力增强机制一起构成多帧融合网络来有效融合多帧信息;最后利用空间相关的多尺度增强模块来进一步增强去雨效果和得到最终的去雨视频。在多个数据集上的大量实验结果表明,所提算法优于现阶段大部分视频去雨算法,能够获得更好的去雨效果。相似文献

5.

基于可变形非局部三维卷积网络的视频超分辨率重建算法

蔡非凡万旺根《工业控制计算机》2022,35(3):54-56

视频超分辨率(VSR)技术的目标是找出从相应的低分辨率(LR)视频序列重建高分辨率(HR)视频的最佳重建方案.提出了一种新颖的可变形非局部三维卷积网络(DNL-3DCNN)能有效地利用时空信息和参考帧与相邻帧之间的全局相关性.具体来说,非局部结构(Non-Local)同时增强了输入帧的时空信息中所需要的精细细节.此外,... 相似文献

6.

多信息融合的卫星视频单目标跟踪

王丽黎张慧《计算机系统应用》2023,32(2):266-273

针对卫星视频中存在目标特征信息少、前景背景对比性低等问题, 在SiamCAR的基础上提出了一种融合运动信息和注意力机制的目标跟踪方法; 首先引入运动激励模块和通道注意力模块以增强目标特征提取信息; 然后将相邻帧作为新模板添加到网络里形成三重网络补充模板信息; 最后加入卡尔曼滤波算法进行目标轨迹预测, 将预测模板添加到网络中形成四重网络增加目标的运动信息; 选取SatSOT卫星视频数据集中的10组数据进行测试, 实验结果表明与SiamCAR网络相比, 改进算法的跟踪准确率和成功率分别提升了6%和6.2%. 相似文献

7.

基于深度学习的视频超分辨率重构进展综述

冷佳旭王佳莫梦竟成陈泰岳高新波《计算机科学》2022,49(2):123-133

视频超分辨率是根据给定的低分辨率视频序列恢复其对应的高分辨率视频帧的过程.近年来,VSR在深度学习的驱动下取得了重大突破.为了进一步促进VSR的发展,文中对基于深度学习的VSR算法进行了归类、分析和比较.首先,根据网络结构将现有方法分为两大类,即基于迭代网络的VSR和基于递归网络的VSR,并对比分析了不同网络模型的优缺... 相似文献

8.

结合注意力机制与多尺度特征融合的视频彩色化方法

周柯明孔广黔邓周灰《计算机应用研究》2024,41(4):1214-1220

针对现有视频彩色化方法难以同时保证着色质量和时间一致性的问题,提出一种结合注意力机制和多尺度特征融合的视频彩色化方法AMVC-GAN。首先,提出以GAN为主体的视频彩色化网络模型,通过在GAN的生成器中设计以循环时间网络为主体的多尺度特征融合模块,来获取不同时间频率的信息;其次,为了有效地考虑相邻帧之间的关系,将不同时间频率提取的特征进行融合,加强帧与帧之间的联系,以此增强彩色化的时间一致性;最后,为了获取更多的有效信息,在主网络的上采样部分引入了注意力模块,并通过使用PatchGAN来对结果进行优化训练,以增强最终的着色效果。在DAVIS和VIDEVO数据集上与先进的全自动视频彩色化方法进行对比实验。结果表明,AMVC-GAN在多项指标上排名第一,具有更好的时间一致性和着色效果。相比于其他方法,AMVC-GAN能够有效地减少时间闪烁,同时保证着色效果更为真实、自然。相似文献

9.

基于自适应注意力融合特征提取网络的图像超分辨率

王拓然程娜丁士佳王洪玉《计算机应用研究》2023,40(11):3472-3477+3508

为了应对当前大型图像超分辨率模型参数过多难以部署,以及现有的轻量级图像超分辨率模型性能表现不佳的问题,提出了一种基于自适应注意力融合特征提取网络的图像超分辨率模型。该模型主要由一个大核注意力模块和多个高效注意力融合特征提取模块组成。首先,利用大核注意力模块进行浅层特征提取,然后将提取到的浅层特征信息输入级联的高效注意力融合特征提取模块进行深层特征提取、增强、细化和再分配的聚合操作。高效注意力融合特征提取模块由三个部分组成,分别是渐进式残差特征提取模块、通道对比度感知注意力模块和通道—空间联合注意力模块。该网络可以在利用少量参数的情况下实现更好的图像超分辨率性能,是一种表现优异的轻量级图像超分辨率模型。通过在流行的基准数据集上评估提出的方法,并与现有的一些方法进行对比,结果表明该方法的表现更优异。相似文献

10.

基于帧间辅助的视频人群计数

崔宇超何淼楹胡诗雨《计算机应用》2021,41(z1):69-74

当前流行的人群计数方法仅利用单张图片作为输入,但是,在很多实际的情况下,需要在视频监控器中部署人群计数任务.在视频中,相邻帧之间的上下文信息可以辅助人群计数.而相比与其他高计算损耗的视频人群计数方法,对视频人群计数提出了一种新的方法叫帧间辅助人群计数(CCIA).该方法以级联卷积神经网络为基本网络模型,仅以相邻帧为输入,通过两阶段的训练实现了帧间关联.具体地,该方法利用空间转移网络获取相邻帧之间空间转移特性,同时添加了通道注意力机制模块以自适应融合相邻帧的特征,并最终获得了出色的性能.在Mall数据集中,结合空间转移网络和通道注意力机制的模型的方法的平均绝对误差(MAE)和均方误差(MSE)为1.71和2.20,相较于区域空间变换网络(LSTN)分别降低了14.50％和12.00％;在FDST数据集中,结合空间转移网络模型的方法的MAE和MSE为2.09和2.75,相较于LSTN分别降低了37.61％和38.20％.实验结果表明,结合空间转移网络和通道注意力机制的模型的方法可以更加准确地估计人群的数量. 相似文献

11.

基于光流残差的视频超分辨率重建算法

下载免费PDF全文

吴昊赖惠成钱绪泽陈豪《计算机工程与应用》2022,58(15):220-228

随着卷积神经网络的发展,视频超分辨率算法取得了显著的成功。因为帧与帧之间的依赖关系比较复杂,所以传统方法缺乏对复杂的依赖关系进行建模的能力,难以对视频超分辨率重建的过程进行精确地运动估计和补偿。因此提出一个基于光流残差的重建网络,在低分辨率空间使用密集残差网络得到相邻视频帧的互补信息,通过金字塔的结构来预测高分辨率视频帧的光流,通过亚像素卷积层将低分辨率的视频帧变成高分辨率视频帧,并将高分辨率的视频帧与预测的高分辨率光流进行运动补偿,将其输入到超分辨率融合网络来得到更好的效果,提出新的损失函数训练网络,能够更好地对网络进行约束。在公开数据集上的实验结果表明,重建效果在峰值信噪比、结构相似度、主观视觉的效果上均有提升。相似文献

12.

用于视频行为识别的高效二维时序建模网络

下载免费PDF全文

栗志磊李俊施智平姜那张永康《计算机工程与应用》2023,59(3):127-134

二维卷积难以对视频数据进行有效的时间信息建模。针对这个问题,提出了一个高效的基于二维卷积的时间建模网络。该网络只需要RGB图像作为输入,避免了复杂的光流计算,在低计算复杂度的前提下,可以在行为识别任务中达到先进的准确性。网络主要由两个部分组成,即运动特征增强模块和时序聚集模块。具体来说,运动特征增强模块主要实现短期时序建模,它利用当前帧与相邻帧的差异信息对当前帧中的运动信息进行自适应性的增强,让网络能够了解图像中的哪一部分将要产生运动。时序聚集模块实现长期的时序建模,主要应用于网络的后期,通过二维卷积对时序上的信息进行信息聚合,让每一帧图像经过网络提取特征后,都能够结合时序上所有帧序列的信息。在三个常见的视频动作识别数据集（UCF101、HMDB51和Something-Something V1）上进行的大量实验表明,与大多数现有方法相比,所提出的时序建模网络可以获得先进的识别性能。相似文献

13.

基于双分支融合的反馈迭代金字塔去模糊和超分辨率算法

王峰蔡立志张娟《计算机应用研究》2021,38(11):3478-3483

针对低分辨率模糊图像实施超分辨率重建后出现大量伪影和边缘纹理不清晰问题,提出了一种双分支融合的反馈迭代金字塔算法.首先采用不同的分支模块分别提取低分辨率模糊图像中潜在的去模糊特征和超分辨率特征信息;然后采用自适应融合机制将两种不同性质的特征进行信息匹配,使网络在去模糊和超分辨率重建模块中更加关注模糊区域;其次使用迭代金字塔重建模块将低分辨率模糊图像渐进重建为逼近真实分布的超分辨率清晰图像;最后重建图像通过分支反馈模块生成清晰低分辨率图像,构建反馈监督.在GOPRO数据集中与现有算法的对比实验结果表明,所提算法能够生成纹理细节更加清晰的超分辨率图像. 相似文献

14.

基于多尺度时域3D卷积的视频超分辨率重建

下载免费PDF全文

唐晓天马骏李峰杨雪梁亮《图学学报》2022,43(1):53-59

视频超分辨率是一项很有实用价值的工作.针对超高清产业中高分辨率资源较为匮乏的问题,为了有效利用视频序列帧间丰富的时间相关性信息及空间信息,提出一种基于多尺度时域3D卷积的视频超分辨率重建算法.该算法将输入的低分辨率视频序列帧分别通过不同时间尺度的3D卷积进行时空特征提取,3D卷积能够同时对空间与时间建模,相较于2D卷积... 相似文献

15.

基于多级时空域3D卷积的换脸视频检测方法

下载免费PDF全文

包晗符皓程曹纭赵险峰汤朋《信息安全学报》2022,7(5):29-38

近年来,视频换脸技术发展迅速。该技术可被用于伪造视频来影响政治行动和获得不当利益,从而给社会带来严重危害,目前已经引起了各国政府和舆论的广泛关注。本文通过分析现有的主流视频换脸生成技术和检测技术,指出当前主流的生成方法在时域和空域中均具有伪造痕迹和生成损失。而当前基于神经网络检测合成人脸视频的算法大部分方法只考虑了空域的单幅图像特征,并且在实际检测中有明显的过拟合问题。针对目前检测方法的不足,本文提出一种高效的基于时空域结合的检测算法。该方法同时对视频换脸生成结果在空域与时域中的伪造痕迹进行捕捉,其中,针对单帧的空域特征设计了全卷积网络模块,该模块采用3D卷积结构,能够精确地提取视频帧阵列中每帧的伪造痕迹;针对帧阵列的时域特征设计了卷积长短时记忆网络模块,该模块能够检测伪造视频帧之间的时序伪造痕迹;最后,根据特征分类设计特征网络金字塔网络结构,该结构能够融合不同尺寸的时空域特征,通过多尺度融合来提高分类效果,并减少过拟合现象。与现有方法相比,该方法在训练中的收敛效果和分类效果方面有明显优势。除此之外,我们在保证检测准确率的前提下采用较少的参数,相比现有结构而言训练效率更高。相似文献

16.

Video Super-Resolution with Frame-Wise Dynamic Fusion and Self-Calibrated Deformable Alignment

Xu Wenjie Song Huihui Jin Yutong Yan Fei 《Neural Processing Letters》2022,54(4):2803-2815

Neural Processing Letters - In video super-resolution, exploiting spatial information of reference frame and temporal information from neighbouring frames is significant but challenging. Since... 相似文献