期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《电子技术与软件工程》2016,(18)

对远程视频监控图像进行自动标注,实现视频监控中关键帧识别,提高视频信息的分析鉴别能力。提出一种基于远程视频监控图像多尺度关键帧提取的自动标注优化方法,首先构建视频图像的采集模型,然后对采集的图像进行小波降噪处理,对输出的降噪图像通过多尺度关键帧提取进行自动标注,实现图像特征提取和信息识别。仿真结果表明,采用该方法进行远程视频监控图像自动标注,提高了对图像信息的检测识别能力,图像的输出峰值信噪比较高,准确识别概率提高。相似文献

2.

基于OpenCV的运动目标识别算法与实现 总被引：3，自引：0，他引：3

张晓宇彭四伟《现代电子技术》2009,32(22):99-101

介绍一种结合背景差分法和瞬时差分法的在视频序列中识别运动目标算法。该算法利用瞬时差分法得到当前帧中运动目标的轮廓信息,在更新背景模型时不更新运动目标轮廓内区域,避免了由运动目标引起的背景模型更新误差。给出用OpenCV实现算法的具体过程和关键代码。实验结果表明,该方法可以实现视频序列中运动目标的识别,具有实时性,并能得到较好的识别结果。相似文献

3.

基于异构多流网络的多模态人体动作识别

下载免费PDF全文

刘强张文英陈恩庆《信号处理》2020,36(9):1422-1428

人体动作识别在人机交互、视频内容检索等领域有众多应用,是多媒体信息处理的重要研究方向。现有的大多数基于双流网络进行动作识别的方法都是在双流上使用相同的卷积网络去处理RGB与光流数据,缺乏对多模态信息的利用,容易造成网络冗余和相似性动作误判问题。近年来,深度视频也越来越多地用于动作识别,但是大多数方法只关注了深度视频中动作的空间信息,没有利用时间信息。为了解决这些问题,本文提出一种基于异构多流网络的多模态动作识别方法。该方法首先从深度视频中获取动作的时间特征表示,即深度光流数据,然后选择合适的异构网络来进行动作的时空特征提取与分类,最后对RGB数据、RGB中提取的光流、深度视频和深度光流识别结果进行多模态融合。通过在国际通用的大型动作识别数据集NTU RGB+D上进行的实验表明,所提方法的识别性能要优于现有较先进方法的性能。相似文献

4.

基于全局双线性注意力的红外视频行为识别

欧阳楠楠况立群谢剑斌韩慧妍曹亚明王飞《激光与红外》2024,54(3):431-439

针对红外视频缺少纹理细节特征以致在人体行为识别中难以兼顾计算复杂度与识别准确率的问题,提出一种基于全局双线性注意力的红外视频行为识别方法。为高效计算红外视频中的人体行为,设计基于两级检测网络的关节点提取模块来获得人体关节点信息,创新性地将所形成的关节点三维热图作为红外视频人体行为识别网络的输入特征;为了在轻量化计算的基础上进一步提升识别准确率,提出一种全局双线性注意力的三维卷积网络,从空间和通道两个维度提升注意力的建模能力,捕获全局结构信息。在InfAR和IITR IAR数据集上的实验结果表明,该方法在红外视频行为识别中的有效性。相似文献

5.

基于关键姿势的动作识别

刘博安建成《电视技术》2014,38(5):38-41

人体动作识别是计算机视频和图像方面的一个热点问题,为了解决识别率不高、识别速度不快、不能实时识别,以及不同的人摆出相同动作时出现的识别误差,提出了一种能有效解决该问题的方法,该方法分析计算匹配视频帧序列,然后分类匹配后的视频帧,达到识别的目的。相似文献

6.

基于深度学习的视频中人体动作识别进展综述 总被引：4，自引：0，他引：4

下载免费PDF全文

罗会兰童康孔繁胜《电子学报》2019,47(5):1162-1173

视频中的人体动作识别是计算机视觉领域内一个充满挑战的课题.不论是在视频信息检索、日常生活安全、公共视频监控,还是人机交互、科学认知等领域都有广泛的应用.本文首先简单介绍了动作识别的研究背景、意义及其难点,接着从模型输入信号的类型和数量、是否结合了传统特征提取方法、模型预训练三个维度详细综述了基于深度学习的动作识别方法,及比较分析了它们在UCF101和HMDB51这两个数据集上的识别效果.最后分别从视频预处理、视频中人体运动信息表征、模型学习训练这三个角度对未来动作识别可能的发展方向进行了论述. 相似文献

7.

不良视频特征提取与重复检测技术探讨

陈志国姚瑞虹张奇《广播与电视技术》2014,(4)

针对互联网出现的大量不良视频信息,目前已有很多学者利用计算机视觉和图像理解技术进行识别和过滤。本文通过不良视频识别与特征提取、建立视频索引、视频重复检测这一技术路线,提供了一种互联网不良视频过滤的方法。相似文献

8.

基于多视角融合稀疏表示的恐怖视频识别

下载免费PDF全文

丁昕苗李兵胡卫明郭文王振中《电子学报》2014,42(2):301-305

现有的基于多示例学习的恐怖视频识别算法都是假设示例间是相互独立的,而忽略了恐怖视频中存在的上下文信息和示例包的统计特性.因此,本文提出了一种多视角融合稀疏表示模型.该模型分别从集合视角、上下文视角以及统计特性视角三个不同的视角来看待一个视频片段,并利用联合稀疏表示框架将三个不同视角融合到一个分类框架中,用来进行恐怖视频的识别.在恐怖视频库上的实验结果验证了算法在恐怖视频识别中比现有的其它算法有更好的性能和稳定性. 相似文献

9.

4K图像载荷标识符详解和应用

梁彦《西部广播电视》2023,(1):231-233+237

图像载荷标识符是广电专业视频制作传输领域的关键标识，不管是基带信号还是IP信号链路上的各种设备都要通过载荷标识符来识别数字视频信号中传输的视频内容。鉴于广电行业中很多产品存在载荷标识符标识不规范的情况，本文对图像载荷标识符在视频传输中的产生、放置位置进行详细的介绍，然后针对目前将要成为主流应用的4K图像传输接口4×3G、12G等情况作了重点说明和实际测量，为广电工程技术人员提供直观、方便的技术查阅资料。相似文献

10.

基于多特征融合的运动对象识别算法 总被引：1，自引：0，他引：1

唐峰蒋兴浩孙锬锋陆欢《信息安全与通信保密》2012,(3):57-58

为提高视频检索的准确率,提出了一种基于多特征融合的视频运动对象识别算法。该算法首先使用基于背景帧构造及关键帧截取的方法提取视频中的运动对象的区域;然后分别提取运动对象的局部特征SURF描述子和全局特征如颜色直方图、边缘直方图等,并使两者融合为统一的特征向量;最后使用支持向量机对特征进行学习和识别,用以识别视频对象。实验证明该算法有效地提高了视频中运动对象识别的准确率。相似文献

11.

基才时间信息的快速检索方法探究

朱耀麟李倩《电子设计工程》2013,(22):185-187

本文研究了利用时间信息实现快速检索视频文件的方法,视频文件的压缩编码标准采用的是H．264,该方法主要包括视频分析和视频检索两个部分的研究。在视频分析部分,对码流中的IDR帧（关键帧）进行抓取和获得其时间、位置、大小等信息。并将得到的时间等信息存入至数据库。该部分的重点是时间信息的获取,由于负责传输码流的RTP数据分组的时间戳记录了码流的时间信息,所以着重描述了获取并且记录RTP时间戳的过程。视频检索部分,利用时间等查询条件从数据库中进行视频检索。对所述方法进行研究。结果表明使用该方法能够快速查看某时刻视频内容．避免了检索视频时的重复处理。相似文献

12.

Video indexing based on mosaic representations 总被引：13，自引：0，他引：13

Irani M. Anandan P. 《Proceedings of the IEEE. Institute of Electrical and Electronics Engineers》1998,86(5):905-921

Video is a rich source of information. It provides visual information about scenes. This information is implicitly buried inside the raw video data, however, and is provided with the cost of very high temporal redundancy. While the standard sequential form of video storage is adequate for viewing in a movie mode, it fails to support rapid access to information of interest that is required in many of the emerging applications of video. This paper presents an approach for efficient access, use and manipulation of video data. The video data are first transformed from their sequential and redundant frame-based representation, in which the information about the scene is distributed over many frames, to an explicit and compact scene-based representation, to which each frame can be directly related. This compact reorganization of the video data supports nonlinear browsing and efficient indexing to provide rapid access directly to information of interest. This paper describes a new set of methods for indexing into the video sequence based on the scene-based representation. These indexing methods are based on geometric and dynamic information contained in the video. These methods complement the more traditional content-based indexing methods, which utilize image appearance information (namely, color and texture properties) but are considerably simpler to achieve and are highly computationally efficient 相似文献

13.

Video summarisation: A conceptual framework and survey of the state of the art

《Journal of Visual Communication and Image Representation》2008,19(2):121-143

相似文献

14.

基于多视点视频特征的3D-HEVC深度视频信息隐藏算法

左力文骆挺蒋刚毅郁梅高巍《光电子．激光》2018,29(5):530-538

为了更安全地传输秘密信息和保护3D视频,提出基于多视点视频特征的3D-HEVC深度视频信息隐藏算法。首先结合彩色视频的纹理特征,考虑深度视频不同区域对绘制视点的质量和编码效率的影响,对深度视频进行区域分割。然后针对不同的区域,采用不同的方式调制最大编码单元(LCU) 的QP值嵌入秘密信息。最后,用修改后的QP值进行编码压缩,传输视频信息。实验仿真结果表明,相比于原始HTM13.0, 本算法编码重建深度视频绘制视点质量的PSNR平均下降0.0015dB, 码率平均增加0.035%。本文算法能较好地保证绘制视点的质量,对视频流的码率影响较小,且能实现秘密信息的盲提取。相似文献

15.

基于视觉效应的视频信息电磁泄漏抑制方法研究

下载免费PDF全文

王森邱扬田锦许清琳《电子学报》2017,45(8):2038

计算机的电磁辐射会包含视频信息从而造成的信息泄漏,本文在随机置乱的基础上,根据人眼视觉效应提出了互补置乱的方法来抑制视频信息通过电磁辐射的泄漏.通过对相邻的每帧视频信息进行加减随机噪声,使得人眼视觉观察效果抵消掉噪声对视频图像的干扰,在叠加噪声的同时,保证了视频图像的清晰度,同样也达到了抑制视频信息电磁泄漏的功能.最后也通过实际截获实验,验证了该方法的可行性. 相似文献

16.

基于运动变化信息熵的视频序列时域亚采样技术

石荣李晓峰傅志中李在铭《信号处理》2003,19(4):312-315

视频序列的时域亚采样对于低比特率信道上的视频传输和存储空间受限条件下的视频存储具有十分重要的意义。目前普遍采用的时域等间隔亚采样方法有时会造成视频序列中重要的运动变化信息的丢失。针对这一情况,本文提出了基于运动变化信息熵的视频序列时域亚采样技术,通过帧间运动场分析,利用运动场总体能量和运动补偿后的残差能量综合描述视频序列的运动变化信息,并根据信息熵最大化准则确定各个时域亚采样时刻点。大量的对比实验证明该方法明显优于时域等间隔亚采样方法,它较完整地反映了序列图像的运动变化过程,更有利于对视频内容的理解。相似文献

17.

Compressed video processing for cut detection 总被引：4，自引：0，他引：4

Patel N.V. Sethi I.K. 《Vision, Image and Signal Processing, IEE Proceedings -》1996,143(5):315-323

One of the challenging problems in video databases is the organisation of video information. Segmenting a video into a number of clips and characterising each clip has been suggested as one mechanism for organising video information. This approach requires a suitable method to automatically locate cut points (boundaries between consecutive camera shots in a video). Several existing techniques solve this problem using uncompressed video. Since video is increasingly being captured, moved, and stored in compressed form, there is a need for detecting shot boundaries directly in compressed video. The authors address this issue and show certain feature extraction steps in MPEG compressed video that allow the implementation of most of the existing cut detection methods developed for uncompressed video for MPEG video stream. They also examine the performance of three tests for cut detection by viewing the problem of cut detection as a statistical hypothesis testing problem. As the experimental results indicate, the statistical hypothesis testing approach permits fast and accurate detection of video cuts 相似文献

18.

基于混沌序列的视频保密通信

陈春光《电视技术》2014,38(23)

随着网络和多媒体技术的快速发展,信息安全技术成为了人们关注的一个热点课题。图像视频信息保密通信是混沌应用的一个新领域,混沌加密在计算机网络和视频通信方面的应用为解决信息安全问题开辟了一种新的途径。根据一个离散时间混沌序列,运用驱动—响应式同步方法对视频数据进行实时加密和解密,最后通过Wi Fi网络传输实现了无线混沌视频保密通信。相似文献

19.

超混沌视频加密系统的FPGA设计与实现

刘鹏齐国元万彰凯胡玉庆《电讯技术》2018,58(10)

随着多媒体技术的不断发展,视频信息安全愈发受到人们的关注。为解决视频信息的安全问题,提出了一种基于现场可编程门阵列(FPGA)技术的超混沌视频加密方法。在加密过程中,一方面FPGA控制数字摄像头实现实时彩色视频信息的采集;另一方面,在计算机密钥指令下,利用FPGA使超混沌系统产生有效的伪随机序列,实现对所采集视频信息的数据和地址的双重超混沌加密。给出了具体的超混沌视频加密算法和设计流程以及FPGA实现结果。安全性分析表明,明密文主观视觉对比显著不同,密钥空间大,视频图像统计特性的相关性弱,说明基于FPGA的超混沌视频加密系统加密效果良好可靠。相似文献

20.

Combining scene model and fusion for night video enhancement

Jing Li Tao Yang Quan Pan Yongmei Cheng 《电子科学学刊(英文版)》2009,26(1):88-93

This paper presents a video context enhancement method for night surveillance. The basic idea is to extract and fuse the meaningful information of video sequence captured from a fixed camera under different illuminations. A unique characteristic of the algorithm is to separate the image context into two classes and estimate them in different ways. One class contains basic surrounding scene information and scene model, which is obtained via background modeling and object tracking in daytime video sequence. The other class is extracted from nighttime video, including frequently moving region, high illumination region and high gradient region. The scene model and pixel-wise difference method are used to segment the three regions. A shift-invariant discrete wavelet based image fusion technique is used to integral all those context information in the final result. Experiment results demonstrate that the proposed approach can provide much more details and meaningful information for nighttime video. 相似文献