共查询到18条相似文献,搜索用时 187 毫秒
1.
语义通信作为一种面向多智能体交互的新型通信范式,对未来通信实现高效传输提供了新的解决方法。由此,提出了一个AI辅助的可扩展视频语义通信系统。该系统能够基于现有的信源信道分离编码方案(如传统的高效视频编码HEVC与低密度奇偶校验编码LDPC),与AI辅助的可学习语义编解码器相结合,实现视频流与语义流的共同传输。其中可学习的语义数据流是视频帧中针对特定任务提取的语义信息,能够较好地提升接收端精确重建与下游任务的性能。实验证明,该视频语义通信框架相较于传统通信,在重建任务性能相差无几的情况下具有更好的下游任务表现;而相较于现有的端到端的基于深度学习的语义通信系统,性能相近的同时能够基于多种传统视频编解码标准进行扩展设计,具有与传统压缩方案更强的耦合性与适应更多场景的能力。 相似文献
2.
3.
4.
为促进对新闻视频的结构化传播,提出基于语义特征的新闻视频自适应拆条算法.该算法对视频流上场景语义划分,搭建了一种基于场景分类任务的深度神经网络模型NewslicNet,深度挖掘新闻内容条目的非结构化特征提取新闻内容的拆分点,完成新闻内容段拆条工作.该算法在1538分钟23秒的新闻联播视频上进行训练与测试,实验结果表明,验证了拆条算法的性能优越性和模型的可行性. 相似文献
5.
6.
7.
随着数字视频水印技术被广泛应用于视频信息的版权保护,提出一种基于H.264码流的数字视频水印方案.根据经典算法 H&G 算法的部分解码的思想,通过纹理复杂度参数和帧内预测方向在每个宏块中选择合适的4×4块,并根据DCT系数特点,选择4×4块的一个中频系数来嵌入水印.结合常用的内置式水印的嵌入方法,通过调制 DCT 系数的一个中频系数的奇偶性关系,完成水印在 I 帧的嵌入.通过对标准视频序列的测试,证明了该算法在H.264标准上的可行性. 相似文献
8.
提出一种基于FFMPEG系统的MPEG-2视频水印算法,解决了视频水印中不可避免的视频编解码问题。将水印图像和水印属性转成二进制比特流,作为嵌入视频的水印信息,提取时不需预知水印的尺寸信息就能恢复。同时在每个嵌入帧的起始部位嵌入标志序列,识别已嵌入水印的帧提取水印,而无需重新进入编码过程。实验结果表明,这种方案实现便捷,省时高效,且具有较好的不可见性和鲁棒性。 相似文献
9.
场景图生成是计算机视觉领域中的热点研究方向,可连接上、下游视觉任务。场景图由形式为<主语-谓语-宾语>的三元组组成,模型需要对整幅图像的全局视觉信息进行编码,从而辅助场景理解。但目前模型在处理一对多、多对一和对称性等特殊的视觉关系时仍存在问题。基于知识图谱与场景图的相似性,我们将知识图谱中的转换嵌入模型迁移至场景图生成领域。为了更好地对此类视觉关系进行编码,本文提出了一种基于多模态特征转换嵌入的场景图生成框架,可对提取的视觉和语言等多模态特征进行重映射,最后使用重映射的特征进行谓语类别预测,从而在不明显增加模型复杂度的前提下构建更好的关系表示。该框架囊括并补充了现存的几乎所有转换嵌入模型的场景图实现,将四种转换嵌入模型(TransE、TransH、TransR、TransD)分别应用于场景图生成任务,同时详细阐述了不同的视觉关系类型适用的模型种类。本文所提框架扩展了传统应用方式,除独立模型之外,本文设计了新的应用方式,即作为即插即用的子模块插入到其他网络模型。本文利用大规模语义理解的视觉基因组数据集进行实验,实验结果充分验证了所提框架的有效性,同时,得到的更丰富的类别预测结... 相似文献
10.
视频帧类型决策是影响视频编码效率的关键因素之一。为提升x265视频编码器的编码性能,该文提出基于局部亮度直方图的自适应视频帧类型决策算法。首先,在64×64大小的编码树单元(CTU)级别上统计各帧局部亮度直方图,用帧间局部亮度直方图差异表征帧间场景变换程度;其次,引入帧内编码帧(I帧)检测窗,在检测窗内通过比较帧间场景变换程度自适应确定I帧;最后,根据帧间场景变换程度与迷你图像组(MiniGOP)大小之间的相关性确定MiniGOP大小,从而自适应确定普通P和B帧(GPB帧)及双向预测编码帧(B帧)。实验结果表明,与x265标准中的相关算法相比,所提算法能够有效降低x265的编码复杂度,可在减少近5%编码时间的前提下,实现视频I帧、GPB帧和B帧的高效自适应决策。 相似文献
11.
Swanson M.D. Bin Zhu Tewfik A.H. 《Selected Areas in Communications, IEEE Journal on》1998,16(4):540-550
We present a watermarking procedure to embed copyright protection into digital video. Our watermarking procedure is scene-based and video dependent. It directly exploits spatial masking, frequency masking, and temporal properties to embed an invisible and robust watermark. The watermark consists of static and dynamic temporal components that are generated from a temporal wavelet transform of the video scenes. The resulting wavelet coefficient frames are modified by a perceptually shaped pseudorandom sequence representing the author. The noise-like watermark is statistically undetectable to thwart unauthorized removal. Furthermore, the author representation resolves the deadlock problem. The multiresolution watermark may be detected on single frames without knowledge of the location of the frames in the video scene. We demonstrate the robustness of the watermarking procedure to several video degradations and distortions 相似文献
12.
Emad E. Abdallah A. Ben Hamza Prabir Bhattacharya 《Signal, Image and Video Processing》2010,4(2):233-245
We present a robust, hybrid non-blind MPEG video watermarking technique based on a high-order tensor singular value decomposition
and the discrete wavelet transform (DWT). The core idea behind our proposed technique is to use the scene change analysis
to embed the watermark repeatedly into the singular values of high-order tensors computed form the DWT coefficients of selected
frames of each scene. Experimental results on video sequences are presented to illustrate the effectiveness of the proposed
approach in terms of perceptual invisibility and robustness against attacks. 相似文献
13.
14.
Multimedia content analysis-using both audio and visual clues 总被引:1,自引:0,他引:1
Yao Wang Zhu Liu Jin-Cheng Huang 《Signal Processing Magazine, IEEE》2000,17(6):12-36
15.
16.
17.
18.
WANGFeng-bi HUANGJun-cai WANGBin SHEKun ZHOUMing-tian 《中国电子科技》2005,3(2):120-122,160
A novel technique for the video watermarking based on the discrete wavelet transform(DWT) is present. The intra frames of video are transformed to three gray image firstly, and then the 2th-level discrete wavelet decomposition of the gray images is computed, with which the watermark W is embedded simultaneously into and invert wavelet transform is done to obtain the gray images which contain the secret information. Change the intra frames of video based on the three gray images to make the intra frame contain the secret information. While extracting the secret information, the intra frames are transformed to three gray image, 2th-level discrete wavelet transform is done to the gray images, and the watermark W‘ is distilled from the wavelet coefficients of the three gray images. The test results show the superior performance of the technique and potential for the watermarking of video. 相似文献