首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度学习帧内编码快速划分算法
引用本文:曾奥迪,杨静.基于深度学习帧内编码快速划分算法[J].计算机工程与设计,2023(4):1014-1020.
作者姓名:曾奥迪  杨静
作者单位:上海海事大学信息工程学院
基金项目:国家自然科学基金项目(61902239);
摘    要:为降低H.266/VVC(versatile video coding)帧内编码复杂度,提出一种基于纹理分类的卷积注意力机制神经网络CBAM-CNN(convolutional block attention module-convolution neural network)模型的快速帧内编码单元划分方法,替代嵌套多类型四叉树QTMT(quadtree with nested multi-type tree)的遍历搜索。综合考虑每个编码单元CU(codinguint)纹理特征,建立基于阈值的纹理分类模型,判断64×64的编码单元是否划分;设计并训练一种CBAM-CNN网络模型,预测32×32,16×16CU的划分结果。仿真结果表明,所提算法使帧内编码时间平均减少43.217%,编码比特率仅增加0.894%,有效降低了帧内预测的编码复杂度。

关 键 词:帧内预测  纹理复杂度  阈值分类  编码块划分  嵌套多类型四叉树划分  注意力机制  编码复杂度
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号