基于深度学习帧内编码快速划分算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于深度学习帧内编码快速划分算法

引用本文：	曾奥迪,杨静.基于深度学习帧内编码快速划分算法[J].计算机工程与设计,2023(4):1014-1020.

作者姓名：	曾奥迪杨静

作者单位：	上海海事大学信息工程学院

基金项目：	国家自然科学基金项目(61902239)；

摘要：	为降低H.266/VVC(versatile video coding)帧内编码复杂度，提出一种基于纹理分类的卷积注意力机制神经网络CBAM-CNN(convolutional block attention module-convolution neural network)模型的快速帧内编码单元划分方法，替代嵌套多类型四叉树QTMT(quadtree with nested multi-type tree)的遍历搜索。综合考虑每个编码单元CU(codinguint)纹理特征，建立基于阈值的纹理分类模型，判断64×64的编码单元是否划分；设计并训练一种CBAM-CNN网络模型，预测32×32,16×16CU的划分结果。仿真结果表明，所提算法使帧内编码时间平均减少43.217%,编码比特率仅增加0.894%,有效降低了帧内预测的编码复杂度。
关键词：	帧内预测纹理复杂度阈值分类编码块划分嵌套多类型四叉树划分注意力机制编码复杂度