改进DeepLabv3+网络的图书书脊分割算法 |
| |
引用本文: | 姬晓飞,张可心,唐李荣.改进DeepLabv3+网络的图书书脊分割算法[J].计算机应用,2023(12):3927-3932. |
| |
作者姓名: | 姬晓飞 张可心 唐李荣 |
| |
作者单位: | 沈阳航空航天大学自动化学院 |
| |
基金项目: | 辽宁省教育厅重点攻关项目(LJKZZ20220033)~~; |
| |
摘 要: | 图书定位是实现图书馆智能化发展的重要技术之一,精确的书脊分割算法成为实现该目标的一大难题。基于以上情况,提出改进DeepLabv3+网络的图书书脊分割算法,以解决图书密集排列、图书存在倾斜角度和书脊纹理极相似等情况下的书脊分割难点。首先,为了提取图书图像更密集的金字塔特征,将原始DeepLabv3+网络中的空洞金字塔池化(ASPP)替换为多空洞率、多尺度的DenseASPP (Dense Atrous Spatial Pyramid Pooling)模块;其次,针对原始DeepLabv3+网络对大长宽比的目标对象分割边界不敏感的问题,在DenseASPP模块的支路加入条形池化(SP)模块以增强书脊的长条形特征;最后,参考ViT (Vision Transformer)中的多头自注意(MHSA)机制,提出一种全局信息增强的自注意模块,以增强网络获取长距离特征的能力。将所提算法在开源数据库上进行对比测试,实验结果表明,与原始DeepLabv3+网络分割算法相比,所提算法在近竖直书脊数据库上的平均交并比(MIoU)提升了1.8个百分点;在倾斜书脊数据库上的MIoU提升了4.1个百分点,达到了...
|
关 键 词: | 书脊分割 智能图书馆 DeepLabv3+网络 DenseASPP 自注意机制 |
|
|