排序方式: 共有52条查询结果,搜索用时 0 毫秒
51.
图书定位是实现图书馆智能化发展的重要技术之一,精确的书脊分割算法成为实现该目标的一大难题。基于以上情况,提出改进DeepLabv3+网络的图书书脊分割算法,以解决图书密集排列、图书存在倾斜角度和书脊纹理极相似等情况下的书脊分割难点。首先,为了提取图书图像更密集的金字塔特征,将原始DeepLabv3+网络中的空洞金字塔池化(ASPP)替换为多空洞率、多尺度的DenseASPP (Dense Atrous Spatial Pyramid Pooling)模块;其次,针对原始DeepLabv3+网络对大长宽比的目标对象分割边界不敏感的问题,在DenseASPP模块的支路加入条形池化(SP)模块以增强书脊的长条形特征;最后,参考ViT (Vision Transformer)中的多头自注意(MHSA)机制,提出一种全局信息增强的自注意模块,以增强网络获取长距离特征的能力。将所提算法在开源数据库上进行对比测试,实验结果表明,与原始DeepLabv3+网络分割算法相比,所提算法在近竖直书脊数据库上的平均交并比(MIoU)提升了1.8个百分点;在倾斜书脊数据库上的MIoU提升了4.1个百分点,达到了... 相似文献
52.
近年来基于RGB视频的双人交互行为识别取得了重大进展,但RGB视频数据的问题严重影响双人交互行为识别率。随着深度传感器(如微软Kinect)的快速发展,为准确获取人体运动的关节点数据提供了可能,可以大大的弥补RGB视频数据的不足。提出一种基于关节点数据的双人交互行为识别方法。首先对关节点数据计算出HOJ3D特征和关节距离特征,并将特征按照时间顺序进行图形化后分别送入的卷积神经网络中,分别提取两种深层次特征并进行拼接,然后使用Softmax分类器进行分类识别。该方法在SBU Kinect动作数据集的测试结果表明,该方法的识别准确率得到了一定的提高,达到了94.4%。该方法实现简单,且具有实时处理的能力,具有较好的应用前景。 相似文献