期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

免费	1篇
国内免费	1篇

专业分类

自动化技术

2篇

出版年

2023年	1篇
2022年	1篇

排序方式： 共有2条查询结果，搜索用时 0 毫秒

基于访问控制模块与原始信息注入的图像描述

李阳路静郝宇钦韦学艳吴春雷《计算机系统应用》2022,31(7):106-112

近年来在图像描述领域对于应用场景图生成描述的研究越来越广泛. 然而, 当前基于场景图的图像描述模型并未考虑到长短期记忆神经网络(LSTM)对于先前输入的细节信息的保留, 这可能会导致细节信息的丢失. 针对这个问题, 本文提出基于原始信息注入的图像描述网络, 该网络对基线模型中语言LSTM的输入变量做了改进, 目的是尽可能多地保留原始输入信息, 减少输入信息在计算过程中的损失. 另外, 本文还认为当前的场景图更新机制中存在结点更新程度过大的问题, 因此本文设计了一个访问控制模块更新已访问过的结点权重, 避免引起结点信息丢失的问题. 同时, 本文设计一个图更新系数(GUF)来指导图更新, 以确定更新程度的大小. 本文在官方数据集MSCOCO上进行了实验, 各种评估机制的实验结果表明, 基于访问控制模块与原始信息注入的图像描述模型与基线模型对比, 取得了更有竞争力的结果, 表现出明显的优越性. 相似文献

基于多层级上下文投票的三维密集字幕

下载免费PDF全文

吴春雷郝宇钦李阳《计算机系统应用》2023,32(3):291-299

传统的三维密集字幕方法存在未充分考虑上下文信息、点云特征信息丢失以及隐藏状态信息量单一等问题.为了应对这些挑战,提出了多层级上下文投票网络,该网络在投票过程中使用自注意力机制捕获点云的上下文信息并加以多层级利用,提升检测对象的准确率.同时,还设计了隐藏状态-注意力时序融合模块,将当前时刻隐藏状态融合与前一时刻注意力结果融合,丰富隐藏状态信息量,从而提高模型表达能力.除此之外,采用“两阶段”训练方法,有效过滤掉生成的低质量对象提案,增强描述效果.在官方数据集ScanNet和ScanRefer上的大量实验表明,该方法与基线方法相比取得了更有竞争力的结果. 相似文献