排序方式: 共有64条查询结果,搜索用时 46 毫秒
1.
为在场景图生成网络中获得重要的上下文信息,同时减少数据集偏差对场景图生成性能的影响,构建一种基于外部知识库与适应性推理的场景图生成模型。利用结合外部知识库的目标检测模块引入语言先验知识,提高实体对关系类别检测的准确性。设计基于Transformer架构的上下文信息提取模块,采用两个Transformer编码层对候选框和实体对关系类别进行处理,并利用自注意力机制分阶段实现上下文信息合并,获取重要的全局上下文信息。构建特征特殊融合的适应性推理模块,通过软化分布并根据实体对的视觉外观进行适应性推理关系分类,缓解实体对关系频率的长尾分布问题,提升模型推理能力。在VG数据集上的实验结果表明,与MOTIFS模型相比,该模型在谓词分类、场景图分类和场景图生成子任务上的Top-100召回率分别提升了1.4、4.3、7.1个百分点,对于多数关系类别具有更好的场景图生成效果。 相似文献
3.
针对视频帧中可能出现的大量场景切换,提出一种基于非连接点的场景切换检测算法,提高编码性能,该场景检测算法复杂度低,在运动估计的同时,完成视频场景切换检测。场景切换将导致GOP(group of pictures)长度的变化,并可能出现GOP长度太短的情况。提出改进的自适应GOP时域滤波技术,避免由于GOP太短引起的编码性能下降。针对视频场景切换检测分割出的不同长度的GOP,提出一种基于率失真模型的帧间码率控制算法,利用视频的失真与码率及视频帧复杂度的关系,对帧间码率分配进行优化,提高重构视频帧的总质量。实验结果表明,基于场景检测的自适应帧间码率控制算法能够获得较好的编码性能。 相似文献
5.
目的 通过深度学习卷积神经网络进行3维目标检测的方法已取得巨大进展,但卷积神经网络提取的特征既缺乏不同区域特征的依赖关系,也缺乏不同通道特征的依赖关系,同时难以保证在无损空间分辨率的情况下扩大感受野。针对以上不足,提出了一种结合混合域注意力与空洞卷积的3维目标检测方法。方法 在输入层融入空间域注意力机制,变换输入信息的空间位置,保留需重点关注的区域特征;在网络中融入通道域注意力机制,提取特征的通道权重,获取关键通道特征;通过融合空间域与通道域注意力机制,对特征进行混合空间与通道的混合注意。在特征提取器的输出层融入结合空洞卷积与通道注意力机制的网络层,在不损失空间分辨率的情况下扩大感受野,根据不同感受野提取特征的通道权重后进行融合,得到全局感受野的关键通道特征;引入特征金字塔结构构建特征提取器,提取高分辨率的特征图,大幅提升网络的检测性能。运用基于二阶段的区域生成网络,回归定位更准确的3维目标框。结果 KITTI(A project of Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago)数据集中的实验结果表明,在物体被遮挡的程度由轻到高时,对测试集中的car类别,3维目标检测框的平均精度AP3D值分别为83.45%、74.29%、67.92%,鸟瞰视角2维目标检测框的平均精度APBEV值分别为89.61%、87.05%、79.69%; 对pedestrian和cyclist 类别,AP3D和APBEV值同样比其他方法的检测结果有一定优势。结论 本文提出的3维目标检测网络,一定程度上解决了3维检测任务中卷积神经网络提取的特征缺乏视觉注意力的问题,从而使3维目标检测更有效地运用于室外自动驾驶。 相似文献
6.
7.
介绍采用转炉、LF炉精炼、小方坯连铸机、高速线材轧机生产工艺试制ML08A1冷镦钢的过程。通过控制化学成分、LF炉精炼、全过程保护浇注和控制冷却等工艺措施,使盘条的化学成分稳定,冷顶锻性能优良。 相似文献
8.
腹部动脉血管分割对于胃癌淋巴结的转移和肝动脉变异类型的判断至关重要。针对腹部动脉血管分割精度低、易断裂等问题,提出一种改进卷积网络架构的腹部动脉分割方法。卷积网络的编码部分使用带有卷积注意的预训练模块(resnet34),避免了梯度消失且可更好地获取图像的特征信息。为了扩大感受野和聚集多尺度特征信息,提出了一种新的多尺度特征融合模块。此外,动脉血管的边缘结构信息的学习至关重要,引入注意力导向滤波作为信息扩展路径,使输出特征更加结构化,提升血管分割的精度。所提方法在腹部动脉血管分割的实验结果表明,与基础网络U-Net相比,所提方法在灵敏度和交并比上分别提升了2.84%和1.19%。与CE-Net网络相比,在灵敏度和交并比上分别提升了1.34%和161%。 相似文献
9.
10.
通过分析宜洛煤田白杨-高山区滑体规模及形成原因,确定滑体下找煤原则、依据,对寻找煤炭基地、开发煤炭资源具有一定的现实意义. 相似文献