期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘旭伦马时平何林远王晨贺旭陈哲《激光与光电子学进展》2022,(22):345-352

针对遥感图像中目标尺度差异较大和方向分布随机等导致检测精度较低的问题,提出一种基于稀疏掩模Transformer的遥感目标检测方法。该方法以Transformer网络为基础,首先引入角度参量,使其适应遥感目标的旋转特性;其次在特征提取部分以多层级特征金字塔为输入,以应对遥感图像目标尺寸变化大的特点,提高对不同尺度目标的检测效果,尤其对小目标的检测效果提升明显;最后以稀疏-插值注意力模块代替自注意力模块,有效缓解了Transformer网络检测高分辨遥感图像时计算量大的缺陷,并且加快了网络的收敛速度。在大型遥感数据集DOTA上的实验结果表明,所提方法的平均检测精度为78.43%,检测速度为12.5 frame/s,与基准方法相比,平均精度均值（mAP）提高了3.07个百分点,证明了所提方法的有效性。相似文献

2.

基于DETR和改进去噪训练的光学遥感图像多尺度旋转目标检测（特邀）

金睿蛟王堃刘敏豪腾锡超李璋于起峰《激光与光电子学进展》2024,(2):356-366

旋转目标检测是遥感图像解译的重要任务之一,存在目标方向任意、小目标密集排列、目标表示引起的角度周期性等典型问题。针对上述问题,提出一种基于DEtection Transformer(DETR)目标检测器和改进去噪训练的旋转目标检测方法,即arbitrary-oriented object detection Transformer with improved deNoising anchor boxes(AO2DINO)。首先,该方法引入一种多尺度旋转可变形注意力模块,将角度信息以旋转矩阵的形式引入注意力权重的计算,提高了模型对旋转目标的适应能力。其次,针对小目标密集排列问题,提出一种自适应的样本分配器,引入旋转交并比和自适应阈值,实现对密集目标更加精确的采样,提升了模型对小目标的检测能力。最后,在模型中引入基于卡尔曼滤波的交并比（KFIoU）作为回归损失,以解决旋转目标表示引起的角度周期性问题。AO2DINO在DOTAv1.0和DIOR-R两个公开数据集上与典型的旋转目标检测方法进行了比较,在DETR系列旋转目标检测方法中检测精度最高,且训练时收敛速度更快,在训练12个epochs时... 相似文献

3.

结合视觉Transformer和CNN的道路裂缝检测方法

代少升刘科生余自安《半导体光电》2024,45(2):252-260

提出了一种结合视觉Transformer和CNN的道路裂缝检测方法。利用CNN来捕获局部的细节信息,同时利用视觉Transformer来捕获全局特征。通过设计的Fusion特征融合模块将两者提取的特征有机地结合在一起,从而解决了单独使用CNN或视觉Transformer方法存在的局限。最终将结果传递至交互式解码器,生成道路裂缝的检测结果。实验结果表明,无论是在公开的数据集上还是在自建的数据集上,相较于单独使用CNN或视觉Transformer的方法,所提出的方法在道路裂缝检测任务中有更好的效果。相似文献

4.

基于多层级自注意力增强的遥感目标检测

魏谢根曹林田澍杜康宁宋沛然郭亚男《激光与光电子学进展》2023,(20):216-226

随着遥感图像分辨率的不断提高，遥感图像目标检测技术获得了更广泛的关注。针对遥感图像中背景复杂噪声多、目标方向任意且目标尺寸变化大等问题，提出一种基于多层级局部自注意力增强的遥感目标检测算法。首先，在Oriented R-CNN骨干网络中引入Swin Transformer特征提取模块，使用具有移位窗口操作和层次设计的Transformer模块对特征提取的语义信息进行多层级局部信息建模。其次，使用Oriented RPN生成高质量的有向候选框。最后，将高斯分布之间的Kullback-Leibler divergence(KLD)作为回归损失函数，使得参数梯度能够根据对象的特征得到动态调整，更加准确地进行检测框的回归。所提算法在DOTA数据集和HRSC2016数据集上的平均精度均值（mAP）分别达77.2%和90.6%，和Oriented R-CNN算法相比，mAP分别提高了1.8个百分点和0.5个百分点。实验结果表明，所提算法能够有效地提高遥感图像目标检测精度。相似文献

5.

基于改进YOLOv5的坦克目标检测算法

梅礼坤陈智利牛恒《激光杂志》2024,(1):92-98

坦克目标的准确识别定位是信息化战争中一项重要研究,针对传统检测算法抗干扰性差、难应用于大视野复杂环境下的问题,提出了一种基于改进YOLOv5坦克自动识别的检测算法。利用YOLOv5模型对大视野复杂战场环境下坦克目标进行识别：在YOLOv5基础模型中引入Attention-based information fusion模块,提高模型检测精度和识别能力;使用Pre-segment multi-scale fusion模块解决骨干网络中池化操作所造成的信息丢失问题;使用Swin Transformer机制降低小目标坦克漏检误检的问题。在坦克数据集上进行实验,结果表明：与YOLOv5原始模型相比,改进模型的召回率、平均精度分别提高了9.1%、5.1%。改进后的YOLOv5模型可以很好地对大视野复杂环境下坦克目标进行精确识别,改善了坦克目标检测中小目标漏检的问题。相似文献

6.

基于Transformer的道路场景点云分类与分割方法

下载免费PDF全文

马庆禄孙枭黄筱潇王江华《激光与红外》2024,54(1):17-23

针对多目标识别过程中点云分类和分割精度不高的问题,提出了一种基于改进Transformer模型的点云分类与分割方法DRPT(Double randomness Point Transformer),该方法在Transformer模型卷积投影层创建新的点嵌入,利用局部邻域的动态处理在数据特征向量中持续增加全局特征属性,从而提高多目标识别中点云分类和分割的精度。实验中采用了标准基准数据集(ModelNet40、ShapeNet部分分割和SemanticKITTI场景语义分割数据集)以验证模型的性能,实验结果表明:DRPT模型的pIoU值为859,比其他模型平均高出35,有效提高了多目标识别检测时点云分类与分割精度,是对智能网联技术发展的有效支撑。相似文献

7.

一种基于FCOS神经网络的小建筑物目标检测方法北大核心

林思玉王敬东顾东泽姜宜君《半导体光电》2022,43(2):369-376

提出了一种基于FCOS神经网络的小建筑物目标检测算法,针对FCOS模型在特征提取阶段提取到的小建筑物目标特征较少问题,引入多尺度检测和可变形卷积方式,加强网络对小建筑物目标的特征提取能力,并通过改进后的SGE注意力机制降低特征图中的干扰噪声权重。改进后的网络可以提取到更多的小建筑物目标特征,对环境干扰噪声的鲁棒性更强。在自己搭建的数据集上进行了实验测试,结果表明,在相同环境下网络改进后建筑物的整体检测准确率提升了1.7%,其中对小建筑物目标提升了3.6%,减少了小建筑物目标漏检、误检的问题。相似文献

8.

基于Transformer的多编码器端到端语音识别

庞江飞孙占全《电子科技》2024,(4):1-7

当前广泛使用的Transformer模型具有良好的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对该问题,文中提出了一种使用多个编码器来改善语音特征信息提取能力的方法。通过附加一个额外的卷积编码器分支来强化对局部特征信息的捕捉,弥补浅层Transformer对局部特征信息的忽视,有效实现音频特征序列全局和局部依赖关系的融合,即提出了基于Transformer的多编码器模型。在开源中文普通话数据集Aishell-1上的实验表明,在没有外部语言模型的情况下,相比于Transformer模型,基于Transformer的多编码器模型的字符错误率降低了4.00%。在内部非公开的上海话方言数据集上,文中所提模型的性能提升更加明显,其字符错误率从19.92%降低至10.31%,降低了48.24%。相似文献

9.

基于YOLOX和Swin Transformer的车载红外目标检测

下载免费PDF全文

楼哲航罗素云《红外技术》2022,44(11):1167-1175

红外图像因为存在噪声大、对比度不佳等问题,容易导致目标检测时的精度降低,本文结合YOLOX和Swin Transformer,提出了一种改进的YOLOX的模型。改进的模型采用Swin Transformer替换YOLOX中的CSPDarknet主干提取网络,减少YOLOX中Neck和Head部分的激活函数以及标准化层,以提高特征的提取能力,优化网络结构。对改进的模型在艾瑞光电数据集和FILR数据集上均进行了测试,实验结果显示,改进后的YOLOX网络,在两个数据集上的平均检测精度都有明显提升,更加适合红外图像的目标检测。相似文献

10.

基于Transformer编码器的金融文本情感分析方法

李福鹏付东翔《电子科技》2020,33(9):10-15

目前针对文本情感分析的研究大多集中在商品评论和微博的情感分析领域,对金融文本的情感分析研究较少。针对该问题,文中提出一种基于Transformer编码器的金融文本情感分析方法。Transformer编码器是一种基于自注意力机制的特征抽取单元,在处理文本序列信息时可以把句中任意两个单词联系起来不受距离限制,克服了长程依赖问题。文中所提方法使用Transformer编码器构建情感分析网络。Transformer编码器采用多头注意力机制,对同一句子进行多次计算以捕获更多的隐含在上下文中的语义特征。文中在以金融新闻为基础构建的平衡语料数据集上进行实验,并与以卷积神经网络和循环神经网络为基础构建的模型进行对比。实验结果表明,文中提出的基于Transformer编码器的方法在金融文本情感分析领域效果最好。相似文献

11.

特征增强的Sparse Transformer目标跟踪算法

张丽君李建民侯文王洁《电光与控制》2024,(5):18-23

针对Transformer的自注意力机制计算量大、容易被背景分心,导致有效信息抓取不足,从而降低跟踪性能的问题,提出特征增强的Sparse Transformer目标跟踪算法。基于孪生网络骨干进行特征提取;特征增强模块利用多尺度特征图生成的上下文信息,增强目标局部特征;利用Sparse Transformer的最相关特性生成目标聚焦特征,并嵌入位置编码提升跟踪定位的精度。提出的跟踪模型以端到端的方式进行训练,在OTB100,VOT2018和LaSOT等5个数据集上进行了大量实验,实验结果表明所提算法取得了较好的跟踪性能,实时跟踪速度为34帧/s。相似文献

12.

基于旋转候选区域的船舶检测

汪从敏程国开于洪亮王群赵建豪《信息技术》2021,(2):73-78

利用图像进行船舶检测可以为海上侦察监视提供重要信息.以往的检测方法对水平或近水平的目标都有很强的检测能力,但对于任意方向的船舶检测,都不能给出满意的检测结果.在此提出了一种新型的船舶检测算法,可以检测任意方向的船舶.在该方法中,提出了一种利用旋转候选区域来生成具有船舶方位角信息的多方向候选信息,并且还对边框的方位角进行... 相似文献

13.

基于Swin-Transformer的YOLOX交通标志检测

嵇文刘全金黄崇文杨瑞黄汇磊徐光豪《无线电通信技术》2023,(3):547-555

交通标志检测是驾驶辅助系统和自动驾驶系统的关键因素之一。在交通标志检测过程中，交通标志距离不同导致目标尺度变化很大，远距离小尺度交通标志对基于卷积网络的目标检测器提出了巨大挑战。YOLOX-Swin算法将Swin-Transformer作为YOLOX的骨干网络以提取交通标志图像特征，通过移动窗口获取足够的全局上下文信息，并利用多头自注意力机制提取更多差异化特征；利用YOLOX自身的路径增强特征金字塔网络(Path Aggregation Feature Pyramid Network, PAFPN)提取、融合包括交通标志低层信息在内的多尺度特征信息，提升小目标交通标志检测精度。由于小目标交通标志在图像中所占像素较少，同时考虑到Transformer需要的训练样本多于卷积网络，在原本的复制粘贴法上进行改进，增加交通标志样本数量，以进一步提高交通标志检测精度。在TT100K数据集上的测试结果表明，所提目标检测方法较其他几种方法具有更高的交通标志检测精度，能满足交通标志检测准确性和实时性要求。相似文献

14.

基于多层注意力机制的口罩佩戴检测算法改进

周蕾陈冠宇钟海莲《电子器件》2023,(6):1652-1660

针对已有的对于口罩的目标检测算法中存在的问题,如对小目标检测精度低,复杂场景下出现漏检等问题,提出了一种基于多层注意力机制的口罩佩戴检测算法YOLOX-l-sd。通过在骨干网络中添加Swin Transformer的特征层来提升目标检测算法的性能,加入多层注意力机制提高特征提取效果以及减少计算量,采用DIOU损失函数提升模型的精度,采用DW卷积以进一步减少计算量。实验结果表明,相比原YOLOX-l模型,改进后的模型在精度上提高了2.45%,达到了预期的效果。相似文献

15.

基于深度学习的电力巡检图像实时处理与识别算法研究

石志彬罗望春莫兵兵张福《电子设计工程》2022,(23):189-193

应用人工智能技术对航拍采集的巡检图像进行目标检测和缺陷识别已成为现代电力巡检的发展趋势。文中基于深度学习技术提出了一种改进的识别算法,通过改进Faster-RCNN模型,结合HSI颜色特征提取,实现图像实时处理与输电线路的各类常规故障识别。将航拍图片归一化处理,RGB颜色模型转化为HSI颜色模型,遍历HSI空间的每个像素点,根据图片颜色特征判断像素点是否发生故障;建立Dense Net网络,将RoI Align层与预测层连接,应用改进Faster-RCNN目标检测模型对巡检线路训练数据集进行目标缺陷识别。实验分析结果表明,文中所提方法的故障缺陷识别精确率可达92.54%,具有实时性强、识别精度高等特点。相似文献

16.

逆合成孔径(ISAR)雷达目标检测方法

下载免费PDF全文

陆林根《电子学报》2000,28(3):29-31

本文研究ISAR雷达目标回波的信号检测方法.由于ISAR雷达目标检测实质上是延伸目标检测(Extended target detection),其目标散射模型不是低分辨雷达(LRR)中的等效点目标.在距离维上呈现出多个强散射点.本文提出的目标回波的检测方法是对同一目标的距离维上各散射点进行相关积累,以提高雷达目标信噪比.分析和实际结果表明:利用本文所提出的雷达目标检测方法比低距离分辨(LRR)雷达的性能有很大的改进. 相似文献

17.

无线网络中基于H.264/SVC的RoI视频流传输 总被引：2，自引：1，他引：1

袁涛樊丰《电视技术》2011,35(5):29-31,34

在无线网络中,由于无线终端的多样性和无线信道带宽多变、易受干扰,视频传输面临着极大的挑战,针对无线网络的这些特性,为了能满足不同终端的不同需求,对H.264/SVC码流进行RoI(感兴趣区域)码流转换;为提高传输效率,提出一种基于丢包率检测的带宽估计模型。然后,在NS2上建立一个仿真系统,对所提算法进行验证,结果表明,所提算法使得视频流在无线网络中进行可靠地传输,并且提高了视频的主观效果。相似文献

18.

基于Transformer网络的机载雷达多目标跟踪方法

李文娜张顺生王文钦《雷达学报》2022,11(3):469-478

传统的多目标跟踪数据关联算法需要提前知晓目标运动模型和杂波密度等先验信息,然而这些先验信息在跟踪之前无法及时准确地获取。针对这个问题,提出一种基于Transformer网络的多目标跟踪数据关联算法。首先,考虑到传感器会存在漏检的情况,引入虚拟量测来重新建立数据关联模型。在此基础上,提出基于Transformer网络的数据关联方法来解决多目标与多量测的匹配问题。同时,设计了一种掩蔽交叉熵损失与重叠度损失相结合的损失函数(MCD)用于优化网络参数。仿真和实测数据结果表明:在不同检测概率条件下,所提算法性能均优于经典的数据关联算法和基于双向长短时记忆网络的算法。相似文献

19.

基于cosSTR-YOLOv7的多尺度遥感小目标检测

张徐朱正为郭玉英刘辉仲慧《电光与控制》2024,(4):28-34

针对地理空间遥感图像存在目标分布密集、尺度变化范围较大及小目标特征信息过少等而造成目标检测精度不高的问题,提出了一种基于Swin Transformer(STR)和YOLOv7的多尺度遥感小目标检测算法cosSTR-YOLOv7。以YOLOv7作为基线网络,首先,使用STR模块替换主干网络中的E-ELAN模块,并利用余弦注意力机制和后正则化方法将其改进为cosSTR模块,以提升模型训练的稳定性;其次,在Neck部分构建新的特征融合层,以减少特征信息丢失;然后,在预测部分增加小目标预测层,以提升模型对小目标的检测能力;最后,采用新的SIoU损失函数计算定位损失,以加快模型收敛速度。利用遥感数据集DIOR进行实验,实验结果表明,所提算法平均精度均值(mAP)达到92.63%,对比原YOLOv7算法提高了3.73个百分点,对多尺度小目标的检测性能有显著提高。相似文献

20.

基于Transformer的通信信号调制识别方法

下载免费PDF全文

李振星赵晓蕾刘伟承王杰《太赫兹科学与电子信息学报》2022,20(12):1311-1317

提出一种基于Transformer模型的通信信号调制识别方法：在数据准备阶段,构建一个不同符号速率调制识别(DSRMR)数据集;在数据预处理阶段,提出I/Q数据增强方法,用于满足模型训练在数量上和多样性的要求,增强了模型泛化能力;在模型构建阶段,将切片序列化的方法引入调制识别Transformer模型中,用于优化Transformer神经网络模型的输入问题。实验结果证明,基于Transformer模型的通信信号调制识别方法能够获得较高的信号自动调制识别准确率。相似文献