首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 10 毫秒
1.
近年来, 人工智能在各个领域有着广泛的应用. 针对超市及菜市场人工称重操作耗时、计价流程繁杂的问题, 本文提出一种基于注意力YOLOv5模型的水果自动识别算法. 首先, 为了提升仅有局部特征不同, 全局特征相似水果的识别准确率, 本文在YOLOv5的SPP (spatial pyramid pooling)层后增加SENet (squeeze-and-excitation networks), 采用注意力机制自动学习每个特征通道的重要程度, 进而按照重要程度强化对水果识别任务有用的特征并抑制没有用的特征; 其次, 针对水果识别预测框与目标框重叠时, GIOU不能准确表达边框重合关系问题, 本文将原有的边框回归损失函数GIOU替换为CIOU, 同时考虑目标框与预测框的高宽比和中心点之间的关系, 从而使水果预测框更加接近真实框, 提升预测精度. 实验结果表明, 改进后的模型在常见场景下水果识别能力有明显提升, 平均精度mAP达99.10%, 识别速度FPS达到82, 能够满足实际应用需要.  相似文献   

2.
机器阅读理解是自然语言处理领域一项得到广泛关注与研究的任务。该文针对中文机器阅读理解数据集DuReader,分析其数据集的特点及难点,设计了一种基于循环神经网络和自注意力机制的抽取式模型Mixed Model。通过设计段落融合等策略,该文提出的模型在DuReader测试集上达到了54.2的Rouge-L得分和49.14的Bleu-4得分。  相似文献   

3.
现有瓷砖表面缺陷检测存在识别微小目标缺陷能力不足、检测速度有待提升的问题, 为此本文提出了基于改进YOLOv5的瓷砖表面缺陷检测方法. 首先, 由于瓷砖表面缺陷尺寸偏小的特性, 对比分析YOLOv5s的3个目标检测头分支的检测能力, 发现删除大目标检测头, 只保留中目标检测头和小目标检测头的模型检测效果最佳. 其次, 为了进一步实现模型轻量化, 使用ghost convolution和C3Ghost模块替换YOLOv5s在Backbone网络中的普通卷积和C3模块, 减少模型参数量和计算量. 最后, 在YOLOv5s的Backbone和Neck网络末端添加coordinate attention注意力机制模块, 解决原模型无注意力偏好的问题. 该方法在天池瓷砖瑕疵检测数据集上进行实验, 实验结果表明: 改进后的检测模型的平均精度均值达66%, 相比于原YOLOv5s模型提升了1.8%; 且模型大小只有10.14 MB, 参数量相比于原模型减少了48.7%, 计算量减少了38.7%.  相似文献   

4.
针对遥感图像在复杂背景下小目标检测精度较低的问题,提出一种基于双注意力机制模型的SSD检测算法。该算法在前端特征提取网络中引入双注意力机制模型,强化低层特征图中小目标的有效特征信息并抑制冗余的语义信息,实现自适应特征学习;并在空间注意力模型中引入空洞卷积,保证卷积核感受野的同时减少了网络参数。引入Focal loss损失函数作为改进算法的分类损失函数,改善网络在训练过程中样本失衡的问题,增加正样本与难样本在训练时的权重比例,提升算法的检测性能。对遥感图像数据集NWPU VHR-10进行检测的结果表明,本文的改进算法在保证检测速度的同时提高了检测精度。与传统SSD算法相比,改进SSD算法的mAP提高了2.25个百分点,达到79.65%。  相似文献   

5.
小目标检测用来识别图像中小像素尺寸目标.传统目标识别算法泛化性差,而通用的深度卷积神经网络算法容易丢失小目标的特征,对小目标识别的效果不甚理想.针对以上问题,提出了一种基于注意力机制的小目标检测深度学习模型AM-R-CNN,该模型在ResNet101主干网络和候选区域生成网络中使用了通道域注意力和空间域注意力,通道域注...  相似文献   

6.
李维娜  李爽 《软件》2023,(3):179-183
现有的YOLOv5模型无法精确检测出进入复杂施工现场内的人员佩戴安全帽问题,本文提出了一种基于YOLOv5的安全帽检测算法。模型的具体改进方法为:在主干网络中新增了一个小目标层P2和3-D注意力机制SimAM,提升算法的特征提取能力便于能够更容易检测出小目标;将边框损失函数CIoU_Loss改为SIo U_Loss,以提升对小目标检测的训练速度与精度,从而得到一种新的安全帽佩戴检测模型。实验结果显示,修改后的YOLOv5s算法大大提高了复杂工程现场安全帽检测的准确率,较原有的算法提高了1.4个百分点,mAP值达到了95.5%。  相似文献   

7.
视觉问答(visual question answering,VQA)是深度学习领域的一个新挑战,需要模型同时根据问题的语义和图片的内容进行推理并给出正确答案。针对视觉问答图片输入的多样性,设计了一种由两层注意力机制堆叠组成的层次注意力机制,帮助模型定位图片中与问题相关的信息,其中第一层注意力机制使用目标检测网络提取图片中物体的特征,第二层注意力机制引入问题特征。同时改进了现有的特征融合方式,消除对输入特征尺寸的限制。VQA数据集的测试结果显示,层次注意力机制使计数类问题的回答准确率提升了4%~5%,其他类型的问题回答准确率也有小幅提升。  相似文献   

8.
机场跑道异物严重影响飞行安全,针对现有算法对小目标存在误检、漏检等问题,提出一种改进的YOLOv5算法对机场跑道异物进行检测。在YOLOv5的主干网络中添加有效通道注意力(ECA)模块,通过少量参数的增加带来明显的性能增益。将颈部网络中原特征金字塔模块替换为加权双向特征金字塔(BiFPN)网络,实现双向跨尺度连接和加权特征融合。采用EIoU Loss作为损失函数,加快了收敛速度。在FOD-A数据集上的实验表明,改进后的YOLOv5模型均值平均精度(mAP@0.5)指标达到了97.4%,相比于原模型提高了1.6个百分点。  相似文献   

9.
针对雾天场景下目标检测算法精度较低、模型复杂度较高,提出一种基于YOLOv5的轻量级雾天目标检测方法。采用感受野注意力模块(RFAblock)通过交互感受野特征信息,对感受野添加注意力机制,提高特征提取能力;采用轻量化网络Slimneck作为颈部结构,在保持精度的同时降低模型参数和复杂度;在损失函数中引入真实框与预测框之间的角度向量,提高训练速度和推理的准确性;采用PNMS(precise non-maximum suppression)改进候选框选择机制,降低车辆遮挡情况下的漏检率。在真实雾天数据集RTTS和合成雾天数据集Foggy Cityscapes上进行测试,实验结果表明,与YOLOv5l相比mAP50分别提高了4.9和3.5个百分点,模型参数量仅为YOLOv5l的54.6%。  相似文献   

10.
鉴于现有的火灾检测手段大多依赖于感温探测器和感烟探测器,但感温探测器和感烟探测器的探测具有一定的滞后性,无法实时准确地检测出初期火灾的问题,因此,构建了一个大规模多场景的火灾图像数据集;同时对图像数据集进行了火焰和烟雾目标标注,并提出了一种具有注意力机制的火灾检测算法,采用颜色分析的方法检测出图像中火焰和烟雾的疑似区域;再对火焰和烟雾目标的疑似区域进行关注,通过结合深度网络的特征提取能力,得到火灾目标的检测模型;实验结果表明,此方法在检测火灾任务上取得了更优的效果,相比于基于YOLOv3的火灾检测模型,mAP(mean average precision)提高了5.9%,同时满足了实时检测的需求。  相似文献   

11.
针对多尺度目标检测准确率偏低的问题,提出了一种基于YOLOv5s改进的多尺度目标检测算法。在YOLOv5s主干网络与Neck网络之间融合CBAM模块,增强模型对多尺度目标重要特征信息的提取能力;同时,在模型的Head部分增加多尺度目标检测结构,提高不同尺度目标检测精度;训练时采用CIoU替代GIoU损失函数,以提高模型收敛能力,实现高精度目标定位。数据集来源于实际场景中采集并增强的4万余张图像。实验结果表明,改进后的模型对行人、车辆和人脸的多尺度目标检测平均精度达92.1%,相比未改进YOLOv5s算法提升了3.4%。模型的收敛性好,对密集场景的目标,小尺度目标检测准确度更加突出。  相似文献   

12.
遥感图像的复合目标相对单一目标而言,存在多个结构,结构之间存在一定差异。本文围绕复合目标多变性、复杂性,大宽幅遥感影像背景复杂,存在较多和待检复合目标特征相似的区域,检测准确率较低等问题,开展基于高分辨率遥感图像的复合目标检测研究。首先开展目标特性分析和样本数据标注;然后提出一种基于Coordinate Attention注意力机制和Focal Loss损失函数的改进YOLOv3检测算法;最后以篮球场这种复合目标为例进行实验。实验结果表明,改进后的算法与原YOLOv3算法相比,召回率和平均检测准确率分别提高了10.3个百分点和28.8个百分点。该结果验证了所提方案的可行性、合理性。  相似文献   

13.
14.
针对交通目标检测模型参数量大、检测精度低、检测速度慢、泛化性差等问题,提出一种基于GhostNet与注意力机制的YOLOv5交通目标实时检测模型.采用基于遗传算法的K-means聚类方法获取适用于车辆检测的最佳预选框;采用轻量的Ghost卷积提取目标特征,并构建基于CSP结构的C3Ghost模块,大幅度压缩模型参数量,降低计算成本,提高计算速度;在特征融合层添加Transformer block和CBAM注意力模块,来探索模型特征提取潜力以及为模型在密集对象的场景中寻找注意力区域; UA-DETRAC数据集上的消融实验和综合性能评价结果表明所提模型平均精度达到98.68%,参数量为47 M,检测速度为65 FPS,与YOLOv5相比,参数量压缩了34%,速度提升43%,平均精度提高了1.05%.  相似文献   

15.
曾凯  李响  陈宏君  文继锋 《软件工程》2023,(1):55-58+54
为了提升复杂多尺度目标检测任务下的分类及定位准确度,在基准的YOLOv5目标检测算法基础上,设计了四组引入注意力机制模块的改进型YOLOv5网络,并在变电站内复杂多尺度检测场景数据集上进行对比实验。实验结果表明,相较于基准YOLOv5网络,SwinTrans-YOLOv5网络的mAP指标提升达9.0%,但模型运算量高达1,061.6GFLOPS(每秒千兆次浮点运算);CA-YOLOv5网络的mAP指标提升也达到4.1%,模型运算量仅需115.8 GFLOPS。因此,在硬件算力充足的情况下使用SwinTrans-YOLOv5网络可以获得更高的检测精度,但在硬件算力不足的情况下使用CA-YOLOv5网络,则实现了检测精度和速度间较好的平衡。  相似文献   

16.
张锦  屈佩琪  孙程  罗蒙 《计算机应用》2022,42(4):1292-1300
针对现有安全帽佩戴检测干扰性强、检测精度低等问题,提出一种基于改进YOLOv5的安全帽检测新算法。首先,针对安全帽尺寸不一的问题,使用K-Means++算法重新设计先验框尺寸并将其匹配到相应的特征层;其次,在特征提取网络中引入多光谱通道注意力模块,使网络能够自主学习每个通道的权重,增强特征间的信息传播,从而加强网络对前景和背景的辨别能力;最后,在训练迭代过程中随机输入不同尺寸的图像,以此增强算法的泛化能力。实验结果表明,在自制安全帽佩戴检测数据集上,所提算法的均值平均精度(mAP)达到96.0%,而对佩戴安全帽的工人的平均精度(AP)达到96.7%,对未佩戴安全帽的工人的AP达到95.2%,相较于YOLOv5算法,该算法对佩戴安全帽的平均检测准确率提升了3.4个百分点,满足施工场景下安全帽佩戴检测的准确率要求。  相似文献   

17.
近年来,随着我国制造业的快速发展,铝材的需求量日益增长。然而,铝材在生产过程中会出现不同类型的缺陷,这些缺陷影响铝材的质量、美观度和使用寿命。为实现快速、准确地识别铝片表面缺陷,基于YOLOv5网络提出了一种改进的铝片表面缺陷检测方法。为了提高检测模型的特征提取和特征融合能力,引入注意力机制CBAM模块,协助模型关注和提取更有用的特征信息。在回归损失方面,采用Alpha-IoU函数来替代原来的CIOU损失函数,降低预测框的回归损失,提升定位精度。通过实验验证,该方法能够有效识别铝片表面的缺陷类型和位置,具有较高的实用价值。  相似文献   

18.
为提升深度卷积神经网络模型检测肺结节的效果,提出一种基于注意力机制的肺结节检测算法。通过空间和通道注意力两种不同粒度与层次的注意力因子增强,提升肺结节检测网络生成的特征映射的质量,达到提升模型性能的目的。在LUNA16公开肺部CT图像数据集上进行大量相关实验,验证了模型的可行性和算法的有效性。  相似文献   

19.
近年来,用于交通标志检测的模型通常需要高性能GPU设备才能做到实时性,而计算资源受限的设备很难满足实时性计算任务的需求。针对此问题,提出一种改进的目标检测网络YOLOv4-Ghost模型,实现对算力要求较低的交通标志实时检测模型。利用数据增强策略来模拟真实环境中出现过的天气情况;将GhostNet轻型网络作为检测模型的骨干网络降低模型参数量;优化Neck部分参数量占比最高的PANet模块中普通卷积为Ghost卷积块;Head部分只保留两个检测尺寸较小的预测器。实验结果表明,改进的YOLOv4-Ghost模型权重文件大小是原始YOLOv4模型的17.5%,帧数最快是YOLOv4的2倍,平均精度(mAP)仅降低1.42%。YOLOv4-Ghost可用于实时性和检测精度要求较高的道路交通标志检测要求。  相似文献   

20.
为提高YOLOv5s目标检测算法在检测图像中小目标时的准确度,本文研究引入注意力机制来提高神经网络对于图像特征提取的能力。将三种注意力机制CBAM、CoordAtt和GAM分别与YOLOv5s相融合,并在小目标数据集上进行训练。实验的结果显示,在YOLOv5s算法中添加注意力机制时,需考虑注意力机制在网络中的添加位置、该机制与数据集任务之间是否匹配以及预训练权重的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号