首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 515 毫秒
1.
血细胞计数是一种常见的临床检验方法。针对血液显微镜图像中的血细胞种类不均匀、密集且相互遮挡导致现有血细胞检测方法准确率不高,提出了一种改进的YOLOX血细胞检测算法。该算法首先在损失函数中引入Focal loss以改善单阶段目标检测算法正负样本的不平衡和细胞种类不均匀的问题;接着在残差模块中引入混合注意力机制,减少了血细胞相互遮挡造成的漏检、错检的概率;然后在特征融合尾部引入自适应空间特征融合模块以提高特征表达能力;最后在残差模块中引入逆深度可分离卷积模块在减少模型参数的同时还略微提高检测精度。提出的算法在BCCD血细胞数据集进行了测试,改进后的YOLOX算法在血细胞数据集上的检测精度达到了92.5%,相比YOLOX算法提升了2.4%,且减少了8%的模型参数量;该算法在COCO2017通用数据集上的检测精度达到了41.7%,相对于原始YOLOX算法提升了1.2%。  相似文献   

2.
为了提高超分辨率重构算法对图像边缘轮廓的修复能力,消除重构图像存在伪影的问题,提出一种基于聚合多尺度特征的图像轮廓增强超分辨重建生成对抗网络。将多尺度卷积与通道注意力机制相结合,使用一次性聚合多尺度特征结构,构建多级残差模块,让生成器网络能自适应地提取特征层中的潜在关键信息,同时完成不同特征层的信息融合。定义高斯滤波卷积核与不同方向的索贝尔卷积核,构建边缘损失函数,该损失函数能加强对图像边缘轮廓信息的修复;结合全变分损失函数,减少低分辨率图像噪声对重构图像的影响,进一步提高图像轮廓信息修复能力。为了提高判别器对不同特征的自适应学习能力,在判别器中使用自适应归一化层,增强网络的收敛能力。在Set5、Set14、BSD100数据集上进行图像重构,经实验结果表明,提出的算法使重构图像的轮廓进一步加强,整体视觉质量更好。同时所提算法与超分辨率生成对抗网络(SRGAN)对比,2倍超分辨重建图像的峰值信噪比平均提高了1.696dB,结构相似性指标平均提高了0.03;4倍超分辨重建图像的峰值信噪比平均提高了1.348dB,结构相似性指标平均提高了0.033。  相似文献   

3.
针对太阳能电池片缺陷分割中存在的特征提取能力弱、分割精度低和漏分割等问题,提出了一种改进U2-Net的太阳能电池片缺陷分割方法。为提高RSU内部有效特征的提取能力并减少参数量,利用残差结构将有效的通道注意模块和深度可分离卷积结合起来,组成新的特征提取层;为防止空间信息的丢失,在外层编解码跳跃连接中添加语义嵌入分支结构,并利用CARAFE算子进行上采样,将更多的语义信息引入低层特征以加强级间特征的融合,减少因跳跃连接丢失的空间信息;最后,将所提方法与常用分割网络对比分析。实验结果表明,该方法的类别像素准确率、交并比和平均交并比分别达74.69%、60.68%、80.30%。相较于U-Net、PSPNet及Deeplab v3+,该方法不仅有效提高了缺陷分割的精度,还实现了小目标缺陷的准确分割,有效减少了漏分割。  相似文献   

4.
复杂背景下,不同尺度建筑物的特征差异较大,现有算法对多尺度建筑物分割存在分割不均以及误判等问题。为了解决上述问题,本文设计了一种适应多尺度变化的新型网络结构。首先,针对遥感图像场景提分割精度低的问题,引入坐标注意力机制,嵌入到基础网络中增强上下文信息捕获能力,消除噪声的同时增强网络对于空间特征的提取能力。引入了新型递归残差卷积模块,加深网络层次的同时减少信息丢失,提高特征提取效率。最后,在跳跃连接中引入了空洞空间卷积池化金字塔增大网络感受野,增强有效特征,抑制无用特征。设计系统验证模型的实用性。实验结果表明,本文方法在精确率、召回率、F1 score和IoU指标中比U Net网络分别提高了305%、156%、13%、308%。  相似文献   

5.
为解决车检站车辆检测中需要对车辆前照灯快速准确定位,同时防止车辆代检的问题,建立了一个车脸检测数据集Car-Data。针对车检站场景中车辆检测问题,提出了一种基于YOLOv5m的轻量化车脸检测方法。首先,将原网络的卷积块替换为改进型跨阶段深度可分离卷积块,以减少网络整体的参数量和计算量。其次,提出增强感受野的空间金字塔扩张卷积模块代替YOLOv5m的主干提取网络中的空间金字塔池化模块,从而提升网络的目标检测精度。最后,在颈部特征增强网络中修改上采样方法,并提出上下层特征融合模块,以减少特征信息的损失。在Car-Data数据集上进行的实验结果表明,改进后的算法相较于原YOLOv5m模型大小减少了48%,每秒检测帧数提高了约10帧,且平均检测精度仍提升了2.02%。因此该改进算法可以满足车检站车辆检测场景中车脸检测的需求。  相似文献   

6.
针对现行电力巡检方法对于高似然目标区分能力较差、检测速度较慢等问题,提出TR-YOLOv5模型。在网络第0层引入卷积注意力机制模块(CBAM),加强网络对细粒度特征的提取能力,并在网络最深层借助Transformer注意力进行编码,加强语义信息的传递能力。对于模型残差结构中的3×3卷积进行秩分解,压缩模型的冗余参数量。在特征融合阶段提出GPAN结构,以GSPP控制各尺度的变换,提高特征融合对各尺度信息的融合。在主干网络与同尺度特征融合结构的连接中加强了语义信息的融合,提高模型的检测能力。在模型训练过程中,以边框回归损失函数(SIOU)和CrossEntropy Loss作为IOU和分类损失回归函数提高模型的定位、分类能力。将训练完成的模型采用PyQt进行封装,提高了人机交互体验。实验结果表明,TR-YOLOv5模型检测平均精度值(mAP)达到97.1%,模型浮点运算量减少到3.6 GFLOPs。消融实验与对比试验证明了TR-YOLOv5模型能有效解决电力巡检过程中的前述问题。  相似文献   

7.
为了更精确地从语谱图中提取特征信息,提出了一种基于 A-DResUnet 的语音增强方法。 A-DResUnet 模型在 ResUnet 模型的基础上融合了空洞卷积,提升捕获语音上下文信息的能力;同时在编码器中加入卷积注意力模块(CBAM),提高对噪声 谱图特征的关注。 实验结果表明,与模型输出目标为干净语音语谱图相比,用噪声谱图作为模型输出目标时,该模型对未知噪 声具有更强的分离能力;相较 ResUnet 模型,提出的 A-DResUnet 模型减少了语音细节信息的损失;对比基于 DNN、GAN 的语音 增强方法,PESQ 平均提升了 22. 81%、33. 11%,STOI 平均提升了 9. 62%、15. 33%,为复杂环境下的语音增强提供了一种更有效 的方法。  相似文献   

8.
为提升多尺度目标的分割效果,增强特征提取能力,提出了一种基于双重注意力机制的改进U-Net街景图像语义分割方法。在U-Net编码阶段的第5个卷积块之后,添加特征金字塔注意力模块,提取多尺度特征,融合上下文信息,增强目标语义特征。在解码阶段不再采用U-Net的特征拼接方法,而是设计了一个空间域-通道域联合注意力模块,接收来自跳跃连接的低层特征图和来自前一个注意力模块的高层特征图。在Cityscapes数据集上的实验结果表明,引入的注意力模块可有效提升街景图像分割精度,与PSPNet、FCN等方法相比,分割性能指标mIoU提升了2.0%~9.6%。  相似文献   

9.
针对现有超分辨算法重建后的遥感图像模糊,含有伪影和噪声等问题,提出一种基于多注意力机制的生成对抗网络。首先,在生成器的残差块中引入高效注意力机制,增强全局相关性,提高模型的特征提取能力;其次,利用迭代注意特征融合模块对输入的图像和经过生成器生成的高层语义特征图进行融合,代替长跳跃连接常用的相加操作,减少输入图像进行相加操作时导致的信息损失,使重建后的图像更加清晰;最后,基于WGAN网络优化模型训练,促进网络训练的稳定,加快损失函数的收敛。在不同数据集上验证上述方法,结果表明,相较次优算法,所提方法在峰值信噪比(PSNR)和结构相似度(SSIM)上分别提高了0.062~0.122 dB和0.03~0.08。  相似文献   

10.
针对城市街景数据集中存在小目标和大量长条形状物体,分割难度大,虽然目前编码解码结构的网络能细化分割结果,但大多数都没有充分利用空间和上下文信息,因此本文提出一种基于像素注意力特征融合的语义分割算法。首先以ResNet50作为骨干网络,利用空洞空间卷积池化金字塔和条状池化进行初步特征融合,获得多尺度特征的同时规避无用信息;然后利用像素融合注意力模块,聚合上下文信息并恢复空间信息,最后利用注意力特征细化模块消除冗余信息。该算法在CamVid数据集上进行实验,结果表明该算法在验证集上能达到 7522%的mIoU,在测试集上也能达到67.21%。相比于DeepLabv3+网络分别提升了2.51%和2.86%。  相似文献   

11.
绝缘子是架空线路中重要组成部分之一,当出现故障时,影响电网安全运行。为实现绝缘子故障快速、精准的识别,提出了一种基于改进YOLOv3-Tiny的绝缘子故障检测方法。首先,为了增强小目标检测能力,对浅层特征图与第二检测层之前特征图进行同维拼接构建第三预测层。随后,该网络采用Ghost模块替换主干网络中的卷积层,降低模型的参数量。然后,设计了一个新的注意力模块MECA,不仅能够多尺度信息融合,还能使网络专注绝缘子的显著特征。最后,提出了新的交并比EIoU作为边框回归损失函数,更好的定位目标位置。实验结果表明,改进的YOLOv3-Tiny在绝缘子故障检测中平均准确率(MAP)高达96.1%,较原始YOLOv3-Tiny算法MAP提高了17%。  相似文献   

12.
光伏电池近红外图像中复杂异构背景使内部缺陷检测成为一项极具挑战性的问题,为此,提出了一种基于深度学习的目标检测框架-残差通道注意力Faster R-CNN(residual-channel-attention-faster R-CNN,RCA-Faster R-CNN),该网络通过卷积层-池化层提取图像特征,再送入新颖的残差通道注意力RCA模块进行复杂背景特征抑制和缺陷特征突出,进而区域推荐网络推荐出更加精确的包含缺陷的候选框,最后利用分类与定位网络实现高精度的缺陷分类和位置估计。实验结果表明,RCA-Faster R-CNN的缺陷检测精度提升到了83.29%,证明了所提方法的有效性。  相似文献   

13.
为充分挖掘蕴含在电力负荷数据中的多尺度时序信息,提升短期电力负荷预测精度,提出了一种多尺度特征增强的改进时间卷积神经网络(improved temporal convolutional network with multi-scale feature enhancement, ECA-MS-DHTCN)模型。首先,使用4种不同尺寸卷积核的因果卷积提取负荷数据特征,并在特征提取层中嵌入高效通道注意力(efficient channel attention network, ECA)模块实现不降维的局部跨通道交互,得到带有通道注意力的多尺度负荷特征。然后,利用双混合扩张卷积层改进基本时间卷积神经网络(temporal convolutional network, TCN)残差块结构,克服TCN模型中扩张卷积结构存在的信息不连续及远距离信息不相关问题,兼顾负荷特征浅层细节及深层联系。最后,将ECA优化的多尺度特征提取层与改进TCN模型结合搭建ECA-MS-DHTCN负荷预测框架,完成短期负荷预测任务。经实际电网负荷数据仿真,结果表明所提出的ECA-MS-DHTCN模型可以在保持较快训练速度的同时有效地提高预测精度。  相似文献   

14.
针对普通商品识别算法在智能售货柜嵌入式系统平台上检测速度慢、识别率低的问题,提出了一种在YOLOv3基础上的改进型商品识别算法DS_YOLOv3.利用k-means++聚类算法得到适应于售货柜中售卖饮料图像数据的先验框;采用深度可分离卷积替换标准卷积,并加入倒置残差模块重构YOLOv3算法,减少了计算复杂度使其能在嵌入式平台实时检测;同时引入CIoU作为边界框回归损失函数,提高目标图像定位精度,实现了对传统YOLOv3算法的改进.在计算机工作站和Jeston Xavier NX嵌入式平台上进行了典型场景下的商品检测实验.实验结果表明,DS_YOLOv3算法mAP达到了96.73%,在Jeston Xavier NX平台上实际检测的速率为20.34fps,满足了基于嵌入式系统平台的智能售货柜对实时性和商品识别精度的要求.  相似文献   

15.
针对建立无人起重装卸目标检测深度学习标注数据耗时问题,设计了货物图像检测生成对抗网络,构成准确的含语义标注和关键点标注的数据集,该数据集可用于有监督深度学习语义分割模型的训练。通过融合StyleGAN与DatasetGAN的生成对抗网络,对实际应用中存在的语义特征变形问题进行改进,将生成器的样本归一化层进行修改,去除均值操作,修改噪声模块和样式控制因子的输入方式;对纹理特征单一的物体的空间位置编码能力弱的问题,将生成网络的常数输入替换为傅里叶特征,并提出一个融合非线性上下采样的模块;最后引入WGAN-GP对目标函数进行改进。应用实验生成标签数据集,使用Deeplab-V3作为评价网络,以DatasetGAN方法作为基线,在语义标签生成任务上,Deeplab-V3输出mIOU值提高14.83%,在关键点标签生成任务上,L2损失平均降低0.4×10^(-4),PCK值平均提高5.06%,验证了改进的生成对抗网络生成语义及关键点标注数据的可行性和先进性。  相似文献   

16.
针对缺乏矿石数据集和矿石分类识别模型等因素,自建以X射线照射成像的矿石图像为数据集,并以MobileNet V2为主网络,提出基于改进MobileNet V2轻量级矿石分类模型算法。首先,通过调整扩展因子和宽度因子大幅减少模型参数量,实现模型轻量化的目的;其次,通过在部分倒残差模块和原模型分类器中嵌入高效通道注意力机制,并将剩余倒残差模块替换为含深度空洞卷积的并行特征提取网络,以增强模型特征信息提取能力,提升模型识别准确率;最后,使用迁移学习的训练方式初始化权重,加速模型训练。经过改进,该算法矿石识别准确率提升至96.720%,对比VGG16、GoogleNet、Xception、ShuffleNet和MobileNet V2在准确率和矿石检测速度都获得了提升。综合而言,相比本文实验中其他算法而言,改进算法针对矿石的识别性能具有更佳表现。  相似文献   

17.
为了提高脑电情感识别的准确率,提取更丰富的特征信息,提升网络模型稳定性,提出一种改进的基于多层注意力机制的脑电情感识别模型。在特征提取方面,将原始脑电信号转换成四维空间 频谱 时间结构,提取丰富的脑电信息。在网络模型方面,构建双路卷积神经网络学习空间及频率信息,有效提取多尺度特征,增加网络宽度来学习更丰富的特征信息;在卷积层及池化层后融入批量归一化层,防止过拟合。最后,构建多层注意力机制 双向门控循环单元模块处理时间特征并配合Softmax分类。采用双向门控循环单元学习更全面的上下级特征信息。利用多层注意力机制使四维特征中不同时间切片与整体时间切片之间产生关联。该文在DEAP数据集唤醒度和效价两个维度进行了评估实验,二分类平均准确率分别为96.38%和96.73%,四分类平均准确率为93.78%。实验结果显示,与单路卷积神经网络及其他文献算法相比,该文算法的平均准确率有所提高,表明该算法可以有效提升脑电情感识别性能。  相似文献   

18.
针对轻量语义分割算法应用于无人机高分辨率交通场景图像分割时存在边缘信息模糊、小目标特征提取准确性较差的问题,提出一种融合注意力机制与重影特征映射的轻量级语义分割算法。首先在BiSeNet V2算法语义分支8倍和16倍下采样过程嵌入混合注意力模块,重新分配深层特征图权重,增强局部关键特征提取能力;然后采用重影特征映射单元优化传统卷积层,进一步降低运算成本;最后使用动态阈值损失函数监督训练,调节高损失困难样本训练权重。利用UAVid数据集对改进后的算法进行训练并测试,发现算法平均交并比(mean intersection over union, mIoU)为52.7%,较改进前的模型提升7.8%,且当输入图像尺寸为1 280×736时推理速度达到81.6 FPS,满足实时分割要求。结果表明,该算法能较好适应复杂交通场景,有效改善边缘信息模糊和小目标分割准确性较差的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号