首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
2.
3.
通过研究Mask R-CNN算法,并对传统的Mask R-CNN算法进行卷积主干的优化,增加联级特征金字塔模型分支,设计出游泳者溺水检测系统.通过对泳池中游泳者姿势进行实时识别,判断出溺水者并及时发出警报.实验结果表明:系统检测速度为5 FPS,检出率为93.3%,误检率为6.4%,效果良好,满足预期要求.  相似文献   

4.
Mask R-CNN作为一种优秀的实例分割算法,不仅能够对图像或视频中的每个感兴趣目标进行分类和定位,还能够对每个不同的目标进行分割。该算法在遥感图像智能解译,自动驾驶,智能医疗等计算机视觉领域具有极高的应用价值。因此如何对Mask R-CNN算法进行改进,提高实例分割的准确性,对计算机视觉领域的发展具有重要意义。文章对Mask R-CNN算法进行深入的分析和研究,提出了可用于Mask R-CNN算法的几个改进策略。通过实验验证,本文提出的改进策略对于提高Mask R-CNN算法的准确性具有一定的可行性。  相似文献   

5.
6.
目的 海洋锋的高效检测对海洋生态环境变化、渔业资源评估、渔情预报及台风路径预测等具有重要意义。海洋锋具有边界信息不明显且多变的弱边缘性,传统基于梯度阈值法及边缘检测的海洋锋检测方法,存在阈值选择不固定、判定指标不一致导致检测精度较低的问题。针对上述问题,基于Mask R-CNN(region convolutional neural network)提出一种改进的海洋锋自动检测方法。方法 兼顾考虑海洋锋的小数据量及弱边缘性,首先对数据扩增,并基于不同算法对海表温度(sea surface temperatures,SST)遥感影像进行增强;其次,基于迁移学习的思想采用COCO(common objects in context)数据集对网络模型进行初始化;同时,对Mask R-CNN中残差神经网络(residual neural network,ResNet)和特征金字塔模型(feature pyramid network,FPN)分别进行改进,在充分利用低层特征高分辨率和高层特征的高语义信息的基础上,对多个尺度的融合特征图分别进行目标预测,提升海洋锋的检测精度。结果 为验证本文方法的有效性,从训练数据和实验模型上分别设计多组对比实验。实验结果表明,相比常用的Mask R-CNN和YOLOv3(you only look once)神经网络,本文方法对SST梯度影像数据集上的海洋锋检测效果最好,海洋锋的定位准确率(intersection over union,IoU)及检测平均精度均值(mean average precision,mAP)达0.85以上。此外,通过对比分析实验结果发现,本文方法对强海洋锋的检测效果明显优于弱海洋锋。结论 本文根据专家经验设立合理的海洋锋检测标准,更好地考虑了海洋锋的弱边缘性。通过设计多组对比实验,验证了本文方法对海洋锋的高精度检测效果。  相似文献   

7.
越南语字符由拉丁字符结合变音符号组成,由于变音符号的存在易导致注意力漂移,并且越南语文字字符类别较多,字符间差异性较小,部分字符仅为变音符号的差异,使得越南文字的识别具有挑战性。本文在解耦注意力网络(Decoupled attention network, DAN)的基础上,设计了视觉特征与序列特征融合模块(Visual feature and sequence feature fusion module, VSFM),分别利用双向门控循环单元(Bidirectional gated recurrent unit, Bi-GRU)在水平方向和竖直方向进行序列建模,进一步缓解注意力漂移,增强变音符号与拉丁字符间的关联性。然后设计了增强型解耦文本解码器模块(Enhanced decoupled text decoder module, ETDM),在解码器中分类时结合了更多的特征信息,可以更加有效地识别相似字符。一系列的实验验证了本文提出方法的有效性。  相似文献   

8.
朱繁  王洪元  张继 《计算机应用》2019,39(11):3210-3215
针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2:5)使12种anchors适应图像中行人的尺寸;然后,结合细粒度图像识别技术,实现行人的高定位精度;其次,采用全卷积网络(FCN)分割前景对象,并进行像素预测获得行人的局部掩码(上半身、下半身),实现对行人的细粒度检测;最后,通过学习行人的局部特征获得行人的整体掩码。为了验证改进算法的有效性,将其与当前具有代表性的目标检测方法(如更快速的区域卷积神经网络(Faster R-CNN)、YOLOv2、R-FCN)在同数据集上进行对比。实验结果表明,改进的算法提高了行人检测的速度和精度,并且降低了误检率。  相似文献   

9.
针对卫星部件维修更换、燃料加注、废弃卫星回收等空间在轨服务中需解决的目标卫星部位检测问题,在Mask R-CNN的基础上,改进其主干网络结构并缩减分类回归、Mask分支通道数,提出了一种改进的实例分割网络模型Ring-Engine-Mask R-CNN,使用实物模型图像和3dsMax生成的仿真图像建立了专用数据集,给出了一种基于深度学习的卫星目标部位检测方法;实验结果表明,该方法能较好的完成卫星星箭对接环和远地点发动机喷管两种目标部位的检测分割,相较于传统的网络模型,在缩小了模型规模的同时,具有更高精度和更快的检测速度.  相似文献   

10.
建筑施工现场钢筋图像背景复杂且干扰较多,传统图像检测算法无法有效利用特征信息,难以满足现阶段建筑智能监理行业中钢筋尺寸检测精度的验收要求。提出一种在Mask R-CNN模型基础上加入自下而上路径和注意力机制的改进模型BU-CS Mask R-CNN。在建筑工地现场拍摄图像后,整理自建钢筋数据集,并在此数据集上进行算法验证。实验结果表明,与Mask R-CNN模型相比,BU-CS Mask R-CNN模型的召回率、交并比和像素准确率分别提升了4.9%、6.8%、7.4%,钢筋直径和间距的尺寸检测精度分别提升了14.9%、4.4%,能得到更加准确的钢筋目标检测框和边缘分割掩膜,达到了行业中实际工程验收的精度要求。  相似文献   

11.
电力设备锈迹目标的识别在电力安全方面具有极高的应用价值,但是锈迹具有大小、形状不规则等特点,利用传统的机器学习算法检测效率和准确率不高.针对这一问题,研究分析锈迹特点,提出基于Mask R-CNN的电力设备锈迹检测识别方法.使用Faster R-CNN完成目标检测的功能,FCN精准的完成语义分割的功能,实现像素级别的分类识别,较好地解决了不规则锈迹的检测问题.实验结果表明,基于Mask R-CNN的电力设备锈迹检测结果准确率高.  相似文献   

12.
将Mask R-CNN实例分割模型应用于茄子花期识别研究,针对Mask R-CNN模型对大目标物存在误检和漏检的情况,提出使用混合空洞卷积融合普通卷积的方法,在ResNet50的残差块中进行参数修改,通过堆叠残差块完成对整个特征提取网络的改进,扩大了特征图感受野,增强了全局信息关联性;针对出现的过拟合问题,运用迁移学习方法将预训练的ResNet50特征提取网络作为茄花识别模型的初始参数,提高了模型在测试集泛化能力的同时提升了模型训练速度。运用改进的模型在测试集上的mAP为0.962,mIOU为0.715。通过定性分析并与其他模型进行对比,证明改进的模型能有效提高大目标物分割能力,对茄子花期识别具有良好效果。该研究为茄花自动授粉与花期管理提供了技术支持,对保证授粉质量,提升经济效益具有重要意义。  相似文献   

13.
冯涛  陈斌  张跃飞 《计算机应用》2020,40(11):3332-3339
针对染色体图像的人工分割耗时费力且当前自动分割方法精度不佳的问题,基于改进的Mask R-CNN提出了一种染色体图像分割框架——Mask Oriented R-CNN,引入方向信息对染色体图像进行实例分割。首先,新增有向包围框回归分支,以预测紧实包围框并获取方向信息;然后,提出新的交并比(IoU)度量——角度加权交并比(AwIoU),从而结合方向信息与边的关系以改进冗余包围框的判据;最后,实现有向卷积通路结构,通过拷贝掩模分支通路并依据实例的方向信息选择训练路径来减少掩模预测中的干扰。实验结果表明,相较于基准模型Mask R-CNN,Mask Oriented R-CNN在IoU阈值为0.5时的平均精度均值指标提升了10.22个百分点,IoU阈值为0.5~0.95时的平均指标提升了4.91个百分点。研究结果显示,Mask Oriented R-CNN框架相较于基准模型取得了更好的染色体图像分割结果,有助于实现染色体图像自动分割。  相似文献   

14.
曾文雯  杨阳  钟小品 《计算机应用研究》2021,38(11):3456-3459,3505
运用人工智能技术将是构建下一代智慧图书馆的关键,为了实现图书的定位和识别,提出一种基于改进Mask R-CNN的在架图书书脊图像实例分割方法.考虑到图书密集排列、具有一定的旋转性、副本纹理极相似等难点,改进锚框为旋转矩形框,提出旋转区域建议网络取代区域建议网络;提出旋转特征提取方法可减少池化误差且有效提取目标特征,结合掩膜的旋转对齐以提升预测掩膜的准确性.建立了一个包含1849张在架图书书脊图像的标注数据集,提出方法的测试结果大幅度优于其他重要的实例分割算法,证实了在网络中使用旋转特征对于具有一定朝向的、密集的目标分割难题很有效.  相似文献   

15.
运行的场景中没有运动物体是大多数SLAM算法的前提,这个假设过于理想化,导致大多数视觉SLAM算法在动态环境下无法使用,因此也就限制了其在服务型机器人和自动驾驶等中的应用。提出了一种动态物体检测及剔除方法并将其整合到ORB-SLAM2[1]算法中,提升了其在动态场景中使用RGB-D摄像头时的稳定性。基于Mask R0CNN获得动态物体的检测和移除能力从而剔除从动态物体上提取到的ORB特征。在公共的RGB-D数据集上评估了加入动态物体剔除方法后的ORB-SLAM2系统,对比了在动态场景下和原系统的差异。改造后的系统在动态场景下的定位和建图精度提升较为明显。  相似文献   

16.
肺癌不断威胁着人类健康,计算机辅助诊断对肺癌诊断将发挥重要的作用.卷积神经网络(CNNs)在对图像的处理上表现出有目共睹的优秀性能,医学Computed Tomography(CT)图像是用来诊断肺癌的主要检查方式,用深度学习分割病灶的方法可以实现端对端的辅助诊断,这将节省医生的诊断时间,为患者争取最佳治疗时间.LIDC-IDRI(The Lung Image Database Consortium)数据集影像中的癌症部分与其他组织部分的放射密度十分接近,而且往往癌症部分非常小,背景具有非常强的相似性.本文使用传统的Sobel算子对图像中放射密度高的部分进行边缘锐化处理,用强化边缘特征的方法解决前景与背景灰度相似的问题,然后在使用传统的分割方法--阈值分割进一步强化.本文减小Regions of Interest(RoIs)的大小以适应肺结节的特征,减少RoIs的个数以避免过多的负类样例训练产生退化的模型;在传统图像增强处理方法和深度学习的结合下,获得了一个优化的Mask R-CNN模型,在LIDC-IDRI数据集上的测试结果中,基于Intersection over Union(IoU)=0.5的标准下的肺结节平均精度mAP达到72.2%,在FPR为0.226时的TPR达到0.915.  相似文献   

17.
为解决民航中小机场缺乏低成本运行的防跑道侵入技术的问题,提出了一种通过摄像头获取地面保护区图像信息以防止跑道侵入的模型。该模型首先利用迁移学习Mask R-CNN对航空器进行识别和跟踪,通过结合摄像头在地面保护区的布局方案,提出了一种基于摄像头的检测结果判断是否发生跑道侵入的逻辑电路。该模型通过等比例缩小的机场模型进行实验验证。结果表明,该模型的跟踪准确率为95%,可以有效地跟踪机场场面目标,进而判断跑道侵入的发生。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号