共查询到16条相似文献,搜索用时 62 毫秒
1.
模型的效率在计算机视觉中变得越来越重要.本文通过研究用于火焰检测的神经网络结构,提出了几个关键的优化方案,以提高模型效率和检测效果.第一,提出一种由多卷积组合结构构建的主干网络(FIRE-Net),它能高效地从多个尺度上提取丰富的火焰特征;第二,提出一种改进的加权双向特征金字塔网络(BiFPN-mini)以快速地实现多尺度特征融合;第三,提出一种新的注意力机制(FIRE-Attention),让检测器对火焰特征更敏感.基于上述优化,本文开发出了一种全新的火焰检测器FIRE-DET,它在硬件资源有限的条件下能够取得比现有基于深度学习的火焰检测方法更高的检测效率.FIRE-DET模型在自建数据集上进行训练后,最终对火焰检测的准确率和帧率分别达到97%和85 FPS.实验结果表明,与主流算法相比,本文火焰检测模型检测性能更优.本文为解决火焰探测问题提供了一个更通用的解决方案. 相似文献
2.
车道线检测在智能交通领域占有重要地位,其检测的准确度和速度对于辅助驾驶以及自动驾驶有重要影响.针对目前深度学习方法识别车道线精度差、速度慢的问题,提出了一种高效的车道线分割方法LaneSegNet.首先基于编码和解码网络原理构建主干网络Lane-Net,用于提取车道线特征信息并分割出车道线;然后使用多尺度空洞卷积特征融合网络,可以极大地扩充模型的感受野,提取全局特征信息;最后使用混合注意力网络获取丰富的车道线特征,并增强与当前任务相关的信息.实验结果表明:在TuSimple数据集上,该方法检测车道线的准确率为97.6%;在CULane数据集上,该方法在标准路面的检测准确率达到92.5%,多种路面综合检测准确率为75.2%.本文提出的LaneSegNet车道线检测方法分割精确度和推理速度优于其他对比模型,且具有更强的适应性和鲁棒性. 相似文献
3.
针对现有的协同显著性检测算法在多显著目标复杂场景下表现不佳的问题,提出了一种基于高效通道注意力和特征融合的协同显著性检测算法。首先,检测算法利用预训练的深度卷积神经网络对场景进行多尺度特征的提取,结合边缘显著信息设计了显著性语义特征提取模块,以避免全卷积神经网络导致边缘信息的缺失;其次,通过内积基本原理得到组内图片间的关联性信息并根据其关联程度进行自适应加权,结合高效通道注意力层设计了协同特征提取算法;最后,为了将各级高层语义特征经过协同显著性特征提取之后的结果与浅层次的特征进行融合,并实现对预测结果进行多分支同步监督,设计了基于高效通道注意力的特征融合模块。通过对3个经典的数据集进行测试,并与6种现有的协同显著检测算法进行对比,结果表明本文所提算法提高了复杂场景中图像的协同显著性检测的精度以及边缘信息的丰富程度,并具有更优的协同显著性信息检测性能;通过消融实验进一步验证了所提设计算法各个模块的有效性和必要性。 相似文献
4.
由于现有的烟雾检测方法大多依靠手工选取特征,往往不能准确地分割出视频图像中的烟雾区域。基于此,提出了改进的DeeplabV3烟雾分割算法。改进的算法在基础编码器网络后添加了特征细化模块来削弱空洞卷积带来的网格效应;针对烟雾这类尺度和姿态多变的非刚性目标,在带有空洞卷积的空间金字塔模块中引入可变形卷积来更好地学习烟雾的形变;为了进一步恢复烟雾的空间细节,提出了通道注意力解码器模块。在烟雾图片数据集的测试下,改进后的模型平均每张图片的预测时间约达到71.73ms,平均像素精确度约达到97.78%,平均交并比约达到91.21%,精度与DeeplabV3模型相比分别提高了0.56%及2.17%,更加适用于烟雾分割。公开的烟雾视频测试结果表明,该模型的检测率高于现有的视频烟雾检测算法,具有一定的实用价值。 相似文献
5.
针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度差异,影响预测准确性的问题,提出基于多尺度特征与注意力机制的轴承RUL预测方法. 在多个尺度下计算轴承原始振动信号的若干时域和频域特征,作为输入特征集. 将多尺度特征集输入到网络中,以注意力模块为不同特征自适应地分配最佳权重,以卷积神经网络(CNN)模块进行深层特征提取与多尺度特征融合,通过前馈神经网络(FNN)模块映射得到RUL预测值. 通过公开的轴承数据集进行实验验证,与其他RUL预测方法相比,所提方法的预测性能更优越. 相似文献
6.
针对核电安全壳表面裂缝视觉检查任务面临的裂缝细小且占像素少、裂缝与背景对比度低、相似纹理干扰多、光照影响等问题,作者提出了一种细小裂缝分割模型TCS-Net(Segmentation network of tiny cracks)。该模型是编码——解码的网络结构,在下采样过程使用Soft Pooling减少编码过程池化导致的信息损失以保留图像边缘细节及位置信息;解码端在下采样过程中通过加入兼顾通道注意力和空间注意力的语义补偿模块(ResCRAM)以融合编码端的各层特征,可增强裂缝的多尺度细节信息;结合Bce(Binary Cross-Entropy)损失和Dice损失作为目标损失函数,以解决单一损失关注度倾向带来的训练不稳定的问题,也可优化Acc(Accuracy)、IOU(Intersection over Union)、Recall等性能指标。为了验证模型的有效性,在真实的安全壳图像对所提裂缝分割模型进行了测试。实验结果表明,与现有的主流语义分割模型相比,TCS-Net裂缝分割模型的IOU指标可提高5%-9%,Recall指标可提高9%-13%,由此说明该模型具有检测率和检测精度更高,能有效适用于目标与背景严重不平衡、背景复杂且干扰较多情况下的细小裂缝分割任务。 相似文献
7.
由于现有的人员检测算法研究对象主要是室外直立行人,而室内人员姿态多变,且图像拍摄角度与室外行人差别较大,所以使用以往的检测方法得到的效果并不理想。基于此,笔者针对室内人员检测数据集提出了一种高精度检测模型。该模型以RetinaNet网络为基础,在残差网络中引入通道注意力模块,间接实现卷积层的随机失活,增强模型泛化能力;通过维度聚类算法找出锚点的最佳尺寸,并据此找到合适的特征图进行预测。实验表明,这种算法在室内人员检测数据集上检测精度可达99.84%,且在速度和内存占用方面也优于其他算法。 相似文献
8.
针对铝带表面缺陷高精度检测要求以及传统算法识别率不佳的问题,提出端到端的表面缺陷检测与识别方法.从铝带表面初始图像序列中快速计算出平均图像,视为无缺陷背景图像,用于初始化ViBe算法的背景模型.采用ViBe算法从当前图像中分割出缺陷区域,对缺陷区域二值图像进行中值滤波和形态学运算,以去除噪声点和修补边缘,实现缺陷区域的准确提取.利用当前图像实时更新ViBe背景模型,以增加对光照变化的适应能力.提取缺陷外接矩形区域图像,归一化后输入到训练好的卷积神经网络中进行识别分类,得到分类结果.实验结果表明,提出方法的缺陷检出率为93.02%,缺陷识别率为99.86%,具有较好的应用价值. 相似文献
9.
传统的基于视觉的SLAM技术成果颇丰,但在具有挑战性的环境中难以取得想要的效果.深度学习推动了计算机视觉领域的快速发展,并在图像处理中展现出愈加突出的优势.将深度学习与基于视觉的SLAM结合是一个热门话题,诸多研究人员的努力使二者的广泛结合成为可能.本文从深度学习经典的神经网络入手,介绍了深度学习与传统基于视觉的SLAM算法的结合,概述了卷积神经网络(CNN)与循环神经网络(RNN)在深度估计、位姿估计、闭环检测等方面的成就,分析了神经网络在语义信息提取方面的优点,以期为未来自主移动机器人真正自主化提供帮助.最后,对未来VSLAM发展进行了展望. 相似文献
10.
立体匹配可以看作是有监督的学习任务,通过将大量的左右图像输入到卷积神经网络中进行训练,可以获得性能良好的视差图.但是,当前的网络结构对病态区域的视差估计仍然存在困难.为了解决这个问题,提出了一种空间上下文注意力网络,这个网络可以通过聚合全局上下文信息来提高对病态区域的视差估计准确性.实验结果表明,提出的方法在合成数据集... 相似文献
11.
交通流视频检测中背景模型与阴影检测算法 总被引:3,自引:4,他引:3
提出了基于对象级的混合高斯背景模型更新方法与基于RGB颜色变化度的运动阴影检测算法。根据运动分割、物体识别、Kalman运动跟踪等高层语义表达,结合像素的时空特性,进行基于对象级的混合高斯背景更新。克服了像素级混合高斯模型中交通控制信号或交通阻塞等造成的长时间停车以及交通高峰期交通拥挤等情况下对背景抽取造成的影响;根据运动目标的RGB颜色变化度特点,提出自适应的对象级运动阴影检测算法,克服了运动阴影的影响及其造成的误分类。不同交通状态下的视频处理效果表明,该方法具有良好的鲁捧性和自适应性。 相似文献
12.
为了提高高光谱图像在有限训练样本下的分类性能,提出了一种基于双池化注意力机制的高光谱图像分类网络(DPAMN).首先,采用三维卷积提取高光谱图像的空间和光谱浅层信息.其次,为了增强网络的特征提取能力,在DPAMN中引入了一种双池化注意力机制.最后,在网络的深层引入三维卷积密集连接模块,该模块不仅能够充分提取高光谱图像的空间和光谱特征,同时还能提高特征的判别能力.实验结果表明,在Indian Pines、University of Pavia、Salinas以及Houston 2013数据集上分别取得95.45%、97.11%、95.30%以及93.71%的整体平均精度,与目前主流的已有先进方法相比,所提出的方法在4个数据集上均有较大提升,表明所提方法具有较强的泛化能力. 相似文献
13.
为了利用便携式设备准确检测老年人的跌倒状况,针对传统算法中人为设计特征造成的不完备性,构建一种基于卷积神经网络(CNN)的老年人跌倒检测模型. 以智能手机内置的三轴传感器作为数据获取源,将采集的人体姿态信息进行滤波、标准化、采样等操作后,输入到所设计的模型中;采用梯度下降和适应性动量优化方法进行多层卷积神经网络训练和优化,获得模型关键参数训练并优化模型关键参数;利用学习到的深层次特征进行样本分类. 实验结果表明:所设计的模型对于跌倒检测的准确率明显高于一般的机器学习算法模型,并且在对跌倒和非跌倒的区分检测中,精确率和召回率都保持了较高的稳定水平. 相似文献
14.
针对卷积神经网络(CNN)模型的压缩和加速问题,提出基于滤波器裁剪的新型卷积神经网络模型加速算法. 通过计算卷积层中滤波器的标准差值衡量该滤波器的重要程度,裁剪对神经网络准确率影响较小的滤波器及对应的特征图,可以有效地降低计算成本. 与裁剪权重不同,该算法不会导致网络稀疏连接,不需要应用特殊的稀疏矩阵计算库. 基于CIFAR-10数据集的实验结果表明,该滤波器裁剪算法能够对VGG-16和ResNet-110模型加速30%以上,通过微调继承的预训练参数可以使结果接近或达到原始模型的精度. 相似文献
15.
准确的视线注视方向估计是人机交互和虚拟现实等应用场景中的关键技术。基于外观的视线估计是目前的主流方法,然而,因为眼睛外观、光线条件和头部姿态的多样性,所以无约束环境下的视线估计仍然是一个具有挑战性的任务。提出了一种高频信息视线估计网络(HFA-Net)。首先,在神经网络中加入高频信息提取模块和卷积注意力模块(CBAM),帮助网络减少冗余信息的影响;其次,将视线分为两个角度分别进行回归,并使用独立损失函数进行优化;最后,在公开数据集MPIIGaze上进行训练和测试。实验结果表明,该方法在MPIIGaze上取得了4.17°的最佳角度估计误差,超越目前主流算法。 相似文献
16.
LIU Ruyi SONG Jianfeng QUAN Yining XU Pengfei XUE Qing YANG Yun MIAO Qiguang 《西安电子科技大学学报(自然科学版)》2017,44(1):100-105
Road extraction from high-resolution satellite images is very important. Due to image noise, the natural scene complexity, and the extraction algorithms limitations, it still needs to be further researched. In recent years, level set evolution has been used to extract the road, but it is difficult to automatically generate initial level curves for the level set evolution (LSE). In this paper, we propose an automatic approach to the generation of initial level curves and use it to extract the road. Firstly, the convolutional neural network(CNN) is used to classify the road or nonroad, then shape features are adopted to filter nonlinear features to get the accurate road region. And on this basis, we exploit tensor voting to detect the road junctions and utilize them as initial level curves; finally we fuse the results obtained by the CNN and LSE. Experiments show that this algorithm can get an accurate and complete road. 相似文献