首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
基于序的空间金字塔池化网络的人群计数方法   总被引:6,自引:0,他引:6  
视频中的人群计数在智能监控领域具有重要价值. 由于摄像机透视效果、图像背景、人群密度分布不均匀和行人遮挡等干扰因素的制约, 基于底层特征的传统计数方法准确率较低. 本文提出一种基于序的空间金字塔池化(Rank-based spatial pyramid pooling, RSPP)网络的人群计数方法. 该方法将原图像分成多个具有相同透视范围的子区域并在各个子区域分别取不同尺度的子图像块, 采用基于序的空间金字塔池化网络估计子图像块人数, 然后相加所有子图像块人数得出原图像人数. 提出的图像分块方法有效地消除了摄像机透视效果和人群密度分布不均匀对计数的影响. 提出的基于序的空间金字塔池化不仅能够处理多种尺度的子图像块, 而且解决了传统池化方法易损失大量重要信息和易过拟合的问题. 实验结果表明, 本文方法相比于传统方法具有准确率高和鲁棒性好的优点.  相似文献   

2.
虽然高质量高分辨率的深度图能够显著地提高各种自然场景计算机视觉任务的性能,但是深度相机硬件的限制使得消费级深度相机拍摄到的深度图存在分辨率低、质量差和无效空洞等问题。深度图超分辨率重建(depth super-resolution reconstruction,DSR)是一种能有效提高深度图分辨率和质量的技术,并且DSR已经成为计算机视觉领域的研究热点。首先将介绍DSR的定义和近几年国内外DSR算法的研究进展,然后对深度学习DSR重建算法进行重点阐述与分析。接下来,将介绍深度图像质量评估准则。最后,对DSR的应用领域和未来所面对的挑战和机遇进行展望。  相似文献   

3.
针对经典循环卷积神经网络(RCNN)在池化层采用的最大池化策略较为单一,会忽略除最突出特征外的其他特征,影响分类精度的问题,提出基于多头注意力池化的循环卷积神经网络(MHAP-RCNN)模型.多头注意力池化可以充分考虑各特征对分类的贡献,且能在训练过程中动态优化,有效缓解最大池化的单一性问题.在三个公开的文本分类数据集...  相似文献   

4.
为解决随机池化中零元素概率为0导致不能被选择的问题,提出一种改进的混合概率随机池化方法。将池化域中的元素去重复并按升序排序,然后加上对应次序的幂次,得到元素的权重概率。在此基础上,根据多项分布取样给出池化值。在数据集MNIST、CIFAR-10、CIFAR-100上进行实验,结果表明,该方法在3种数据集上的分类准确率分别为99.50%、72.25%、39.05%,相较于传统池化方法具有较好的分类效果与稳健性。  相似文献   

5.
《软件》2018,(1):29-34
作为计算机视觉领域的一个重要分支,场景分类在许多场所有着重要和广泛的应用。由于场景的整体布局、目标物体的出现以及位置关系的变化等因素使得整体场景更加多样化,然而,利用场景与目标间的语义信息可以有效克服这个问题。本文提出一种同时利用卷积神经网络与语义信息来进行场景分类的方法,该方法首先利用卷积神经网络获取颜色信息对场景进行初始分类,然后利用图像目标物体与场景间的语义信息对分类结果进行修正。我们与目前流行的场景分类方法进行了实验对比,实验结果表明与利用海量训练数据集得到好的分类效果的方法相比,本文方法利用有限的训练数据集的情况下,仍能取得良好的分类效果。  相似文献   

6.
卷积神经网络中的池化操作可以实现图像变换的缩放不变性,并且对噪声和杂波有 很好的鲁棒性。针对图像识别中池化操作提取局部特征时忽略了隐藏在图像中的能量信息的问 题,根据图像的能量与矩阵的奇异值之间的关系,并且考虑到图像信息的主要能量集中于奇异值 中数值较大的几个,提出一种矩阵2-范数池化方法。首先将前一卷积层特征图划分为若干个互不 重叠的子块图像,然后分别计算子块图像矩阵的奇异值,将最大奇异值作为每个池化区域的统计 结果。利用5 种不同的池化方法在Cohn-Kanade、Caltech-101、MNIST 和CIFAR-10 数据集上进 行了大量实验,实验结果表明,相比较于其他方法,该方法具有更好地识别效果和稳健性。  相似文献   

7.
《计算机工程》2017,(11):252-260
在深度图像采集场景下,为利用场景高分辨色彩图进行超分辨率上采样,提出一种采用卷积神经网络自适应学习局部滤波器核的算法,通过同时应用稠密/高分辨率颜色信息和稀疏/低分辨率深度信息全面提取场景信息。在Middlebury和ToFMark数据集上的实验结果表明,与传统深度超分辨率算法相比,提出的算法能够取得较好的超分辨率结果,尤其在颜色和深度的边缘、纹理不匹配区域,具有更好的鲁棒性。  相似文献   

8.
9.
10.
11.
近年来,将卷积神经网络推广到图数据上的图卷积神经网络引起了广泛关注,主要包括重新定义图的卷积和池化操作.由于图数据只能表达二元关系的局限性,使其在实际应用中表现欠佳.相比之下,超图能够捕获数据的高阶相关性,利用其灵活的超边易于处理复杂的数据表示.然而,现有的超图卷积神经网络还不够成熟,目前尚无有效的超图池化操作.因此,提出了带有自注意机制的超图池化网络,使用超图结构建模,通过引入自注意力的超图卷积操作学习带有高阶数据信息的节点隐藏层特征,再经过超图池化操作选择并保留在结构和内容上的重要节点,进而得到更准确的超图表示.在文本分类、菜肴分类和蛋白质分类任务上的实验结果表明:与目前多种主流方法相比,该方法均取得了更好的效果.  相似文献   

12.
为了更有效地对多标记图像进行分类,提出一个改进的卷积神经网络模型,通过融合多层次特征并利用空间金字塔池化来学习多标记图像中的多尺度特征,同时设计对抗网络生成新的样本辅助模型训练.首先,对传统卷积神经网络模型进行改进,利用空间金字塔池化层替换网络的最后一层,并将在ImageNet上预先训练好的参数传递给该模型;然后,通过将深层特征和浅层特征进行融合,使得模型对不同尺度的物体具有更好的识别能力;最后,设计了一个对抗网络生成带遮挡的样本,使模型对遮挡物体的识别也具有良好的鲁棒性.实验测试在2个基准数据集上进行,文中模型在Corel5K数据集上的平均查准率和平均查全率分别为0.457和0.427,mAP值达到0.442,而在PASCAL VOC 2012数据集上的mAP值则达到0.85.实验结果表明,与当前国际先进的模型相比,该模型具有更好的有效性和更强的鲁棒性.  相似文献   

13.
基于深度残差网络图像分类算法研究综述   总被引:2,自引:0,他引:2  
近年来,由于计算机技术的飞速迅猛发展,特别是硬件条件的改善,计算能力不断提高,深层神经网络训练的时间大大缩短,深度残差网络也迅速成为一个新的研究热点.深度残差网络作为一种极深的网络架构,在精度和收敛等方面都展现出了很好的特性.研究者们深入研究其本质并在此基础上提出了很多关于深度残差网络的改进,如宽残差网络,金字塔型残差网络,密集型残差网络,注意力残差网络等等.本文从残差网络的设计出发,分析了不同残差单元的构造方式,介绍了深度残差网络不同的变体.从不同的角度比较了不同网络之间的差异以及这些网络架构在常用图像分类数据集上的性能表现.最后我们对于这些网络进行了总结,并讨论了未来深度残差网络在图像分类领域的一些研究方向.  相似文献   

14.
Few-shot semantic segmentation aims at training a model that can segment novel classes in a query image with only a few densely annotated support exemplars.It remains a challenge because of large intra-class variations between the support and query images.Existing approaches utilize 4D convolutions to mine semantic correspondence between the support and query images.However,they still suffer from heavy computation,sparse correspondence,and large memory.We propose axial assembled correspondence n...  相似文献   

15.
在公共安全领域,基于图像的人群计数具有重要的社会意义和应用前景,难题在于人群遮挡、密度分布不均、背景噪声和人在场景中的尺度和外观变化范围大。提出一种深度卷积神经网络结构,一方面使用类似于VGG16的网络结构来学习图片中的深层语义信息,另一方面使用多列神经网络来学习各种头部尺寸的特征信息。将拥有不同大小感受野和深度的分支网络得到的特征图融合在一起,可有效地收集到图片中的底层细节特征和高层语义信息。通过将这两部分结合在一起计算人群数量。在ShanghaiTech数据集上测试,Part_A和Part_B的平均绝对误差分别为72.0和10.1;Part_A和Part_B的均方误差分别为107.9和16.0。  相似文献   

16.
文本分类任务是自然语言处理领域内一个重要的研究问题.近年来,因处理复杂网络结构的出色能力,图神经网络模型(Graph Neural Network,GNN)受到广泛关注并被引入到文本分类任务中.在之前的研究中,基于图卷积网络(Graph Convolu-tional Neural Network,GCN)的分类模型使用...  相似文献   

17.
针对目前食物识别系统中网络模型参数量多、模型较大的问题,提出一种23层结构、参数量只有204k的网络模型,使用基本构造块(7×7、5×5、3×3)生成特征图,用不同感受野的2个池化层来融合卷积层的特征图,再用1×1的卷积核进行非线性组合,然后连接到空间金字塔池化层,最后在softmax分类器中分类.在公开数据集上的实验...  相似文献   

18.
心脏听诊是先心病初诊和筛查的主要手段。传统心音分类算法普适性差,过程复杂,不利于将来实时化决策。采用1 800个心音信号对几种时间序列分类的主流深度学习网络进行训练,结果显示循环神经网络易出现过拟合;长短时记忆网络分类损失值0.257,准确率0.872;卷积神经网络损失值0.25,准确率0.896。实验表明卷积神经网络相比较其他两种网络具备更大的潜力。基于卷积神经网络的先心病分类算法,因训练样本量大,使网络普适性得到了保证。与其他分类器相比,CNN的另一个优势是其可自动提取特征。该研究有望用于机器辅助听诊。  相似文献   

19.
温静  杨洁 《计算机工程》2023,49(2):222-230
现有单目深度估计算法主要从单幅图像中获取立体信息,存在相邻深度边缘细节模糊、明显的对象缺失问题。提出一种基于场景对象注意机制与加权深度图融合的单目深度估计算法。通过特征矩阵相乘的方式计算特征图任意两个位置之间的相似特征向量,以快速捕获长距离依赖关系,增强用于估计相似深度区域的上下文信息,从而解决自然场景中对象深度信息不完整的问题。基于多尺度特征图融合的优点,设计加权深度图融合模块,为具有不同深度信息的多视觉粒度的深度图赋予不同的权值并进行融合,融合后的深度图包含深度信息和丰富的场景对象信息,有效地解决细节模糊问题。在KITTI数据集上的实验结果表明,该算法对目标图像预估时σ<1.25的准确率为0.879,绝对相对误差、平方相对误差和对数均方根误差分别为0.110、0.765和0.185,预测得到的深度图具有更加完整的场景对象轮廓和精确的深度信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号