首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
人群计数研究普遍使用欧几里得损失函数,易造成图像局部相关性缺失,且现有研究方法未能充分提取人群图像中连续变化的尺度特征,影响了人群计数模型的性能.针对上述问题,该文提出一种基于多尺度增强网络的人群计数模型(MSEN).首先,在多分支结构生成网络中引入区域性判别网络,将二者组合形成嵌入式GAN模块,以增强生成图像的局部相关性;之后,基于金字塔池化结构设计了尺度增强模块,将该模块连接在嵌入式GAN模块之后,进一步从不同区域提取不同尺度的局部特征,以最大程度地应对人群图像局部尺度连续变化的问题,从而增强整体模型的泛化能力.最后,在3个具有挑战性的人群计数公共数据集上进行了广泛的实验.实验结果表明,该文所述模型可有效提升人群计数问题的准确性和鲁棒性.  相似文献   

2.
人群计数研究普遍使用欧几里得损失函数,易造成图像局部相关性缺失,且现有研究方法未能充分提取人群图像中连续变化的尺度特征,影响了人群计数模型的性能。针对上述问题,该文提出一种基于多尺度增强网络的人群计数模型(MSEN)。首先,在多分支结构生成网络中引入区域性判别网络,将二者组合形成嵌入式GAN模块,以增强生成图像的局部相关性;之后,基于金字塔池化结构设计了尺度增强模块,将该模块连接在嵌入式GAN模块之后,进一步从不同区域提取不同尺度的局部特征,以最大程度地应对人群图像局部尺度连续变化的问题,从而增强整体模型的泛化能力。最后,在3个具有挑战性的人群计数公共数据集上进行了广泛的实验。实验结果表明,该文所述模型可有效提升人群计数问题的准确性和鲁棒性。  相似文献   

3.
在人群计数中,针对尺度变化、行人分布不均以及夜间较差成像条件,提出了一种基于RGBT(RGB-Thermal)图像的多模态人群计数算法,称为双流残差扩张网络,它由前端特征提取网络、多尺度的残差扩张卷积模块和全局注意力模块所构成。其中,前端网络用来提取RGB特征和热特征,扩张卷积模块进一步提取不同尺度的行人特征信息,全局注意力模块用来建立全局特征之间的依赖关系。此外,还引入了一种新的多尺度差异性损失,以提高网络的计数性能。为评估该方法,在RGBTCC(RGBT Crowd Counting)数据集和DroneRGBT数据集上进行了对比实验。实验结果表明,在RGBTCC数据集上与CMCRL(Cross-modal Collaborative Representation Learning)算法相比该算法的GAME(0)(Grid Average Mean absolute Errors)和RMSE(Root Mean Squared Error)分别降低了0.8和3.49,在DroneRGBT数据集上与MMCCN(Multi-Modal Crowd Counting Network)算法比...  相似文献   

4.
在人群计数中,针对尺度变化、行人分布不均以及夜间较差成像条件,提出了一种基于RGBT(RGB-Thermal)图像的多模态人群计数算法,称为双流残差扩张网络,它由前端特征提取网络、多尺度的残差扩张卷积模块和全局注意力模块所构成。其中,前端网络用来提取RGB特征和热特征,扩张卷积模块进一步提取不同尺度的行人特征信息,全局注意力模块用来建立全局特征之间的依赖关系。此外,还引入了一种新的多尺度差异性损失,以提高网络的计数性能。为评估该方法,在RGBTCC(RGBT Crowd Counting)数据集和DroneRGBT数据集上进行了对比实验。实验结果表明,在RGBTCC数据集上与CMCRL(Cross-modal Collaborative Representation Learning)算法相比该算法的GAME(0)(Grid Average Mean absolute Errors)和RMSE(Root Mean Squared Error)分别降低了0.8和3.49,在DroneRGBT数据集上与MMCCN(Multi-Modal Crowd Counting Network)算法比...  相似文献   

5.
现有基于深度学习的远红外图像行人检测方法对计算力要求高,需要高功耗GPU计算平台,应用于嵌入式平台时,无法满足实时性和准确率需求。针对该问题,本文提出了一种新型实时红外行人检测方法,该方法使用MobileNet作为YOLOv3模型中的基础网络,辅助预测网络层以深度可分离卷积替换标准卷积,将模型改进为轻量红外行人检测模型。基于新方法构建的模型采用CVC红外行人训练集离线训练,并部署于嵌入式平台,实现红外行人在线实时检测。实验结果表明,与改进前方法相比,模型大小为65 M,约为YOLOv3的27%,新模型在基本保证原有准确率的同时,大幅降低了计算量,在同一平台下的检测速度从3FPS提升到了11FPS,可满足大部分嵌入式系统对行人检测的实时性需求。  相似文献   

6.
人群自动计数问题在视频监控领域引起了广泛关注。近年来,卷积神经网络(CNN)模型在人群计数方面取得了良好效果。然而,当前对于基于深度学习的人群计数的研究主要停留在PC端上对单幅静止图片的人群计数,网络模型参数量巨大,网络结构复杂,消耗的计算资源巨大,难以部署于实际的监控视频人群计数系统。因此,本文采用深度学习的方法,通过对网络模型进行裁剪压缩,同时使用TensorRT对模型进行加速,在嵌入式平台上实现了接近实时的人群计数。提出的人群计数平均绝对误差(MAE)为21.6且平均每秒帧数(FPS)为22,在精确度和速度方面达到了一个很好的平衡,在嵌入式平台上运行速度较快,能达到实时的效果。  相似文献   

7.
雷翰林  张宝华 《激光技术》2019,43(4):476-481
为了避免景深和遮挡的干扰, 提高人群计数的准确性, 采用了LeNet-5, AlexNet和VGG-16 3种模型, 提取图像中不同景深目标的特性, 调整上述模型的卷积核尺寸和网络结构, 并进行了模型融合。构造出一种基于多模型融合的深度卷积神经网络结构, 网络最后两层采用卷积核大小为1×1的卷积层取代传统的全连接层, 对提取的特征图进行信息整合并输出密度图, 极大地降低了网络参量且取得了一定提升的数据, 兼顾了算法效率和精度, 进行了理论分析和实验验证。结果表明, 在公开人群计数数据集shanghaitech两个子集和UCF_CC_50子集上, 本文中计数方法的平均绝对误差和均方误差分别是97.99和158.02, 23.36和41.86, 354.27和491.68, 取得比现有传统人群计数方法更好的性能; 通过迁移实验证明所提出的人群计数模型具有良好的泛化能力。该研究对人群计数精度的提高是有帮助的。  相似文献   

8.
针对现有车道线检测算法在实际应用中难以平衡检测精度和速度的问题,提出一种全新的基于ARM嵌入式平台的车道线检测算法。首先,设计一个轻量化语义分割网络,在优化SegNet结构的同时在网络第一层加入跳跃连接,并且在每两个卷积层后加入通道注意力机制模块,在保证检测精度的同时提升检测速度。接着,构建卡尔曼滤波车道线跟踪模型,提高检测在视频流中的鲁棒性。然后,重构编码器,对模型轻量化处理,使用深度可分离卷积代替传统的卷积以减少计算成本,提升检测速度。最后,利用TensorRT加速推理,生成Trt模型,方便其部署在ARM嵌入式平台中实现实时车道线检测。在自行制作的Tusimeple扩充数据集上的实验结果表明,所提出的算法能够应对各种复杂交通场景,检测精度达到98.03%,优于其他算法,并且其检测速度达到了50 FSP,满足实时性检测要求。本算法在复杂交通场景下具有较高的鲁棒性和有较好的实时性,具有一定的理论价值和实际应用价值。  相似文献   

9.
罗海波  何淼  惠斌  常铮 《红外与激光工程》2018,47(2):203001-0203001(8)
在近距离行人检测任务中,平衡算法的检测精度与检测速度对于检测算法的实际应用有着重要意义。为了快速并准确地检测出近景行人目标,提出了一种基于模型融合全卷积网络的行人检测算法。首先,通过全卷积检测网络对图像中的目标进行检测,得到一系列候选框;其次,通过弱监督训练的语义分割网络得到图像的像素级分类结果;最后,将候选框与像素级分类结果融合,完成检测。实验结果表明:算法在检测速度与精度方面都具有较高的性能。  相似文献   

10.
针对复杂道路场景下行人检测精度与速度难以提升的问题,提出一种融合多尺度信息和跨维特征引导的轻量级行人检测算法。首先以高性能检测器YOLOX为基础框架,构建多尺度轻量卷积并嵌入主干网络中,以获取多尺度特征信息。然后设计了一种端到端的轻量特征引导注意力模块,采用跨维通道加权的方式将空间信息与通道信息融合,引导模型关注行人的可视区域。最后为减少模型在轻量化过程中特征信息的损失,使用增大感受野的深度可分离卷积构建特征融合网络。实验结果表明,相比于其他主流检测算法,所提算法在KITTI数据集上达到了71.03%的检测精度和80 FPS的检测速度,在背景复杂、密集遮挡、尺度不一等场景中都具有较好的鲁棒性和实时性。  相似文献   

11.
沈宁静  袁健 《电子科技》2022,35(6):6-12
现有人群计数算法采用多列融合结构来解决单一图像的多尺度问题,但该处理方法不能有效利用低层特征信息,从而导致最终人群计数结果不准确。针对这一缺陷,文中提出一种基于残差密集连接与注意力融合的人群计数算法。该算法的前端利用改进VGG16网络提取低级特征信息。算法后端主分支基于残差密集连接结构,利用残差网络和密集网络结合方式捕获层与层间的特征信息,可高效捕获多尺度信息。侧分支通过引入注意力机制,生成对应尺度注意力图,有效区分特征图的背景和前景,降低了背景噪声的影响。采用3个主流公开数据集对该算法进行验证。实验结果表明,该算法计数有效且计数准确率优于其他算法。  相似文献   

12.
密集人群计数是计算机视觉领域的一个经典问题,仍然受制于尺度不均匀、噪声和遮挡等因素的影响.该文提出一种基于新型多尺度注意力机制的密集人群计数方法.深度网络包括主干网络、特征提取网络和特征融合网络.其中,特征提取网络包括特征支路和注意力支路,采用由并行卷积核函数组成的新型多尺度模块,能够更好地获取不同尺度下的人群特征,以...  相似文献   

13.
Crowd counting is a challenging task, which is partly due to the multiscale variation and perspective distortion of crowd images. To solve these problems, an improved deep multiscale crowd counting network with perspective awareness was proposed. This network contains two branches. One branch uses the improved ResNet50 network to extract multiscale features, and the other extracts perspective information using a perspective-aware network formed by fully convolutional networks. The proposed network structure improves the counting accuracy when the crowd scale changes, and reduce the influence of perspective distortion. To accommodate various crowd scenarios, data-driven approaches are used to fine-tune the trained convolutional neural networks (CNN) model of the target scenes. The extensive experiments on three public datasets demonstrate the validity and reliability of the proposed method.  相似文献   

14.
针对现有关于车载限速牌识别算法所存在的检测速度慢、准确率低、无法应用于嵌入式系统等问题,提出了一种基于网络的实时限速牌识别算法。该算法基于SSD_MobileNet_v1网络框架进行改进,对原来的网络进行架构裁剪以去除冗余结构;同时引入了特征金字塔网络结构,并使用focal loss作为网络训练的分类损失。实验表明,提出的识别算法准确率可达88.11%,虽然略低于目前主流目标检测算法的检测精度,但是网络的每秒帧率(Frame per Second,FPS)可以达到35.13,拥有较快的检测速度,而权重文件只有24 MB 。因此,与其他算法相比,该算法不仅适合小型的嵌入式人工智能(Artifical Intelligence,AI)设备,而且更贴近真实车载场景下的识别。  相似文献   

15.
Crowd counting algorithms have recently incorporated attention mechanisms into convolutional neural networks (CNNs) to achieve significant progress. The channel attention model (CAM), as a popular attention mechanism, calculates a set of probability weights to select important channel-wise feature responses. However, most CAMs roughly assign a weight to the entire channel-wise map, which makes useful and useless information being treat indiscriminately, thereby limiting the representational capacity of networks. In this paper, we propose a multi-scale and spatial position-based channel attention network (MS-SPCANet), which integrates spatial position-based channel attention models (SPCAMs) with multiple scales into a CNN. SPCAM assigns different channel attention weights to different positions of channel-wise maps to capture more informative features. Furthermore, an adaptive loss, which uses adaptive coefficients to combine density map loss and headcount loss, is constructed to improve network performance in sparse crowd scenes. Experimental results on four public datasets verify the superiority of the scheme.  相似文献   

16.
干扰对齐技术是未来移动通信系统提高网络容量的一种可能的技术手段,也是目前干扰消除技术的研究热点。现存的研究结果中没有一种准则能够在所有信噪比条件下性能均优于其他算法。在对已有算法进行深入研究的基础上,提出一种自适应选择机制,该机制可以使通信双方根据当前通信条件选择最优准则实现干扰对齐。仿真结果表明,本文所提算法与单一算法相比,在获取相同数据速率的条件下最大可获得5 dB的信噪比增益。  相似文献   

17.
In this paper, a novel adaptive transmit-receive scheme is presented for indoor Direct Sequence Ultra-WideBand (DS-UWB) systems. In the proposed scheme, a simple switch module is introduced to improve the system throughput. Furthermore, adaptive detection is implemented via an improved Least Mean Squares (LMS) algorithm. The convergence behavior and the Bit Error Rate (BER) performance of the proposed scheme are examined under the realistic channel models. Simulation results show that, nearly without loss of the BER performance, the proposed scheme can obtain at least 2/3 improvement in training overhead compared with the conventional approach.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号