首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
近年来人体姿态估计已成为计算机视觉领域的热门研究方向,堆叠沙漏网络是人体姿态估计领域中最具代表性的研究成果之一,但该网络对于图像细节特征的提取能力较差。为增强网络对细节特征的处理能力,本文提出了基于改进沙漏网络的人体姿态估计模型。该模型使用ResNet50提取高质量的图像底层特征,用步长为2的3×3卷积核代替maxpooling进行下采样,最大程度保留原有图像信息;考虑到不同分辨率下的特征丰富度具有一定差异性,使用不同的残差模块对不同分辨率的feature map进行处理,增强网络对特征的学习能力;最后使用反卷积最大化还原原始图像的局部特征。实验结果显示,本文模型在COCO测试集上的平均精度达到74.1%,比堆叠沙漏网络高出4.7%,检测精度有较大提升。  相似文献   

2.
堆栈沙漏网络(SHN)是人体姿态估计中的代表性研究成果,但该网络忽略了关节局部信息.因此,提出了一种基于改进沙漏网络的人体姿态估计模型.首先,利用多个残差模块及步长为2的卷积层获取低层次到高层次的特征,同时随着网络层数的加深,相应调整残差模块的数目和通道数,以突出局部细节特征信息.然后,为了提取遮挡部位的纹理和形状等局部特征,融合了在线困难关键点挖掘模块.最后,采用反卷积最大化恢复原始的局部特征.实验结果表明,本模型在COCO数据集上的平均精度达到了74.6%,总参数量为1.5×107,比叠加8个SHN(8-SNH)的平均精度高5.1个百分点,且其总参数量仅为8-SNH的1/3.  相似文献   

3.
基于视觉的非合作空间目标3维姿态估计,关键在于建立观测图像与目标模型的特征关联。当前方法往往通过采用复杂的多维特征、产生候选关联结果的方式确保特征关联的准确性,难以兼顾算法效率。为解决以上问题,该文提出一种结合深度学习技术的姿态估计方法,首先通过深度神经网络得到姿态初值,然后基于姿态初值建立图像和目标模型之间的特征关联,进而求解目标姿态。所提方法中,深度神经网络提供了稳定的姿态初值,缩小了特征关联的候选空间;在姿态初值的支撑下采取了更为高效的特征提取与匹配方法。仿真实验表明,该文方法相比于现有方法更好地兼顾了算法准确率和效率。  相似文献   

4.
随着软件在高度综合化系统中的作用日益凸显,软件质量预测成为了提高系统可靠性的有效手段。针对软件质量预测所用数据集常见的样本不足和特征冗余的问题,提出了一种基于改进堆叠自编码(SAE)网络的软件质量预测方法。首先,引入条件生成对抗网络(CGAN)来扩展数据样本。然后,使用SAE网络进行特征降维,并利用粒子群算法(PSO)优化网络结构,改善训练过程易陷入局部最优的问题。之后,结合softmax分类器完成软件质量预测。最后,通过实际机载软件项目数据仿真结果,验证了所提预测网络结构的有效性。  相似文献   

5.
针对传统热图回归使用的均方误差(MSE)损失函数训练热图回归网络的精度不高且训练缓慢的问题,本文提出了用于热图回归的损失函数Heatmap Wing Loss(HWing Loss)。该损失函数对于不同的像素值有不同的损失函数值,前景像素的损失函数梯度更大,可以使网络更加关注前景像素,使热图回归更加准确快速。同时根据热图分布特性,使用基于高斯分布的关键点推理方法减小热图推断关键点时的量化误差。以此两点为基础,构造新的基于关键点定位的单目标姿态估计的算法。实验结果表明,相比于使用MSE Loss的算法,使用HWing Loss的姿态估计算法有更高的ADD(-S)准确率,在LINEMOD数据集上达到了88.8%,性能优于近期其他的基于深度学习的姿态估计算法。本文算法在RTX3080 GPU上最快能以25 fps的速度运行,兼具速度与性能优势。  相似文献   

6.
叶俊  张云 《光电子.激光》2022,(12):1306-1314
目前,常见的三维(3D)人体姿态估计算法在表征学习上取得很好的效果,但是在人体骨架关节点处依然存在估计精度不佳等问题,因此,如何从单目RGB图像中利用冗余的二维(2D)姿态序列时空信息来估计人体姿态的有效方式是一个研究的难点。本文提出一种基于时空多特征融合网络的三维人体姿态估计算法,具体是结合一种图像外观信息和运动时序信息时空多特征融合层级方法,该方法利用一种紧凑的卷积神经网络(convolutional neural network, CNN)学习时空信息将二维关节点位置信息建模为三维关节点位置。实验结果表明,本文所提出的方法能实现较为先进的端对端姿态估计精度,而且不需要任何后处理阶段的姿态优化方法,本文得到的姿态估计在平均精度上得到有效的提升,证明本文方法能够有效提高人体姿态估计的准确性。  相似文献   

7.
空间目标姿态估计是有效实现各类航天任务的重要前提,基于空间光学观测图像的目标姿态估计关键一环在于快速准确地建立起观测图像与空间目标之间的“二维特征点-三维实体结构”映射关系。传统的方法往往将这一任务分解为特征提取和特征关联两个步骤序贯进行,然而在空间目标光学观测场景中,高动态的光照变化和目标的相对高速运动特点会显著降低图像特征提取的可靠性,影响后续特征关联匹配的正确率并最终降低对空间目标的姿态估计精度。针对这一问题,本文提出了一种基于语义关键点提取的光学图像空间目标姿态估计方法,利用Hourglass网络端到端地提取包含语义信息的关键点,直接实现了光学图像中二维特征点与目标三维实体结构的关联映射,并在此基础上利用EPnP算法求解待估计的目标姿态值。实验结果表明,本文所提的方法能较好地兼顾算法精度与效率,其在仿真数据集上的姿态估计最小误差为0.83°,且在数据降质的情况下平均误差依然优于传统方法。   相似文献   

8.
近年来,随着深度学习技术的发展,基于深度学习的2D人体姿态估计展现出了极其优异的效果。文章主要对2014年以来基于深度学习的2D人体姿态估计相关内容进行了分析和评述,包括对主流方法的介绍和对数据集评价指标的总结对比,最后还讨论了2D人体姿态估计的未来研究方向。  相似文献   

9.
10.
基于深度图的3D手部姿态估计通常需要大量人工标注数据以达到高精确度和鲁棒性,然而关节点标注过程冗杂且存在一定误差.现有研究工作使用自监督方法解决对标注数据的依赖,通过在虚拟数据集上预训练网络,并在无标注的真实数据集上进行模型拟合,实现3D姿态估计.自监督方法的关键在于设计模型拟合的能量函数以减小模型在真实数据集上的精度下降程度.为了减小模型拟合难度,本文提出局部深度一致性损失,依据初始姿态估计结果,提取输入与输出深度图的局部表征,将深度图显式地解耦为以关节点为中心的不同区域.通过有针对性地对不同关节点进行局部优化,减少虚拟与真实深度图之间的固有领域误差对网络学习的影响,增加训练的稳定性.本文方法在NYU数据集上相比基础方法平均关节点误差提升了21.9%.  相似文献   

11.
为了解决无线网络中流量的预测精度不高的问题,提出了一种自适应分组的栈式自编码( AG-SAEs)深度学习预测方法。在数据的预处理过程中,首先使用最大最小方式对数据进行归一化处理,并提出一种新型的自适应分组方法,把归一化后的链路数据进行关联性分组;然后,基于深度学习方法建立了一个多输入多输出的预测模型,并将分组后的数据输入到预测模型中,对该模型进行训练来建立输入和输出流量之间的映射关系;最后,为了进一步提高预测精度,在模型的训练过程中,使用改进型的牛顿法来进行权值参数更新。仿真实验以及和其他算法对比的结果证实了所提方案具有更小的预测相对误差。  相似文献   

12.
基于深度学习的光网络流量诊断与预测等场景中,由于保密等原因,光链路的流量数据采集和存储工作受限。针对数据量少而无法支撑深度学习的问题,文章提出了一种基于拓扑链路识别的光网络流量数据合成算法,其核心思想是在生成对抗网络框架下,联合基于光网络拓扑的条件生成模型和基于光网络流量的数据合成模型,以自监督的方式合成指定光链路的流量数据。仿真结果表明,所提算法合成的光网络流量数据在自相关系数指标上与真实数据接近且使得基于全连接神经网络的流量预测模型准确率达到95%以上。  相似文献   

13.
深度学习就是机器学习研究的过程,主要通过模拟人脑分析学习的过程对数据进行分析。目前,深度学习技术已经在计算机视觉、语音识别、自然语言处理等领域获得了较大发展,并且随着该技术的不断发展,为网络流量分类和异常检测带来了新的发展方向。移动智能手机与大家的生活息息相关,但是其存在的安全问题也日益凸显。针对传统机器学习算法对于流量分类需要人工提取特征、计算量大的问题,提出了基于卷积神经网络模型的应用程序流量分类算法。首先,将网络流量数据集进行数据预处理,去除无关数据字段,并使数据满足卷积神经网络的输入特性。其次,设计了一种新的卷积神经网络模型,从网络结构、超参数空间以及参数优化方面入手,构造了最优分类模型。该模型通过卷积层自主学习数据特征,解决了传统基于机器学习的流量分类算法中的特征选择问题。最后,通过CICAndmal2017网络公开数据集进行模型测试,相比于传统的机器学习流量分类模型,设计的卷积神经网络模型的查准率和查全率分别提高了2.93%和11.87%,同时在类精度、召回率以及F1分数方面都有较好的提升。  相似文献   

14.
马乐  陈峰  李敏 《激光与红外》2020,50(2):246-251
由于硬件成本和拍摄条件等限制,很难直接获取高分辨率红外图像。生成对抗网络可以实现红外图像的超分辨率重建,但仍存在训练不稳定,训练时不收敛等不足。针对这些问题,本文使用Wasserstein距离代替KL散度,结合图像间的欧式距离构造新的损失函数,优化原有网络结构和算法流程,使网络更准确地学习低分辨率图像与重建图像的对应特征映射关系,网络训练更加稳定。实验结果表明,重建图像的边缘过渡平缓,目标细节得到有效保证,并获得了更好的客观评价结果。  相似文献   

15.
针对舞蹈视频图像中动作复杂多变、连贯性强、遮挡问题严重等问题,文中结合先进的舞蹈动作识别技术发展方向及其应用场景,同时考虑到彩色图像处理中计算机处理负载过重的问题,设计了一种基于2D姿势估计的高动态舞蹈动作识别方法。该方法主要分为模板建立与姿势估计两个部分,主要涉及的处理操作有图像预处理、模板特征提取和模板匹配这三种。验证测试结果表明,训练集图像经过灰度化与阈值化后,即可获得图像中前景舞者的图形,再利用Kinect人体模型提取动作特征信息。由于考虑到拍摄角度等原因导致的特征差异,将描述同一动作的多张训练图的特征信息保存在同一信息矩阵中,可进一步提高动作识别的准确性。  相似文献   

16.
Traffic matrix (TM) is extremely important in many networking operations. This paper proposes a novel approach of TM estimation in large‐scale IP networks, termed as Advanced‐Tomogravity method, which is based on a precise gravity model and the tomography method. First, the precise gravity model is proposed on the basis of the existing generalized gravity model by introducing a relativity factor vector parameter, which defines the relativity between the solution of the existing generalized gravity model and its real TM. The solution obtained from this precise gravity model is then refined by the basic model of the tomography method. By mathematical analysis, we give the explicit expression of the relativity factor vector parameter in the proposed precise gravity model by the Moore–Penrose inverse and the minimum‐norm least‐square solution. The vector parameter is subsequently determined with the aid of small amount of historical real data of TM. A general algorithm of the proposed approach is therefore designed. Finally, our approach is validated by simulation using the real data of the Abilene Network. The simulation results indicate that it reduces the relative errors to less than one‐half, better tracks not only the dynamic fluctuations but also the overall mean behavior of traffic flow. Copyright © 2014 John Wiley & Sons, Ltd.  相似文献   

17.
Hand Pose Estimation aims to predict the position of joints on a hand from an image, and it has become popular because of the emergence of VR/AR/MR technology. Nevertheless, an issue surfaces when trying to achieve this goal, since a hand tends to cause self-occlusion or external occlusion easily as it interacts with external objects. As a result, there have been many projects dedicated to this field for a better solution of this problem. This paper develops a system that accurately estimates a hand pose in 3D space using depth images for VR applications. We propose a data-driven approach of training a deep learning model for hand pose estimation with object interaction. In the convolutional neural network (CNN) training procedure, we design a skeleton-difference loss function, which effectively can learn the physical constraints of a hand. Also, we propose an object-manipulating loss function, which considers knowledge of the hand-object interaction, to enhance performance.In the experiments we have conducted for hand pose estimation under different conditions, the results validate the robustness and the performance of our system and show that our method is able to predict the joints more accurately in challenging environmental settings. Such appealing results may be attributed to the consideration of the physical joint relationship as well as object information, which in turn can be applied to future VR/AR/MR systems for more natural experience.  相似文献   

18.
针对城市路网交通流数据的空间相关性、非线性和平稳与非平稳的特点,提出一种采用基于交通流量数据相关性分析改进的路网聚类算法与基于交通流量分段加权适应度函数的粒子群小波神经网络算法(MC-MPSOWNN)相结合的预测方法,来提高算法的预测精度.首先,利用基于交通流量数据相关性分析的路网聚类算法筛选出空间中与预测点交通流量数据相关系数高的其他观测点,以此精简了样本输入数据,减少冗余数据对预测精度的干扰,提高整体预测精度;其次,再构建一种新型的粒子群算法的适应度函数,给予整体预测样本中非平稳数据段更大的调节力度,以此来进一步提高非平稳数据段的预测精度.最后经实验结果分析,提出的改进预测算法相比未进行改进前预测算法而言,明显提高了整体及非平稳数据段预测精度,达到较好的预测效果.  相似文献   

19.
Since falls of the elderly can easily cause serious health problems in daily life, fall detection has received the attention of researchers. Traditionally, wearable sensors have been used to detect whether a person has fallen. However, wearable sensors may bring inconvenience to users' activities and affect user experience. In this paper, a fall detection approach based on RFID is proposed. In the proposed approach, non-contact passive tags are used to construct an array of tags. Fall detection will be performed without the user wearing the device. The RSSI and phase data are collected when the reader queries the tags. Furthermore, an action segmentation algorithm is designed to quickly extract human action information based on the short-term variance change of the phase signal. Subsequently, a deep residual network is built to classify fall movements and daily movements. Experiments show that the system can handle differences among users and locations and has an excellent performance in terms of recognition accuracy and efficiency, with an average accuracy rate of 96.77%.  相似文献   

20.
In order to prevent attacker traffic classification attacks,a method for generating deception traffic based on adversarial samples from the perspective of the defender was proposed.By adding perturbation to the normal network traffic,an adversarial sample of deception traffic was formed,so that an attacker could make a misclassification when implementing a traffic analysis attack based on a deep learning model,achieving deception effect by causing the attacker to consume time and energy.Several different methods for crafting perturbation were used to generate adversarial samples of deception traffic,and the LeNet-5 deep convolutional neural network was selected as a traffic classification model for attackers to deceive.The effectiveness of the proposed method is verified by experiments,which provides a new method for network traffic obfuscation and deception.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号