排序方式: 共有75条查询结果,搜索用时 15 毫秒
1.
2.
3.
4.
近年来,基于骨架的人体动作识别任务因骨架数据的鲁棒性和泛化能力而受到了广泛关注。其中,将人体骨骼建模为时空图的图卷积网络取得了显著的性能。然而图卷积主要通过一系列3D卷积来学习长期交互联系,这种联系偏向于局部并且受到卷积核大小的限制,无法有效地捕获远程依赖关系。该文提出一种协作卷积Transformer网络(Co-ConvT),通过引入Transformer中的自注意力机制建立远程依赖关系,并将其与图卷积神经网络(GCNs)相结合进行动作识别,使模型既能通过图卷积神经网络提取局部信息,也能通过Transformer捕获丰富的远程依赖项。另外,Transformer的自注意力机制在像素级进行计算,因此产生了极大的计算代价,该模型通过将整个网络分为两个阶段,第1阶段使用纯卷积来提取浅层空间特征,第2阶段使用所提出的ConvT块捕获高层语义信息,降低了计算复杂度。此外,原始Transformer中的线性嵌入被替换为卷积嵌入,获得局部空间信息增强,并由此去除了原始模型中的位置编码,使模型更轻量。在两个大规模权威数据集NTU-RGB+D和Kinetics-Skeleton上进行实验验证,该模型分... 相似文献
5.
为了让网络捕捉到更有效的内容来进行行人的判别,该文提出一种基于阶梯型特征空间分割与局部分支注意力网络(SLANet)机制的多分支网络来关注局部图像的显著信息。首先,在网络中引入阶梯型分支注意力模块,该模块以阶梯型对特征图进行水平分块,并且使用了分支注意力给每个分支分配不同的权重。其次,在网络中引入多尺度自适应注意力模块,该模块对局部特征进行处理,自适应调整感受野尺寸来适应不同尺度图像,同时融合了通道注意力和空间注意力筛选出图像重要特征。在网络的设计上,使用多粒度网络将全局特征和局部特征进行结合。最后,该方法在3个被广泛使用的行人重识别数据集Market-1501,DukeMTMC-reID和CUHK03上进行验证。其中在Market-1501数据集上的mAP和Rank-1分别达到了88.1%和95.6%。实验结果表明,该文所提出的网络模型能够提高行人重识别准确率。 相似文献
6.
为解决蚁群聚类易陷入局部最优问题,综合分析了仿生智能聚类的特点,提出了一种混合交叉因子的蚁群聚类方法。该算法采用结合分阶段调整策略和启发式多点交叉策略的混合交叉因子,其中分阶段调整策略动态调整交叉点规模,显著降低交叉操作的无效性概率;启发式策略建立在适应度的基础上能有效地保留父代优秀基因。同时引用随机变异因子,进一步减少陷入局部优化的可能性。结合实例对算法进行了分析,结果表明了该算法在鲁棒性和聚类效果上都有所提高。 相似文献
7.
在白细胞图像中,由于白细胞细胞核的存在,直接应用分水岭算法时,往往达不到较好的效果。本文提出一种结合EM聚类的改进分水岭算法。通过将EM聚类获得的图像中细胞核区域替换,然后使用基于距离变换的分水岭分割,确定白细胞区域。对距离变换后的图像采用形态学处理减少了细胞分割中的过分割现象。同时使用细胞核位置的先验条件,合并分水岭分割区域,进一步减小过分割的影响。本文方法提供一种新的将分水岭算法应用于白细胞分割的思路。同时实验证明,方法在分割精度上有着良好的表现。 相似文献
8.
在基于内容的图像检索中,针对图像的低层可视特征与高层语义特征之间的鸿沟,提出了一种基于支持向量机(SVM)的语义关联方法。通过对图像低层特征的分析,提取了颜色和形状特征向量(221维),将它们作为支持向量机的输入向量,对图像类进行学习,建立图像低层特征与高层语义的关联,并应用于鸟类、花卉、海洋以及建筑物等几个典型的语义类别检索。实验结果表明,该方法可适应于不同用户的图像检索,并提高了检索性能。 相似文献
9.
基于眼睛特征的人脸检测方法* 总被引:5,自引:0,他引:5
由于眼球的灰度级较低,而眼球周围白色区域的灰度级较高,因此在其交界处灰度级产生强烈突变。利用这一特征先从图像中找出可能的眼睛对,定位可能的人脸区域,通过计算其对称性来确定各种人脸特征的存在,更进一步验证可能的人脸区域。实验证明,此方法能迅速准确地从复杂背景图像中检测出人脸,而且对多人脸图像同样有效。 相似文献
10.
基于提升小波变换的图像融合新算法 总被引:1,自引:0,他引:1
给出了一种基于提升小波变换的图像融合方法,并对小波分解的不同频率域,分别采用不同的融合规则。选择低频系数时,是基于边缘的方法,选择高频系数时,把小波系数的方差与绝对值综合起来考虑来决定融合小波系数。实验结果表明,提出的方法融合效果要优于一般融合方法。 相似文献