期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

孙锐张广海高隽《电子与信息学报》2016,38(6):1528-1535

该文针对行人识别中的特征表示问题,提出一种混合结构的分层特征表示方法,这种混合结构结合了具有表示能力的词袋结构和学习适应性的深度分层结构。首先利用基于梯度的HOG局部描述符提取局部特征,再通过一个由空间聚集受限玻尔兹曼机组成的深度分层编码方法进行编码。对于每个编码层,利用稀疏性和选择性正则化进行无监督受限玻尔兹曼机学习,再应用监督微调来增强分类任务中视觉特征表示,采用最大池化和空间金字塔方法得到高层图像特征表示。最后采用线性支持向量机进行行人识别,提取深度分层特征遮挡等与目标无关部分自然分离,有效提高了后续识别的准确性。实验结果证明了所提出方法具有较高的识别率。相似文献

2.

应用空间金字塔池化LBP特征的舰船检测识别

郭少军陆斌娄树理《激光与红外》2017,47(6):783-788

传统LBP特征进行目标识别主要依靠局部图像LBP特征直方图来实现,通常只能满足小邻域内小量采样点计算LBP特征的情况。当需要计算像素在更大空间邻域更多采样点的对比纹理特征时,直方图特征的维度将会造成维数灾难。本文提出应用空间金字塔池化方式对LBP特征进行池化,并在LBP特征计算过程中采用多种邻域尺度和不同采样点数量,充分挖掘不同尺度下图像的纹理特征,从而建立完备的图像描述特征。在利用支持向量机或其他训练网络进行识别模板训练时,需要输入特征集具有相同的维度,传统LBP算法首先对图像按一定尺寸重构/裁切,时常会发生畸变而与现实出现偏离和信息丢失,对识别正确率存在影响。本文通过空间金字塔尺度对任意大小图像的LBP特征进行池化,输出特征维度为固定长度,有效避免了图像畸变与信息丢失的情况。实验证明,本文方法不仅避免了维度灾难的发生,同时能够更高效地提高目标检测率和识别正确率。相似文献

3.

静态图像中的人体行为分类研究

马秀梅唐春晖尹征张仁杰《信息技术》2015,(4):98-101

静态图像中人体行为分类的一般方法是先手动标定出行为对象,再单独对行为对象进行特征提取和分析,不仅费时费力还丢失了场景信息。针对此问题提出了结合场景特征与行为对象特征的图像表示方法,充分利用图像的所有信息。此外为了减小量化误差,在特征编码阶段,采用局部约束线性编码(Locality-constrained Linear Coding,LLC)算法,并将其应用在空间金字塔模型的向量量化中。该算法与传统的矢量量化算法和稀疏编码算法相比,能够降低量化误差。最后在Stanford 40 Action数据集上对文中方法进行实验和验证,结果表明,结合场景特征与行为对象特征并使用LLC编码算法能够获得更好的分类效果。相似文献

4.

基于金字塔池化网络的道路场景深度估计方法

周武杰潘婷顾鹏笠翟治年《电子与信息学报》2019,41(10):2509-2515

针对从单目视觉图像中估计深度信息时存在的预测精度不够准确的问题,该文提出一种基于金字塔池化网络的道路场景深度估计方法。该方法利用4个残差网络块的组合提取道路场景图像特征,然后通过上采样将特征图逐渐恢复到原始图像尺寸,多个残差网络块的加入增加网络模型的深度;考虑到上采样过程中不同尺度信息的多样性,将提取特征过程中各种尺寸的特征图与上采样过程中相同尺寸的特征图进行融合,从而提高深度估计的精确度。此外,对4个残差网络块提取的高级特征采用金字塔池化网络块进行场景解析,最后将金字塔池化网络块输出的特征图恢复到原始图像尺寸并与上采样模块的输出一同输入预测层。通过在KITTI数据集上进行实验,结果表明该文所提的基于金字塔池化网络的道路场景深度估计方法优于现有的估计方法。相似文献

5.

基于稀疏自动编码网络的水声通信信号调制识别

下载免费PDF全文

姜楠王彬《信号处理》2019,35(1):103-114

研究了基于稀疏自动编码网络的水声通信信号识别方法。首先利用稀疏自动编码网络对接收信号的功率谱识别分类,得到除PSK外信号的调制类型,然后对识别结果为PSK的信号做四次方谱,最后利用稀疏自动编码网络完成对QPSK和8PSK的识别分类。仿真实验表明,稀疏自动编码网络能从接收信号的谱信息中自动提取有效谱特征。与传统基于功率谱特征提取的识别方法相比,本文算法减少了依赖领域知识的特征提取环节,识别性能优于传统算法。相似文献

6.

一种基于稀疏编码的多核学习图像分类方法 总被引：2，自引：0，他引：2

下载免费PDF全文

亓晓振王庆《电子学报》2012,40(4):773-779

本文提出一种基于稀疏编码的多核学习图像分类方法.传统稀疏编码方法对图像进行分类时,损失了空间信息,本文采用对图像进行空间金字塔多划分方式为特征加入空间信息限制.在利用非线性SVM方法进行图像分类时,空间金字塔的各层分别形成一个核矩阵,本文使用多核学习方法求解各个核矩阵的权重,通过核矩阵的线性组合来获取能够对整个分类集区分能力最强的核矩阵.实验结果表明了本文所提出图像分类方法的有效性和鲁棒性.对Scene Categories场景数据集可以达到83.10%的分类准确率,这是当前该数据集上能达到的最高分类准确率. 相似文献

7.

红外图像中基于似物性与稀疏编码的行人检测

《红外技术》2016,(9):752-757

行人检测是计算机视觉的经典问题。针对红外图像中的行人检测问题,提出了一种基于似物性和稀疏编码及空间金字塔特征提取的行人检测方法。首先,针对红外图像的特点,利用基于频域残差的显著性分析方法得到红外图像的显著图,在此基础上提出了一种似物性计算方法,进而得到不同区域的似物度得分,并根据得分提取出感兴趣区域;其次,以尺度不变特征转换为基础,将稀疏编码和空间金字塔算法应用于非监督特征学习实现对感兴趣区域的特征提取;最后,利用线性支持向量机构建分类器实现对图像中每个感兴趣区域的行人检测。实验结果验证了本文提出的感兴趣区域提取算法和针对单幅红外图像行人检测算法的有效性。相似文献

8.

基于方向梯度直方图和局部对比度特征的海面背景红外图像分类

董丽丽张彤马冬冬许文海《红外与毫米波学报》2020,39(5):652-661

在复杂多变的海面环境下,应用红外成像技术对海面中小目标进行搜救时,为有利于后续针对不同场景的目标处理,有必要对采集的原始图像进行分类处理。根据不同的环境条件,将海面红外图像分为五类场景。从两个方面对训练集图像进行特征提取,一个是通过高斯滤波将图像分为基础层和细节层,然后使用改进的方向梯度直方图（HOG）方法提取特征;另一个是提取图像的局部对比度得到局部特征。将提取的特征向量融合并输入到分类器中,使用支持向量机（SVM）对测试集图像进行分类。文章使用了HOG和局部对比度方法（LCM）结合的新特征描述符对海面红外图像的场景进行分类,与其它方法相比,结果表明改进方法的准确率达到96.4%,体现了可行性和有效性。相似文献

9.

基于局部和全局特征融合的二阶段人脸图像修复算法研究

徐克《现代电子技术》2024,(9):40-46

针对大面积不规则破损的人脸图像修复过程中出现的伪影和不连贯问题,提出一种基于特征融合和多尺度注意力机制的二阶段人脸图像修复算法。在粗修复网络增加全局和局部特征分支来处理编码器的输出。其中,局部特征分支使用多尺度空洞卷积和门控残差连接来聚合上下文信息,并与全局特征分支的输出进行正交融合,提高局部特征与全局特征的相关性,减少特征冗余。在精修复网络增加平均和最大金字塔池化模块,其中,平均池化用于捕捉整体统计信息,最大池化用于提取空间上显著的特征并保留关键信息,并利用通道-空间注意力机制进行图像特征结构调整和纹理生成。最后,构建了一个包括多尺度结构相似性损失的复合函数对网络进行训练。实验结果表明,所提算法在主观和客观评价指标上均优于现有算法。相似文献

10.

图像多角度局部特征提取及相似性匹配技术研究

徐望明石汉路《电子设计工程》2013,21(3)

图像特征提取是计算机视觉应用的根本基础.研究了SIFT、LBP和HOG等3种信息互补的局部特征(即多角度局部特征)提取算法,研究了基于稀疏编码的图像相似性匹配算法,并以基于内容的图像检索(CBIR)为应用实例,验证了算法的有效性和高效性. 相似文献

11.

Spatially constrained sparse coding scheme for natural scene categorization

《Journal of Visual Communication and Image Representation》2015

Coding and pooling, the major two sequential procedures in sparse coding based scene categorization systems, have drawn much attention in recent years. Yet improvements have been made for coding or pooling separately, this paper proposes a spatially constrained scheme for sparse coding on both steps. Specifically, we employ the m-nearest neighbors of a local feature in the image space to improve the consistency of coding. The benefit is that similar image features will be encoded with similar codewords, which reduced the stochasticity of a conventional coding strategy. We also show that the Viola–Jones algorithm, which is well-known in face detection, can be tailored to learning receptive fields, embedding the spatially constrained information on the pooling step. Extensive experiments on the UIUC sport event, 15 natural scenes and the Caltech 101 database suggests that scene categorization performance of several popular algorithms can be ubiquitously improved by incorporating the proposed two spatially constrained sparse coding scheme. 相似文献

12.

整合局部特征和滤波器特征的空间金字塔匹配模型 总被引：3，自引：0，他引：3

高常鑫桑农《电子学报》2011,39(9):2034-2038

本文提出一种场景分类方法,通过整合局部特征和滤波器特征获得丰富的表征信息,并利用空间金字塔匹配模型提取空间上下文信息.该方法有如下四个特点:(1)通过转换将滤波器很好地嵌入空间金字塔匹配模型中;(2)在滤波器特征转换的过程中,采用降采样和平均操作,在空间密度和空间范围两者之间取得了很好的折衷;(3)将滤波器特征和局部特... 相似文献

13.

Detection of loop closure in visual SLAM:a stacked assorted auto-encoder based approach

罗元肖雨婷张毅曾念文《光电子快报》2021,17(6):354-360

The current mainstream methods of loop closure detection in visual simultaneous localization and mapping (SLAM) are based on bag-of-words (BoW). However, traditional BoW-based approaches are strongly affected by changes in the appearance of the scene, which leads to poor robustness and low precision. In order to improve the precision and robustness of loop closure detection, a novel approach based on stacked assorted auto-encoder (SAAE) is proposed. The traditional stacked auto-encoder is made up of multiple layers of the same autoencoder. Compared with the visual BoW model, although it can better extract the features of the scene image, the output feature dimension is high. The proposed SAAE is composed of multiple layers of denoising auto-encoder, convolutional auto-encoder and sparse auto-encoder, it uses denoising auto-encoder to improve the robustness of image features, convolutional auto-encoder to preserve the spatial information of the image, and sparse auto-encoder to reduce the dimensionality of image features. It is capable of extracting low to high dimensional features of the scene image and preserving the spatial local characteristics of the image, which makes the output features more robust. The performance of SAAE is evaluated by a comparison study using data from new college dataset and city centre dataset. The methodology proposed in this paper can effectively improve the precision and robustness of loop closure detection in visual SLAM. 相似文献

14.

稀疏特征重用的人脸特征提取网络

下载免费PDF全文

胡超李春国杨绿溪《信号处理》2021,37(7):1153-1163

为了提高人脸特征提取网络的性能,进而提高人脸识别算法的准确率,本文对基于卷积神经网络的人脸特征提取网络进行研究,提出了SFRNet (Sparse Feature Reuse Network)。首先,基于稀疏特征重用、混合特征融合、中心-高斯池化三个创新点,给出了SFRNet的网络结构。然后,在图像分类数据集ImageNet和人脸识别数据集LFW (Labeled Faces in the Wild)、MegaFace上进行实验,分别验证了SFRNet在一般场景和人脸识别这一特定场景下的特征提取能力。实验表明本文所设计的SFRNet不仅计算量和参数量小,还能有效提取到人脸特征并且在一般场景中也有较强的泛化能力。相似文献

15.

基于改进深度卷积神经网络的纸币识别研究

盖杉鲍中运《电子与信息学报》2019,41(8):1992-2000

针对如何提高纸币识别率的问题,该文提出一种改进深度卷积神经网络(DCNN)的纸币识别算法。该算法首先通过融合迁移学习、带泄露整流(Leaky ReLU)函数、批量归一化(BN)和多层次残差单元构造深度卷积层,对输入的不同尺寸纸币进行稳定而快速的特征提取与学习;然后采用改进的多层次空间金字塔池化算法对提取的纸币特征实现固定大小的输出表示;最后通过网络全连接层和softmax层实现纸币图像分类。实验结果表明,该算法在分类性能、泛化能力与稳定性上明显优于常用的纸币分类算法;同时该算法也能够满足纸币清分系统的实时性要求。相似文献

16.

YOLOV5s object detection based on Sim SPPF hybrid pooling

DONG Xiuhuan LI Shixin ZHANG Jixiang 《光电子快报》2024,20(6):367-371

Aiming at the problem of low surface defect detection accuracy of industrial products, an object detection method based on simplified spatial pyramid pooling fast (Sim SPPF) hybrid pooling improved you only look once version 5s (YOLOV5s) model is proposed. The algorithm introduces channel attention (CA) module, simplified SPPF feature vector pyramid and efficient intersection over union (EIOU) loss function. Feature vector pyramids fuse high-dimensional and low-dimensional features, which makes semantic information richer. The CA mechanism performs maximum pooling and average pooling operations on the feature map. Hybrid pooling comprehensively improves detection computing efficiency and accurate deployment ability. The results show that the improved YOLOV5s model is better than the original YOLOV5s model. The average test accuracy (mAP) can reach 91.8%, which can be increased by 17.4%, and the detection speed can reach 108 FPS, which can be increased by 18 FPS. The improved model is practicable, and the overall performance is better than other conventional models. 相似文献

17.

行人轨迹预测条件端点局部目的地池化网络

毛琳解云娇杨大伟张汝波《电子与信息学报》2022,44(10):3465-3475

轨迹预测是自动驾驶系统中的核心任务之一。现阶段基于深度学习的轨迹预测算法,涉及目标的信息表示、环境感知和运动推理。针对现有轨迹预测模型在运动推理过程中对行人社交动机考虑不足,无法有效预知场景中行人在不同社交条件下局部目的地的问题,该文提出一种条件端点局部目的地池化网络(CEPNET)。该网络通过条件变分自编码器推理潜在轨迹分布空间来学习历史观测轨迹在特定场景中的概率分布,构建条件端点局部特征推理算法,将条件端点作为局部目的地特征进行相似性特征编码,利用社交池化网络过滤掉场景中的干扰信号,融入自注意力社交掩码来增强行人的自我注意力。为验证算法各模块的可靠性,使用公开的行人鸟瞰数据集(BIWI)和塞浦路斯大学多人轨迹数据集(UCY)对CEPNET进行消融实验,并与平凡长短时记忆网络(Vanilla)、社交池化生成对抗网络(SGAN)和图注意力生成对抗网络(S-BiGAT)等先进轨迹预测算法进行对比分析。在Trajnet++基准上的实验结果表明,CEPNET算法性能优于现有先进算法,并且与基准算法Vanilla相比,平均位移误差(ADE)降低22.52%,最终位移误差(FDE)降低20%,预测碰撞率Col-I降低9.75%,真值碰撞率Col-II降低9.15%。相似文献