期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王泽宇吴艳霞张国印布树辉《计算机应用》2017,37(12):3458-3466

有效的RGB-D图像特征提取和准确的3D空间结构化学习是提升RGB-D场景解析结果的关键。目前,全卷积神经网络（FCNN）具有强大的特征提取能力,但是,该网络无法充分地学习3D空间结构化信息。为此,提出了一种新颖的三维空间结构化编码深度网络,内嵌的结构化学习层有机地结合了图模型网络和空间结构化编码算法。该算法能够比较准确地学习和描述物体所处3D空间的物体分布。通过该深度网络,不仅能够提取包含多层形状和深度信息的分层视觉特征（HVF）和分层深度特征（HDF）,而且可以生成包含3D结构化信息的空间关系特征,进而得到融合上述3类特征的混合特征,从而能够更准确地表达RGB-D图像的语义信息。实验结果表明,在NYUDv2和SUNRGBD标准RGB-D数据集上,该深度网络较现有先进的场景解析方法能够显著提升RGB-D场景解析的结果。相似文献

2.

基于深度感知特征提取的室内场景理解

陈苏婷张良臣《计算机工程》2021,47(6):217-224

从深度图RGB-D域中联合学习RGB图像特征与3D几何信息有利于室内场景语义分割,然而传统分割方法通常需要精确的深度图作为输入,严重限制了其应用范围。提出一种新的室内场景理解网络框架,建立基于语义特征与深度特征提取网络的联合学习网络模型提取深度感知特征,通过几何信息指导的深度特征传输模块与金字塔特征融合模块将学习到的深度特征、多尺度空间信息与语义特征相结合,生成具有更强表达能力的特征表示,实现更准确的室内场景语义分割。实验结果表明,联合学习网络模型在NYU-Dv2与SUN RGBD数据集上分别取得了69.5%与68.4%的平均分割准确度,相比传统分割方法具有更好的室内场景语义分割性能及更强的适用性。相似文献

3.

深度学习多模态图像语义分割前沿进展

下载免费PDF全文

赵什陆张强《中国图象图形学报》2023,28(11):3320-3341

图像语义分割旨在将视觉场景分解为不同的语义类别实体,实现对图像中每一个像素的类别预测。多模态图像语义分割通过联合利用不同模态图像（即通过基于不同成像机理的传感器获取的图像）间的互补特性,能够全面且准确地实现复杂场景信息的学习与推理。目前基于深度学习的多模态图像语义分割前沿成果较多,但缺少系统且全面的调研与分析。本文首先总结并分析了目前主流的基于深度学习的可见光—热红外（red-green-bluethermal,RGB-T）图像语义分割算法和可见光—深度（red-green-blue-depth,RGB-D）图像语义分割算法。依据算法侧重点不同,将基于深度学习的RGB-T图像语义分割算法划分为基于图像特征增强的方法、基于多模态图像特征融合的方法和基于多层级图像特征交互的方法;依据算法对深度信息的利用方式,将基于深度学习的RGB-D图像语义分割算法划分为基于深度信息提取的方法和基于深度信息引导的方法。然后,介绍了多模态图像语义分割算法常用的客观评测指标以及数据集,并在常用数据集上对上述算法进行对比。对于RGB-T图像语义分割,在MFNet（multi-spectral fusion network）数据集上,GMNet （graded-feature multilabel-learning network）和MFFENet （multiscale feature fusion and enhancement network）分别取得了最优的类平均交并比（mean intersection-over-union per class,mIoU）（57.3%）和类平均精度（mean accuracy per class,mAcc）（74.3%）值。在PST900（PENN subterranean thermal 900）数据集上,GMNet仍然取得了最优的mIoU（84.12%）值,而EGFNet取得了最优的mAcc（94.02%）值。对于RGB-D图像语义分割,在NYUD v2（New York University depth dataset v2）数据集上,GLPNet（global-local propagation network）的mIoU和mAcc分别达到了54.6%和66.6%,取得最优性能。而在SUN-RGBD（scene understanding-RGB-D）数据集上,Zig-Zag的mIoU为51.8%,GLPNet的mAcc为63.3%,均为最优性能。最后,本文还指出了多模态图像语义分割领域未来可能的发展方向。相似文献

4.

采用跳层卷积神经网络的RGB-D图像显著性检测

下载免费PDF全文

陈曦涛訾玲玲张雪曼《计算机工程与应用》2022,58(2):252-258

RGB-D图像显著性检测旨在提取三维图像中的显著目标.为解决当前显著性检测算法难以检测出光线干扰场景内的目标和低对比度的目标等问题,提出了基于跳层卷积神经网络的RGB-D图像显著性检测方法.利用VGG网络分离出RGB图像和深度图像的浅层与深层特征,而后进行特征提取;以跳层结构为基础连接提取到的特征,实现融合深度、颜色、... 相似文献

5.

基于特征调节器和双路径引导的RGB-D室内语义分割

张帅雷景生靳伍银俞云祥杨胜英《计算机应用研究》2024,41(5)

针对室内场景图像语义分割结果不精确、显著图粗糙的问题,提出一种基于多模态特征优化提取和双路径引导解码的网络架构（feature regulator and dual-path guidance,FG-Net）。具体来说,设计的特征调节器对每个阶段的多模态特征依次进行噪声过滤、重加权表示、差异性互补和交互融合,通过强化RGB和深度特征聚合,优化特征提取过程中的多模态特征表示。然后,在解码阶段引入特征交互融合后丰富的跨模态线索,进一步发挥多模态特征的优势。结合双路径协同引导结构,在解码阶段融合多尺度、多层次的特征信息,从而输出更细致的显著图。实验在公开数据集NYUD-v2和SUN RGB-D上进行,在主要评价指标mIoU上达到48.5 %,优于其他先进算法。结果表明,该算法实现了更精细的室内场景图像语义分割,表现出了较好的泛化性和鲁棒性。相似文献

6.

融合RGB图像特征的多尺度深度图像补全方法

郑柏伦冼楚华张东九《计算机辅助设计与图形学学报》2021,33(9):1407-1417

针对目前因缺少配对的"缺失-完整"RGB-D数据集而不能直接训练端对端深度图像补全模型的问题,提出基于随机掩码构造对应的缺失-完整数据,结合真实数据集与合成数据集交替训练模型的策略.基于随机掩码生成不同缺失比例的深度图像,并且利用合成数据集构造具有可靠真值的深度图像缺失数据,从而得到具有可靠数据的缺失-完整RGB-D数据集.以此策略为基础,搭建融合对应RGB图像特征的多尺度深度图像补全网络,该网络分别从RGB图像特征提取分支和深度图像特征提取分支提取不同尺度的RGB图像特征和深度图像特征,再经过特征融合分支在不同尺度上对RGB图像特征和深度图像特征进行融合,进而能够充分地学习RGB图像丰富的语义信息和深度图像的信息补全缺失深度.在NYU-Depth V2数据集的实验表明,该方法在不同缺失比例的深度图像补全任务中,阈值精度平均值为0.98,平均相对误差约为0.061,与现有基于神经网络和优化稀疏方程组的方法相比,其在阈值精度上平均提升了0.02,平均相对误差平均下降了0.027. 相似文献

7.

基于组件特征与多注意力融合的车辆重识别方法

胡煜陈小波梁军陈玲梁书荣《计算机研究与发展》2022,(11):2497-2506

为提升车辆重识别算法的性能,提出一种基于车辆组件特征与多注意力融合的特征学习方法.首先,修改深度残差网络以获取具有丰富语义信息的特征图,同时应用语义分割网络将车辆图像划分为车辆正面、背面、顶面、侧面及背景区域,以实现组件特征提取并消除视角变化的影响.然后,设计多注意力融合模块,基于面积注意力与特征注意力实现组件特征的自适应融合.最后,在多任务学习框架下,优化车辆重识别的三元组损失与辅助分类任务的交叉熵与焦点损失,对网络参数进行训练.在多个数据集上的实验结果表明,提出的方法在大多数性能指标上均超越了现有方法.进一步的消融实验证明了多注意力融合模块与多任务损失函数在特征提取上的有效性. 相似文献

8.

基于K-Means聚类与深度学习的RGB-D SLAM算法

张晨阳黄腾吴壮壮《计算机工程》2022,48(1):236-244+252

传统的RGB-D视觉同时定位与制图（SLAM）算法在动态场景中识别动态特征时会产生数据错误关联,导致视觉SLAM估计姿态精度退化。提出一种适用于动态场景的RGB-D SLAM算法,利用全新的跨平台神经网络深度学习框架检测场景中的动态语义特征,并分割提取对应的动态语义特征区域。结合深度图像的K均值聚类算法和动态语义特征区域对点特征深度值进行聚类,根据聚类结果剔除动态特征点,同时通过剩余特征点计算RGB-D相机的位姿。实验结果表明,相比ORB-SLAM2、OFD-SLAM、MR-SLAM等算法,该算法能够减小动态场景下的跟踪误差,提高相机位姿估计的精度和鲁棒性,其在TUM动态数据集上相机绝对轨迹的均方根误差约为0.019 m。相似文献

9.

面向RGB-D语义分割的多模态任意旋转自监督学习

李鸿宇张宜飞杨东宝《计算机系统应用》2024,33(1):219-230

基于RGB-D数据的自监督学习受到广泛关注, 然而大多数方法侧重全局级别的表示学习, 会丢失对识别对象至关重要的局部细节信息. 由于RGB-D数据中图像和深度具有几何一致性, 因此这可以作为线索来指导RGB-D数据的自监督特征表示学习. 在本文中, 我们提出了ArbRot, 它可以无限制地旋转角度并为代理任务生成多个伪标签用于自监督学习, 而且还建立了全局和局部之间的上下文联系. 本文所提出的ArbRot可以与其他对比学习方法联合训练, 构建多模态多代理任务自监督学习框架, 以增强图像和深度视图的特征表示一致性, 从而为RGB-D语义分割任务提供有效的初始化. 在SUN RGB-D和NYU Depth Dataset V2数据集上的实验结果表明, 多模态任意旋转自监督学习得到的特征表示质量均高于基线模型. 开源代码: https://github.com/Physu/ArbRot. 相似文献

10.

基于改进SIFT特征和神经网络结合的场景识别

《软件工程师》2019,(5):5-8

基于深度学习的场景识别作为计算机视觉领域的重要方向,目前仍存在部分问题,如仅提取图像的高层语义特征而缺失了图像的底层特征,针对这个问题,提出基于改进SIFT特征与深度神经网络相结合的室内RGB-D图像识别方法。首先提取图像的SIFT特征,然后利用随机森林算法根据重要度对SIFT特征进行筛选,然后结合基于ResNet的深度神经网络,并提出基于深度直方图与深度均值直方图的深度损失函数,加速模型的收敛。实验结果表明,算法可以在NYUD v2数据集上达到71.52%的识别率,有效提升了室内场景识别的准确率。相似文献

11.

利用语音与文本特征融合改善语音情感识别

冯亚琴沈凌洁胡婷婷王蔚《数据采集与处理》2019,34(4):625-631

情感识别在人机交互中具有重要意义,为了提高情感识别准确率,将语音与文本特征融合。语音特征采用了声学特征和韵律特征,文本特征采用了基于情感词典的词袋特征（Bag-of-words,BoW）和N-gram模型。将语音与文本特征分别进行特征层融合与决策层融合,比较它们在IEMOCAP四类情感识别的效果。实验表明,语音与文本特征融合比单一特征在情感识别中表现更好;决策层融合比在特征层融合识别效果好。且基于卷积神经网络（Convolutional neural network,CNN）分类器,语音与文本特征在决策层融合中不加权平均召回率（Unweighted average recall,UAR)达到了68.98%,超过了此前在IEMOCAP数据集上的最好结果。相似文献

12.

地域特色在新疆织毯装饰上的表现

徐永成万鑫悦《数码设计:surface》2010,(10):280-281

织毯为人们的日常生活增添了一抹绚丽、浪漫的色彩。新疆拥有广阔的天然草地面积,畜牧业发达,因而产生了大量的优质毛料,为织毯的发展奠定了基础。同时众多少数民族、游牧民族聚居于此,不同的民俗、不同的宗教影响于织毯的装饰风格,使新疆地毯极具地域特点。随着社会的发展,织毯的社会功能逐渐高于它的使用功能。织毯除了满足人们生理需求与视觉享受之余,更多的是对其地域思想、地域文化的体现,并对其进行推广与传播。相似文献

13.

云的光谱和纹理特征统计分析 总被引：3，自引：0，他引：3

下载免费PDF全文

朱亚平刘健文白洁《遥感技术与应用》2006,21(1):18-24

利用静止卫星图像资料建立了夏季白天中低纬地区的11 种云/ 表面类型的样本集, 从中随机挑选656 个样本, 提取116 个光谱和纹理特征参数并进行统计分析, 通过特征选择组成特征向量, 带入逐个修改聚类和模糊聚类的分类器进行敏感性试验。结果发现, 在反映云特征方面, 光谱特征是云分类最基本的特征, 比纹理特征明显, 是云分类识别的主要依据; 除去水汽通道的标准差以外其它光谱特征都比较明显, 红外和水汽通道的特征明显好于可见光通道, 尤其是对中低云和卷云的描述。纹理特征在反映云特征方面也有一定的代表性, 特别是一阶概率特征中四通道的惯量及水汽通道的逆差距; 纹理特征引入后分类准确率显著提高, 但在引入一阶概率特征基础上引入灰度级差矢量特征效果改善并不明显。相似文献

14.

基于主曲线的脱机手写数字结构特征分析及选取 总被引：8，自引：0，他引：8

张红云苗夺谦张东星《计算机研究与发展》2005,42(8):1344-1349

要提高脱机手写数字识别的识别率,关键是特征的提取与选择．主曲线是主成分分析的非线性推广,它是通过数据分布“中间”并满足“自相合”的光滑曲线．它较好地反映了数据分布的结构特征．在数字特征选取中,首先将主曲线用于训练数据的特征提取;其次在详细分析数字主曲线的结构特点的基础上,选择出用于数字识别的粗分类、细分类特征;最后在对手写数字进行识别时,先进行粗分类再进行细分类．所提方法在Concordia大学的CENPARMI手写体数字数据库上的实验结果表明：利用这些特征能有效区分相似字符,提高了手写数字的识别率,为脱机手写数字识别的研究提供了一条新途径。相似文献

15.

Evaluation of Features Detectors and Descriptors based on 3D Objects 总被引：3，自引：0，他引：3

Pierre Moreels Pietro Perona 《International Journal of Computer Vision》2007,73(3):263-284

相似文献

16.

面向对象特征融合的高分辨率遥感图像变化检测方法* 总被引：2，自引：0，他引：2

王文杰赵忠明朱海青《计算机应用研究》2009,26(8):3149-3151

针对高分辨率遥感图像变化检测的难点和传统像元级变化检测方法的局限性,提出了基于面向对象的思想,利用分割后图像对象的光谱特征、纹理特征、形状特征分别进行变化检测,然后将不同对象特征检测结果进行融合得到最终结果。实验表明了本方法比传统的像素级方法对高分辨率遥感图像变化检测有较强的优势。相似文献

17.

基于组合特征的动态垃圾博客过滤算法

任永功尹明飞杨荣杰《计算机科学》2012,39(5):177-179,212

近几年,垃圾博客过滤成为国际上新的热点研究领域。现有的过滤算法大多基于词频特征分类,特征冗余并缺乏关联性。为了解决此问题,提出一种基于组合特征的动态垃圾博客过滤算法(CFDSD),该算法采用作者属性和自相似特征来解决特征冗余和关联性低的问题,并应用贝叶斯分类算法优化词频特征分类。实验表明,该算法能适应博客随时间变化而动态更新的特点,同时提高了过滤效率。相似文献

18.

基于内容的图像检索研究

LI Cong ZHANG Ming-xin QIAO Xiao-ni ZHANG A-hong 《数字社区&智能家居》2008,(21)

基于内容的图像检索是图像检索中较高层次的检索,文中对CBIR的各种特征提取方法进行了分析比较,最后指出了当前的研究热点和今后的发展方向。相似文献

19.

面向图文匹配任务的多层次图像特征融合算法

郝志峰李俊峰蔡瑞初温雯王丽娟黎伊婷《计算机应用研究》2020,37(3):951-956

现有主流的利用预训练卷积神经网络提取图像特征的方法存在仅使用单层预训练特征表征图像和预训练任务与实际研究任务不一致的问题,使得现有图文匹配方法无法充分利用图像特征,极易受到噪声特征干扰。针对上述问题,使用了预训练网络中的多层特征,并提出了多层次图像特征融合算法。在图文匹配的学习目标指导下,利用多层感知机（multi-layer perceptron）有监督地融合和降维多层次的预训练图像特征,生成融合图像特征,从而充分利用预训练特征,减少噪声干扰。实验结果表明,提出的融合算法可实现对预训练的图像特征更有效的利用,相比于使用单层次特征的方法能获得更好的图文匹配效果。相似文献

20.

含有语义特征的网页新闻自动抽取 总被引：1，自引：0，他引：1

下载免费PDF全文

施洋张奇黄萱菁《计算机工程》2010,36(7):173-175

通过分析新闻网页的语义特征以及网页之间存在的通用性质,提出一种含有语义特征的网页新闻自动抽取方法,包括利用语义分类器识别新闻网页中的种子信息以及页面中的局部信息来完成抽取。在分类器中加入语义特征可以使F1值达到94.2%。在语义分类器与局部特征结合的情况下,F1值可以达到96.9%。实验结果证明,该方法能有效提高网页信息抽取算法的精度,降低机器学习所需要的标注成本。相似文献