期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王志波王雪马菁菁秦湛任炬任奎《计算机学报》2023,(2):436-468

对抗样本攻击是近年来计算机视觉领域的热点研究方向,通过对图像添加细微的噪声,对抗样本使计算机视觉系统做出错误判断.对抗样本攻击的研究起初重点关注于图像分类任务,随着研究的深入逐步拓展到目标检测、人脸识别等更加复杂的计算机视觉任务中.然而,现有的对抗样本综述缺乏对新兴图像分类攻击方案的梳理总结以及针对目标检测、人脸识别等复杂任务攻击的分析总结.本论文聚焦于计算机视觉系统中的对抗样本攻击,对其理论与前沿技术进行了系统性的综述研究.首先,本论文介绍了对抗样本的关键概念与敌手模型.其次,分类总结和对比分析了对抗样本存在原因的三大类相关假设.再次,根据数字域与物理域两大应用场景,分类概述和对比分析图像分类系统中的对抗样本攻击技术.根据不同的敌手模型,我们进一步地将图像分类任务数字域的攻击方案划分为白盒和黑盒两种场景,并重点总结梳理了新兴的攻击类别.同时,在目标检测、人脸识别、语义分割、图像检索、视觉跟踪五类复杂计算机视觉任务上,根据适用场景分类总结各类任务中的对抗样本攻击方案.进一步地,从攻击场景、攻击目标、攻击效果等方面对于不同攻击方案进行详细地对比分析.最后,基于现有对抗样本攻击方法的总结,... 相似文献

2.

基于产生式系统的知识建模 总被引：1，自引：0，他引：1

高暠燕雪峰《数据采集与处理》2009,24(Z1)

如何建立系统完整的专家知识模型,并将其快速映射为面向计算机推理的人工智能语言是当前专家系统研究的重点和难点,而知识表示是其中的关键.本文将模型驱动的思想引入到专家系统领域,定义了一种基于不确定性产生式知识表示的元模型,设计并实现了相应的图形化建模工具和转换引擎,并基于此提出一种新的产生式系统应用框架.该框架在某健康信息评估专家系统中获得了成功的应用. 相似文献

3.

平行视觉:基于ACP的智能视觉计算方法 总被引：9，自引：0，他引：9

王坤峰苟超王飞跃《自动化学报》2016,42(10):1490-1500

在视觉计算研究中,对复杂环境的适应能力通常决定了算法能否实际应用,已经成为该领域的研究焦点之一.由人工社会（Artificial societies）、计算实验（Computational experiments）、平行执行（Parallel execution）构成的ACP理论在复杂系统建模与调控中发挥着重要作用.本文将ACP理论引入智能视觉计算领域,提出平行视觉的基本框架与关键技术.平行视觉利用人工场景来模拟和表示复杂挑战的实际场景,通过计算实验进行各种视觉模型的训练与评估,最后借助平行执行来在线优化视觉系统,实现对复杂环境的智能感知与理解.这一虚实互动的视觉计算方法结合了计算机图形学、虚拟现实、机器学习、知识自动化等技术,是视觉系统走向应用的有效途径和自然选择. 相似文献

4.

面向链接预测的知识图谱表示学习方法综述

杜雪盈刘名威沈立炜彭鑫《软件学报》2024,35(1):87-117

作为人工智能的重要基石, 知识图谱能够从互联网海量数据中抽取并表达先验知识, 极大程度解决了智能系统认知决策可解释性差的瓶颈问题, 对智能系统的构建与应用起关键作用. 随着知识图谱技术应用的不断深化, 旨在解决图谱欠完整性问题的知识图谱补全工作迫在眉睫. 链接预测是针对知识图谱中缺失的实体与关系进行预测的任务, 是知识图谱构建与补全中不可或缺的一环. 要充分挖掘知识图谱中的隐藏关系, 利用海量的实体与关系进行计算, 就需要将符号化表示的信息转换为数值形式, 即进行知识图谱表示学习. 基于此, 面向链接预测的知识图谱表示学习成为知识图谱领域的研究热点. 从链接预测与表示学习的基本概念出发, 系统性地介绍面向链接预测的知识图谱表示学习方法最新研究进展. 具体从知识表示形式、算法建模方式两种维度对研究进展进行详细论述. 以知识表示形式的发展历程为线索, 分别介绍二元关系、多元关系和超关系知识表示形式下链接预测任务的数学建模. 基于表示学习建模方式, 将现有方法细化为4类模型: 平移距离模型、张量分解模型、传统神经网络模型和图神经网络模型, 并详细描述每类模型的实现方式与解决不同关系元数链接预测任务的代表模型. 在介绍链接预测的常用的数据集与评判标准基础上, 分别对比分析二元关系、多元关系和超关系3类知识表示形式下, 4类知识表示学习模型的链接预测效果, 并从模型优化、知识表示形式和问题作用域3个方面展望未来发展趋势. 相似文献

5.

图像—文本多模态指代表达理解研究综述

下载免费PDF全文

王丽安缪佩翰苏伟李玺吉娜烨姜燕冰《中国图象图形学报》2023,28(5):1308-1325

指代表达理解（referring expression comprehension,REC）作为视觉—语言相结合的多模态任务,旨在理解输入指代表达式的内容并在图像中定位其所描述的目标对象,受到计算机视觉和自然语言处理两个领域的关注。REC任务建立了人类语言与物理世界的视觉内容之间的桥梁,可以广泛应用于视觉理解系统和对话系统等人工智能设备中。解决该任务的关键在于对复杂的指代表达式进行充分的语义理解;然后利用语义信息对包含多个对象的图像进行关系推理以及对象筛选,最终在图像中唯一地定位目标对象。本文从计算机视觉的视角出发对REC任务进行了综述,首先介绍该任务的通用处理流程。然后,重点对REC领域现有方法进行分类总结,根据视觉数据表征粒度的不同,划分为基于区域卷积粒度视觉表征、基于网格卷积粒度视觉表征以及基于图像块粒度视觉表征的方法;并进一步按照视觉—文本特征融合模块的建模方式进行了更细粒度的归类。此外,本文还介绍了该任务的主流数据集和评估指标。最后,从模型的推理速度、模型的可解释性以及模型对表达式的推理能力3个方面揭示了现有方法面临的挑战,并对REC的发展进行了全面展望。本文希望通过对REC... 相似文献

6.

计算机视觉中的Transformer发展综述

李清格杨小冈卢瑞涛王思宇谢学立张涛《小型微型计算机系统》2023,(4):850-861

Transformer是基于自注意力机制的编码器-解码器架构模型，擅长建立远距离依赖关系，已经成为自然语言处理领域的主流模型.受Transformer在自然语言处理领域中取得巨大成功的启发，近两年一些开创性的工作开始研究如何将Transformer应用于计算机视觉领域，并取得了显著的成果，目前视觉Transformer依然是研究的热点.本文对近年来Transformer在多个视觉任务上的应用与发展进行梳理、分析与总结.首先阐述了视觉Transformer基本结构与实现原理，分析了模型结构的特点与优势，梳理了视觉Transformer的研究进展.其次，介绍了Transformer在高层视觉任务、底层视觉任务和多模态任务上的典型应用模型，并详细对比了在图像分类、检测和分割领域典型视觉Transformer模型的性能指标.最后总结了当前视觉Transformer各类模型存在的问题与难点，并指出未来的发展方向. 相似文献

7.

高层语义分析中的模型蒸馏方法综述

下载免费PDF全文

孙若禹熊红凯《中国图象图形学报》2023,28(4):935-962

相似文献

8.

视觉问答技术研究综述

王虞孙海春《计算机科学与探索》2023,(7):1487-1505

视觉问答（visual question answering,VQA）是融合自然语言处理与计算机视觉技术的图-文跨模态热门任务。该任务以计算机智能识别与检索图像内容并给出准确答案为主要目标,融合应用了目标识别与检测、智能问答、图像属性分类、场景分析等多项技术,能够支撑许多前沿交互式人工智能高层任务,如视觉对话、视觉导航等,具有广泛的应用前景和极高的应用价值。近几年,计算机视觉、自然语言处理及图-文跨模态领域人工智能模型的发展为视觉问答任务的实现提供了许多新的技术和方法。主要对2019—2022年视觉问答领域的主流模型及专业数据集进行总结。首先,依据视觉问答任务实现的模块框架,对关键步骤中的主流技术方法进行综述讨论。其次,按照主流模型采用的技术方法,将该领域内各类模型进行细分,并简要介绍改进重点和局限性。随后,综述视觉问答常用数据集与评价指标,对几类典型模型性能进行对比阐述。最后,对现阶段视觉问答领域内亟待解决的问题进行重点阐述,并对视觉问答领域未来应用及技术发展进行预测和展望。相似文献

9.

基于异质信息网络的推荐模型

陈可迪赵雷陈心怡施科男《计算机系统应用》2022,31(8):361-368

为了解决推荐系统的冷启动和稀疏性问题, 本文提出了一种基于异质信息网络的推荐模型. 传统的推荐方法无法在知识图谱表示学习中融入隐含的路径信息, 这样使得知识推荐系统性能较为一般. 本文提出的模型在异质信息网络中设置元路径, 通过图神经网络融入到知识图谱表示学习中. 再利用注意力网络连接推荐任务和知识图谱表示任务, 其可以学习两个任务之中潜在的特征, 并且能够增强推荐系统中被推荐项和知识图谱中实体的相互作用. 最后在推荐任务中进行用户点击率预测. 模型在公开数据集Book-Crossing和通过DBLP数据集构建的图谱上进行了实验. 最后结果表明, 模型在AUC, 召回率和F1值3个指标上均比其他算法有更好的表现. 相似文献

10.

视觉Transformer识别任务研究综述

下载免费PDF全文

周丽娟毛嘉宁《中国图象图形学报》2023,28(10):2969-3003

Transformer模型在自然语言处理领域取得了很好的效果,同时因其能够更好地连接视觉和语言,也激发了计算机视觉界的极大兴趣。本文总结了视觉Transformer处理多种识别任务的百余种代表性方法,并对比分析了不同任务内的模型表现,在此基础上总结了每类任务模型的优点、不足以及面临的挑战。根据识别粒度的不同,分别着眼于诸如图像分类、视频分类的基于全局识别的方法,以及目标检测、视觉分割的基于局部识别的方法。考虑到现有方法在3种具体识别任务的广泛流行,总结了在人脸识别、动作识别和姿态估计中的方法。同时,也总结了可用于多种视觉任务或领域无关的通用方法的研究现状。基于Transformer的模型实现了许多端到端的方法,并不断追求准确率与计算成本的平衡。全局识别任务下的Transformer模型对补丁序列切分和标记特征表示进行了探索,局部识别任务下的Transformer模型因能够更好地捕获全局信息而取得了较好的表现。在人脸识别和动作识别方面,注意力机制减少了特征表示的误差,可以处理丰富多样的特征。Transformer可以解决姿态估计中特征错位的问题,有利于改善基于回归的方法性能,还减少了三维估计时深度映射所产生的歧义。大量探索表明视觉Transformer在识别任务中的有效性,并且在特征表示或网络结构等方面的改进有利于提升性能。相似文献

11.

基于常识的亲属关系推理模型

靳小龙魏旺强《计算机工程与应用》2001,37(17):83-85,114

常识知识的研究与发展得到了人工智能界的很大重视。文章建立了一个基于常识的人物亲属关系推理模型,研究了亲属关系常识以及人物信息的表示与存储。此外,对实际所要解决的问题进行了总结。相似文献

12.

一种C++过程的可视化设计方法 总被引：2，自引：2，他引：0

刘建宾郝克刚《计算机工程与应用》2001,37(15):154-156

文章提出一种支持C＋＋语言的可视化过程设计方法。这种设计方法由图形化的过程表示方法－C＋＋过程蓝图以及基于C＋＋过程蓝图的设计过程两部分内容组成。C＋＋过程蓝图支持逻辑和实现两个层次的程序抽象表示,是一种简单实用、容易理解、结构良好的可视化过程设计工具。文中给出C＋＋过程蓝图的形式化模型,抽象逻辑结构图的图形表示方法,以及C＋＋过程蓝图设计的基本过程。相似文献

13.

基于激光视觉检测的焊缝自动跟踪系统研究

贺红林雷修才龚烨飞赵灿《控制工程》2013,20(5):869-872

旨在提高焊缝跟踪精度和焊接质量,提出一种基于激光检测自动焊缝跟踪系统。该系统由激光视觉部件、控制器、步进电机和十字滑架组成。当系统工作时,由激光视觉部件检测焊缝的当前位置与目标位置之间的偏差,控制器基于该偏差确定纠偏量,步进电机驱动十字滑架以纠正焊枪横向与纵向位置偏差。搭建出系统物理样机,进行了焊缝跟踪试验。试验结果表明,基于激光视觉检测的焊缝跟踪误差可控制在0. 5 mm 之内,其在精密焊接领域具有较大应用前景。相似文献

14.

科学平台实验系统的原理与设计

林素珍李春文陈虎《计算机工程与应用》2001,37(11):105-107

科学平台（Science Platform）是以提供有助于科学领域内知识创新、综合、回顾和传播的知识载体为目的,充分利用了因特网载体的独特优点而实现的一个系统。而科学平台实验系统则是作者正在研制的、能够示范性地实现平台的各种主要功能的系统,它以网站的形式,为科学界提供科研服务、为普通读者提供知识。文章论述了科学平台实验系统的知识浏览、知识交流、知识检索、新成果公布等功能及其实现原理与设计。相似文献

15.

一种引入注意机制的视觉计算模型 总被引：3，自引：0，他引：3

下载免费PDF全文

龙甫荟郑南宁《中国图象图形学报》1998,3(7):592-595

提出了一种基于注意机制的视觉模型，其特点是：将注意过程分为３个层次，分别模拟生物的瞳孔聚焦、眼动和头动；提出一种新的可变结构的非均匀采样映射来模拟生物视网膜特性；强调了数据驱动的ｂｏｔｏｍ－ｕｐ过程与知识驱动的ｔｏｐ－ｄｏｗｎ过程的融合；提出新颖的类似树形的知识表示方法和基于深度优先搜索树的注意点转移控制机制。相似文献

16.

Visual Knowledge Representation and Intelligent Image Segmentation 总被引：1，自引：0，他引：1

下载免费PDF全文

Zheng Nanning Liu Jianqin 《计算机科学技术学报》1992,7(3):219-225

Automatic medical image analysis shows that image segmentation is a crucial task for any practical AI system in this field.On the basis of evaluation of the existing segmentation methods,a new image segmentation method is presented.To seek the perfct solution to knowledge representation in low level machine vision,a new knowledge representation approach--“Notebbok”approach is proposed and the processing of visual knowledge is discussed at all levels.To integrate the computer vision theory with Gestalt psychology and knowledge engineering,a new integrated method for intelligent image segmentation of sonargraphs- “Generalized-pattern guided segmentation”is proposed.With the methods and techniques mentioned above,the medical diagnosis expert system for sonargraphs can be built The work on the preliminary experiments is also introduced. 相似文献

17.

基于语义网络的神经网络系统 总被引：3，自引：0，他引：3

曹绍火《计算机工程与应用》2001,37(11):96-97,118

文章通过分析语义网络知识表示及神经网络研究的各自特点与现状,提出了将基于语义网络的知识表示方法引入神经网络知识处理中的设想,并作了一些初步的探讨。相似文献

18.

一种基于HVS的数字水印算法

刘炎施鹏飞《计算机工程与应用》2001,37(17):133-134,139

数字水印对于版权保护是一种很好的方法。文章根据人类视觉特性（HVS）,提出了一种包含水印嵌入与提取的数字水印算法,并给出了攻击分析。其中,采用图象作为数字水印,具有二维信号可视化的优点。实验表明,该算法对于有损压缩、剪切与噪声叠加等操作具有很好的鲁棒性。相似文献

19.

基于能量守恒的桥式吊车参数辨识研究

路兴龙王良勇《控制工程》2013,20(5):891-895

针对实际桥式吊车系统物理参数不易获得的问题,提出一种基于能量守恒的参数辨识方法。该方法根据能量守恒原理建立辨识回归方程,然后用非负最小二乘法处理辨识实验数据,得到桥式吊车的控制器设计模型。以桥式吊车实验系统为背景,模拟桥式吊车的实际运行特点,进行辨识实验,获得系统的数学模型。在此基础上用LQＲ控制器验证了该方法在桥式吊车实验系统上辨识结果的准确性,证明该辨识方法对桥式吊车的控制有很大帮助。相似文献

20.

Coding, analysis, interpretation, and recognition of facialexpressions

Essa I.A. Pentland A.P. 《IEEE transactions on pattern analysis and machine intelligence》1997,19(7):757-763

We describe a computer vision system for observing facial motion by using an optimal estimation optical flow method coupled with geometric, physical and motion-based dynamic models describing the facial structure. Our method produces a reliable parametric representation of the face's independent muscle action groups, as well as an accurate estimate of facial motion. Previous efforts at analysis of facial expression have been based on the facial action coding system (FACS), a representation developed in order to allow human psychologists to code expression from static pictures. To avoid use of this heuristic coding scheme, we have used our computer vision system to probabilistically characterize facial motion and muscle activation in an experimental population, thus deriving a new, more accurate, representation of human facial expressions that we call FACS+. Finally, we show how this method can be used for coding, analysis, interpretation, and recognition of facial expressions 相似文献