首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
Transformer是基于自注意力机制的编码器-解码器架构模型,擅长建立远距离依赖关系,已经成为自然语言处理领域的主流模型.受Transformer在自然语言处理领域中取得巨大成功的启发,近两年一些开创性的工作开始研究如何将Transformer应用于计算机视觉领域,并取得了显著的成果,目前视觉Transformer依然是研究的热点.本文对近年来Transformer在多个视觉任务上的应用与发展进行梳理、分析与总结.首先阐述了视觉Transformer基本结构与实现原理,分析了模型结构的特点与优势,梳理了视觉Transformer的研究进展.其次,介绍了Transformer在高层视觉任务、底层视觉任务和多模态任务上的典型应用模型,并详细对比了在图像分类、检测和分割领域典型视觉Transformer模型的性能指标.最后总结了当前视觉Transformer各类模型存在的问题与难点,并指出未来的发展方向.  相似文献   

2.
城市轨道交通系统主要由弓/网系统、轨道线路、车辆、车站等组成,传统的人工巡检等方法检测效率低、劳动强度大、自动化和智能化程度不高,给城市轨道交通的运营保障和进一步健康发展带来了巨大的挑战.机器视觉作为一种重要的检测手段,在城市轨道交通系统状态检测领域得到了广泛的应用.鉴于此,针对机器视觉在城市轨道交通系统安全状态检测中的研究和应用进行综述.首先,简要介绍城市轨道交通的基本概念和快速发展所面临的挑战与机遇.然后,详细介绍机器视觉技术在城市轨道交通各子系统安全状态检测中的研究与应用情况;针对弓/网系统状态检测问题,分别重点介绍机器视觉在受电弓磨耗检测、受电弓包络线等其他病害检测、接触网几何参数检测、接触网磨耗检测以及接触网悬挂病害检测中的国内外研究现状;在轨道线路安全状态检测方面,分别介绍机器视觉在扣件安全状态检测和钢轨表面病害检测中的应用与研究现状;从不同检测项点角度详细介绍机器视觉在车辆状态检测中的应用与研究进展;梳理和总结机器视觉在车站电扶梯安全监控和站台安全监控的异常行为检测中的具体应用和研究;并重点介绍机器视觉在轨道交通司机行为监测中的具体应用和背景技术.最后,对机器视觉技术应用于城市轨道交通系统状态检测领域的未来进行展望.  相似文献   

3.
神经形态视觉传感器的研究进展及应用综述   总被引:1,自引:0,他引:1  
李家宁  田永鸿 《计算机学报》2021,44(6):1258-1286
神经形态视觉传感器具有高时域分辨率、高动态范围、低数据冗余和低功耗等优势,近年来在自动驾驶、无人机视觉导航、工业检测及视觉监控等领域(尤其在涉及高速运动和极端光照等条件下)产生了巨大的应用前景.神经形态视觉是一个包含硬件、软件、生物神经模型等的视觉感知系统,终极目标是模拟生物视觉感知结构与机理,以硅视网膜达到、扩展或超越人类智能.作为神经形态工程的重要分支,神经形态视觉是计算神经科学与计算机视觉领域的交叉学科与研究热点.本文从生物视觉采样模型、神经形态视觉传感器的采样模型及类型、视觉信号处理与特征表达、视觉任务应用等视角进行了系统性地回顾与综述,展望了该领域未来研究的技术挑战与可能发展方向,同时探讨了其对未来机器视觉和人工智能领域的潜在影响.  相似文献   

4.
深度学习在目标视觉检测中的应用进展与展望   总被引:2,自引:0,他引:2  
张慧  王坤峰  王飞跃 《自动化学报》2017,43(8):1289-1305
目标视觉检测是计算机视觉领域的一个重要问题,在视频监控、自主驾驶、人机交互等方面具有重要的研究意义和应用价值.近年来,深度学习在图像分类研究中取得了突破性进展,也带动着目标视觉检测取得突飞猛进的发展.本文综述了深度学习在目标视觉检测中的应用进展与展望.首先对目标视觉检测的基本流程进行总结,并介绍了目标视觉检测研究常用的公共数据集;然后重点介绍了目前发展迅猛的深度学习方法在目标视觉检测中的最新应用进展;最后讨论了深度学习方法应用于目标视觉检测时存在的困难和挑战,并对今后的发展趋势进行展望.  相似文献   

5.
主动轮廓模型(snake模型)融合了图像底层信息与外部高层信息,在目标跟踪边缘检测图像分割和逆向工程中得到了广泛应用,是目前计算机视觉领域活跃度较高的研究方向。传统snake模型和部分改进的主动轮廓模型都具有明确的力学意义。首先对传统snake模型以及采用B样条参数化表示的B-snake模型的力学原理进行了阐述,然后针对传统snake模型的缺陷,从力学角度介绍了几种改进的主动轮廓,并且基于拉格朗日动力学原理对snake模型的驱动过程以及惯性力主动轮廓进行了介绍,最后进行了总结及未来研究工作的展望。  相似文献   

6.
主动轮廓线模型(蛇模型)综述   总被引:80,自引:1,他引:79  
李培华  张田文 《软件学报》2000,11(6):751-757
在传统的计算机视觉领域,严格的各自独立的分层理论有广泛的影响.这种理论认为,底层的视觉任务的完成只能依赖于从图像本身获得的信息.Kass等人对这种模型提出了挑战,于1987年提出了称为Snake的主动轮廓线模型(active contour model).近10多年来,Snake模型在计算机视觉领域得到了广泛应用,取得了许多重要的进展.该文回顾了近10多年来Snake模型的研究、发展及应用情况,并对未来的发展方向进行了展望.  相似文献   

7.
基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。  相似文献   

8.
视觉-语言导航是近年来出现并蓬勃发展的新兴研究方向,是视觉-语言交互前沿领域中的代表性研究任务之一,其目标是根据人类给出的语言指令基于环境视觉感知实现自主导航.首先介绍该任务的研究内容,分析其面临的跨模态语义对齐、语义理解与推理和模型泛化能力增强3个方面的问题与挑战,然后列举了常用的数据集和评价指标;再从模仿学习、强化学习、自监督学习以及其他方法4个方面对该任务的研究进展进行归纳与总结,并对代表性方法的效果进行对比分析;从连续环境导航和高级复杂指令理解与常识推理2个方面论述该任务当前研究的热点趋势;最后对三维空间的视觉-语言导航、模糊导航、环境交互导航等未来发展方向进行讨论与展望.  相似文献   

9.
吕承侃  沈飞  张正涛  张峰 《自动化学报》2022,48(6):1402-1428
图像异常检测是计算机视觉领域的一个热门研究课题, 其目标是在不使用真实异常样本的情况下, 利用现有的正常样本构建模型以检测可能出现的各种异常图像, 在工业外观缺陷检测、医学图像分析、高光谱图像处理等领域有较高的研究意义和应用价值. 本文首先介绍了异常的定义以及常见的异常类型. 然后, 本文根据在模型构建过程中有无神经网络的参与, 将图像异常检测方法分为基于传统方法和基于深度学习两大类型, 并分别对相应的检测方法的设计思路、优点和局限性进行了综述与分析. 其次, 梳理了图像异常检测任务中面临的主要挑战. 最后, 对该领域未来可能的研究方向进行了展望.  相似文献   

10.
指针式仪表自动判读技术是当前机器视觉研究的热点,也是模式识别领域一项重要的研究内容和前沿技术。在对指针式仪表识别技术进行了一般性概述之后,详细介绍了基于机器视觉的指针式仪表自动读数识别技术的基本概念、基本原理和主要研究内容,介绍了该技术在国内外的研究现状,同时重点介绍了图像校正、圆形表盘轮廓检测、指针线检测和角度计算等主要研究内容的最新进展,最后给出了指针式仪表自动读数识别涉及的关键技术和发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号