首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 137 毫秒
1.
移动机器人基于多传感器信息融合的室外场景理解   总被引:1,自引:0,他引:1  
闫飞  庄严  王伟 《控制理论与应用》2011,28(8):1093-1098
本文研究了移动机器人多传感器信息融合技术,提出一种融合激光测距与视觉信息的实时室外场景理解方法.基于三维激光测距数据构建了高程图描述场景地形特征,同时利用条件随机场模型从视觉信息中获取地貌特征,并以高程图中的栅格作为载体,应用投影变换和信息统计方法将激光信息与视觉信息进行有效融合.在此基础上,对融合后的环境模型分别在地形和地貌两个层面进行可通过性评估,从而实现自主移动机器人实时室外场景理解.实验结果和数据分析验证了所提方法的有效性和实用性.  相似文献   

2.
移动机器人长期自主环境适应研究进展和展望   总被引:1,自引:0,他引:1  
真实世界中存在光照、天气、季节及场景结构等复杂环境因素, 这些因素的改变对移动机器人基本行为和任务能力带来巨大挑战.随着机器人与人工智能技术的不断发展, 如何使移动机器人在长期运行中与复杂多变的环境条件相适应是智能机器人领域的研究热点.本文重点从地图构建与动态维护、重定位及场景理解等移动机器人基本行为能力的系统综述入手, 对移动机器人长期自主环境适应的前沿技术与研究方向进行了着重论述与分析.最后对该领域的研究重点和技术发展趋势进行了探讨.  相似文献   

3.
以投影几何学以及双目立体视觉原理为理论基础,对移动机器人的三维重建技术进行研究,对移动机器人漫道过程中所在的兴趣区域的场景进行较为精确的建模.设计了机器人的快速建模方法,利用迭代最近点算法(ICP),完成了多个局部三维场景模型的融合.同时,结合栅格投射理论,完成了对全局三维场景模型的更新.利用栅格模型重建的三维场景,具有环境信息丰富,模型描述精确的特点,可以应用于移动机器人导航领域.  相似文献   

4.
面向复杂场景的人物视觉理解技术能够提升社会智能化协作效率,加速社会治理智能化进程,并在服务人类社会的经济活动、建设智慧城市等方面展现出巨大活力,具有重大的社会效益和经济价值。人物视觉理解技术主要包括实时人物识别、个体行为分析与群体交互理解、人机协同学习、表情与语音情感识别和知识引导下视觉理解等,当环境处于复杂场景中,特别是考虑“人物—行为—场景”整体关联的视觉表达与理解,相关问题的研究更具有挑战性。其中,大规模复杂场景实时人物识别主要集中在人脸检测、人物特征理解以及场景分析等,是复杂场景下人物视觉理解技术的重要研究基础;个体行为分析与群体交互理解主要集中在视频行人重识别、视频动作识别、视频问答和视频对话等,是视觉理解的关键行为组成部分;同时,在个体行为分析和群体交互理解中,形成综合利用知识与先验的机器学习模式,包含视觉问答对话、视觉语言导航两个重点研究方向;情感的识别与合成主要集中在人脸表情识别、语音情感识别与合成以及知识引导下视觉分析等方面,是情感交互的核心技术。本文围绕上述核心关键技术,阐述复杂场景下人物视觉理解领域的研究热点与应用场景,总结国内外相关成果与进展,展望该领域的前沿技术与发展趋势。  相似文献   

5.
许多自然场景图像中都包含丰富的文本,它们对于场景理解有着重要的作用。随着移动互联网技术的飞速发展,许多新的应用场景都需要利用这些文本信息,例如招牌识别和自动驾驶等。因此,自然场景文本的分析与处理也越来越成为计算机视觉领域的研究热点之一,该任务主要包括文本检测与识别。传统的文本检测和识别方法依赖于人工设计的特征和规则,且模型设计复杂、效率低、泛化性能差。随着深度学习的发展,自然场景文本检测、自然场景文本识别以及端到端的自然场景文本检测与识别都取得了突破性的进展,其性能和效率都得到了显著提高。本文介绍了该领域相关的研究背景,对基于深度学习的自然场景文本检测、识别以及端到端自然场景文本检测与识别的方法进行整理分类、归纳和总结,阐述了各类方法的基本思想和优缺点。并针对隶属于不同类别下的方法,进一步论述和分析这些主要模型的算法流程、适用场景和技术发展路线。此外,列举说明了部分主流公开数据集,对比了各个模型方法在代表性数据集上的性能情况。最后总结了目前不同场景数据下的自然场景文本检测、识别及端到端自然场景文本检测与识别算法的局限性以及未来的挑战和发展趋势。  相似文献   

6.
计算机视觉在室外移动机器人中的应用   总被引:8,自引:0,他引:8  
胡斌  何克忠 《自动化学报》2006,32(5):774-784
近些年来,室外移动机器人(智能车)及其相关技术的研究越来越受到重视.计算机视觉技术作为移动机器人感受外界环境的最主要手段,也在很多相关领域取得了长足的发展.本文分别从道路检测、车辆检测、行人检测三个室外移动机器人系统中最主要的视觉检测方面对目前的发展做了一个概述, 并给出了今后的发展方向.  相似文献   

7.
基于增强转移网络(ATN)的室外移动机器人道路图像理解   总被引:2,自引:0,他引:2  
道路图像理解是室外移动机器人视觉导航自主驾驶研究中的一个关键技术 ,由于基于视觉导航的室外移动机器人自主驾驶时 ,对实时性和鲁棒性要求很高 ,因此 ,为了满足室外移动机器人自主驾驶的实时性和鲁棒性要求 ,将人工智能研究句法分析中的一个形式体系——增强转移网络 (ATN )成功地应用于室外移动机器人的道路理解中 ,进而提出了基于 ATN的室外移动机器人道路图像理解算法 ,该算法在统一的 ATN构建思想指导下 ,针对不同的道路情况 ,不仅可以灵活地构建出不同的道理理解 ATN网络 ,还可达到本质上的统一及应用上的灵活。经实验检验 ,该算法在满足系统要求的鲁棒性条件下 ,具有非常高的实时性 ,即能充分地满足自主移动机器人高速自主导航的需要  相似文献   

8.
李林  练金  吴跃  叶茂 《计算机应用》2014,34(10):2913-2921
近年来,计算机图像理解技术在智能交通、卫星遥感、机器视觉、医疗图像分析、网络图像搜索等多个领域得到广泛应用。图像整体场景理解作为其延伸,其复杂性和综合性远高于基本图像理解任务。针对这一特点,从图像理解基本框架、图像整体场景理解研究价值和意义、典型模型等多方面进行了归纳与分析,重点介绍了四种代表性的整体场景理解模型,并详细比较了模型架构。最后指出了目前图像整体场景理解研究不足以及未来发展方向,为该领域的进一步研究提供参考。  相似文献   

9.
场景理解是机器人在多样化环境中自主执行任务的前提,而场景发现是场景理解的一个重要内容.由于具体场景在空间和时间上存在连续性,可以假定移动机器人在某一段时间内处于同一场景,并且属于同一场景的图像序列的视觉观感是相似的,因此提出无需先验知识的增量式室外场景发现,通过分层词袋模型建立图像和场景的联系,使得场景发现过程更加类似人类认知模式.对于机器人实时获取的每一副图像,首先将其分块,然后利用动态聚类算法增量式地得到相应的低层词典,并据此词典提取高层词袋模型特征,接下来,再用另一动态聚类算法增量式地完成场景发现,从而判断当前图像属于一个已经历场景,或未经历场景,直到发现新场景.实验结果证明,该方法能够在没有先验知识的情况下有效完成自主场景发现.  相似文献   

10.
张康  安泊舟  李捷  袁夏  赵春霞 《软件学报》2023,34(1):444-462
近年来随着计算机视觉领域的不断发展,三维场景的语义分割和形状补全受到学术界和工业界的广泛关注.其中,语义场景补全是这一领域的新兴研究,该研究以同时预测三维场景的空间布局和语义标签为目标,在近几年得到快速发展.对近些年该领域提出的基于RGB-D图像的方法进行了分类和总结.根据有无使用深度学习将语义场景补全方法划分为传统方法和基于深度学习的方法两大类.其中,对于基于深度学习的方法,根据输入数据类型将其划分为基于单一深度图像的方法和基于彩色图像联合深度图像的方法.在对已有方法分类和概述的基础上,对语义场景补全任务所使用的相关数据集进行了整理,并分析了现有方法的实验结果.最后,总结了该领域面临的挑战和发展前景.  相似文献   

11.
战场情景模拟在武器装备研制和军事训练中有重要意义。本文介绍了战场情景模拟的特点以及对多媒体相关技术的需求。详细叙述我们在SGIONYX/RE2实时多媒体环境下实现的战场情景模拟系统,并对应用开发中的有关技术问题作了分析,给出了解决方法。  相似文献   

12.
基于VR+GIS技术的场景开发平台设计与实现   总被引:1,自引:0,他引:1  
数字化场景设计与开发得到各界重视。本文介绍基于虚拟现实与地理信息系统的小型场景开发平台的设计思想、开发技术、功能特点及系统实施与应用。Mini VR-GIS系统展示了良好的应用前景。  相似文献   

13.
应用计算机技术当中的虚拟模拟技术,对于当前各领域实现虚拟情景三维模拟训练已成为可能。本文研究当前技术环境下,利用Unity3D模拟平台构造虚拟情景训练系统的开发与设计。从三维模拟训练系统的关键技术研究入手,以三维场景优化、物理碰撞逻辑检测、动态加载场景以及网络通信作为开发的重点,设计出较为先进和逼真的虚拟情境下三维模拟训练系统。并以消防部门作为系统应用的检测部门,检测结果表示此系统可以很好的表现出现场场景的模拟程度以及逻辑,对于加强消防部门的训练技术和应用效果有很大优势。  相似文献   

14.
Creator/Vega Prime在船舶动力装置视景仿真系统中的应用   总被引:1,自引:0,他引:1  
介绍了目前流行的视景仿真软件Creator和VegaPrime及其开发流程。介绍了进行三维建模过程中的纹理贴图技术和层次细节(LOD)技术等,利用VegaPrime实现了船舶虚拟机舱的漫游方法以及漫游过程中的碰撞检测技术等。开发出船舶机舱虚拟现实仿真系统,建立了逼真的船舶机舱虚拟场景,实现了人在虚拟机舱环境中的漫游,以及对虚拟场景中主要运动部件进行驱动。  相似文献   

15.
图像场景分类中视觉词包模型方法综述   总被引:1,自引:1,他引:0       下载免费PDF全文
目的关于图像场景分类中视觉词包模型方法的综述性文章在国内外杂志上还少有报导,为了使国内外同行对图像场景分类中的视觉词包模型方法有一个较为全面的了解,对这些研究工作进行了系统总结。方法在参考国内外大量文献的基础上,对现有图像场景分类(主要指针对单一图像场景的分类)中出现的各种视觉词包模型方法从低层特征的选择与局部图像块特征的生成、视觉词典的构建、视觉词包特征的直方图表示、视觉单词优化等多方面加以总结和比较。结果回顾了视觉词包模型的发展历程,对目前存在的多种视觉词包模型进行了归纳,比较常见方法各自的优缺点,总结了视觉词包模型性能评价方法,并对目前常用的标准场景库进行汇总,同时给出了各自所达到的最高精度。结论图像场景分类中视觉词包模型方法的研究作为计算机视觉领域方兴未艾的热点研究领域,在国内外研究中取得了不少进展,在计算机视觉领域的研究也不再局限于直接应用模型描述图像内容,而是更多地考虑图像与文本的差异。虽然视觉词包模型在图像场景分类的应用中还存在很多亟需解决的问题,但是这丝毫不能掩盖其研究的重要意义。  相似文献   

16.
随着无线通信和室内定位技术的发展,室内移动对象索引技术在基于位置的服务等方面越来越重要.室内场景结构复杂且形式多样,现有的室内移动对象索引技术的研究都是将室内实体抽象为单元,将移动对象抽象为查询点,不区分它们之间的语义,也不考虑对象和单元之间的访问权限.针对这一问题,研究了一种基于语义的室内移动对象索引方法,并提出了基于语义和访问权限的轨迹推荐查询算法.另外,将室内场景、移动对象的语义和访问权限信息进行了形式化定义,提出了一个新的室内语义模型.通过大量实验,从多个方面与现有室内移动对象索引方法进行对比分析,验证了所提索引的高效性和鲁棒性.  相似文献   

17.
虚拟内窥镜系统研究进展   总被引:2,自引:0,他引:2  
简述了虚拟内窥镜系统的特点和发展经历,详细论述了数据采集、图像的组织分割、三维重建、路径规划、实时绘制等处理过程以及基于面绘制和体绘制的主要技术组成,介绍了当前的现状,同时指出了在组织分割、路径规划、实时处理、场景绘制、硬件平台等方面存在的主要问题。  相似文献   

18.
一种基于均值漂移的视频场景检测方法   总被引:1,自引:1,他引:0       下载免费PDF全文
提出了一种高效的视频场景检测方法。首先基于均值漂移,在滑动镜头窗内对各镜头聚类,并获得相应的聚类中心,然后根据电影视频场景的发展模式,计算两个镜头类之间的时序距离,接着基于时空关系进行场景检测,并且由相应的聚类中心获得场景关键帧,最后对场景过分割进行后续处理。实验证实该方法能快速聚类,并且有效地检测出场景和场景关键帧。  相似文献   

19.
对文字检测和识别技术进行了全面的介绍。介绍了自然场景文字识别技术的研究背景、应用领域、技术难点等;介绍了场景文字识别的预处理技术及流程,介绍了近年来出现的基于深度学习的通用检测网络、维吾尔文和中英文的深度学习文字检测网络、场景文字识别深度学习网络、端到端场景文字检测与识别深度学习网络,并总结了各类网络的结构特点、优势、局限性、应用场景以及实现成本,接着进行了综合分析;最后介绍了公开数据集,并探讨了场景文字识别技术的发展趋势及可能的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号